转录组代谢组联合分析(完整百科)
转录组代谢组联合分析_多组学整合分析_代谢通路调控机制研究
转录组代谢组联合分析,多组学分析,代谢组学,转录组测序,联合分析,KEGG通路分析,代谢调控网络,生物标志物,基因代谢关联,差异基因差异代谢物
转录组代谢组联合分析专栏提供完整的多组学整合分析方法、流程、工具与案例,聚焦基因表达与代谢物丰度的关联机制,助力植物抗逆、疾病机制、药物研发、品质调控等研究,从因果层面深度解析生物分子调控网络。
转录组代谢组联合分析(Transcriptome and Metabolome Integration Analysis)是将基因表达水平(转录组,“因”)与小分子代谢物丰度(代谢组,“果”)进行系统关联的多组学技术,通过“上游调控—下游表型”的双向验证,完整揭示生物过程的分子调控网络与因果机制,是当前生命科学、医学、农学领域最主流的联合组学方案。
一、核心原理:因→果的分子链条
1. 两组学的互补关系
转录组(RNAseq):检测样本中所有mRNA的表达量,反映潜在的调控能力(基因是否转录、表达高低),属于上游调控层面。
代谢组(LCMS/GCMS):检测样本中所有小分子代谢物(<1500Da)的丰度,反映真实的生理表型(物质积累、能量状态、应激响应),属于下游终端层面。
2. 联合逻辑
基因表达变化 → 酶活性改变 → 代谢通路流量变化 → 代谢物丰度波动 → 表型差异
单看转录组:假阳性高(转录≠翻译≠酶活),无法确定是否真正影响表型;
单看代谢组:知其然不知其所以然,无法追溯代谢波动的上游调控基因;
联合分析:因果互证、双向锁定,从海量数据中精准定位关键基因 + 关键代谢物 + 核心通路。
二、标准分析流程(6步)
1. 样本与数据准备
同批次、同来源样本(生物学重复≥3);
转录组:差异表达基因(DEGs,FDR<0.05, |log2FC|≥1);
代谢组:差异代谢物(DMs,VIP>1, P<0.05)。
2. 数据预处理
标准化、去批次效应、缺失值填充;
样本对齐(按样本ID匹配两组学数据)。
3. 关联分析方法(核心)
(1)相关性分析(最常用)
Pearson/Spearman相关:计算每个差异基因 ↔ 每个差异代谢物的相关系数(R)与显著性(P);
筛选:|R|>0.8、P<0.01的强显著关联对;
可视化:相关性热图、九象限图、基因代谢物互作网络。
(2)KEGG通路联合富集(最关键)
将DEGs与DMs同时映射到KEGG通路;
筛选两组学共同显著富集的通路(如类黄酮合成、糖酵解、TCA循环);
通路可视化:通路图高亮、气泡图、桑基图,直观展示“基因上调→代谢物积累”的级联效应。
(3)多变量统计(高级)
典型相关分析(CCA):多基因 ↔ 多代谢物整体关联;
O2PLS:分离两组学共享与特有变异;
WGCNA:构建基因共表达模块,关联代谢物模块,挖掘协同调控单元。
(4)调控网络构建
整合转录因子(TF)+ 靶基因 + 代谢物;
构建“TF→基因→代谢物→表型”的调控通路。
4. 核心结果解读
1. 九象限图:
第Ⅰ/Ⅶ象限:基因与代谢物趋势一致(正/负相关)→ 高可信因果对;
第Ⅲ/Ⅴ象限:趋势相反 → 存在反馈抑制或其他层面调控(如翻译后修饰)。
2. 联合富集通路:
锁定同时扰动的通路(如逆境下“苯丙烷通路”基因与黄酮类代谢物同步上调)。
3. 关键分子:
Hub基因:关联代谢物最多、Degree最高的基因;
核心代谢物:关联基因最多、表型贡献最大的代谢物。
5. 实验验证
qPCR验证关键基因表达;
代谢物靶向定量;
基因过表达/敲除 → 观测代谢物变化。
6. 生物学机制阐释
完整回答:哪些基因调控哪些代谢物、通过哪些通路、导致什么表型。
三、主流应用领域
1. 植物科学(最广泛)
逆境响应(干旱/盐/低温/病害):锁定抗逆关键基因 + 渗透保护代谢物(脯氨酸、甜菜碱);
品质调控(果实成熟、香气、色素):如番茄成熟中RIN基因 → 乙烯 → 类胡萝卜素通路;
药用植物:挖掘活性成分(生物碱/黄酮)的生物合成基因簇。
2. 医学与疾病研究
疾病机制:癌基因 → 代谢重编程(Warburg效应)→ 肿瘤代谢物;
生物标志物:基因+代谢物联合诊断 panel(比单一组学灵敏度更高);
药物靶点:筛选同时调控基因与代谢通路的候选靶点。
3. 微生物与食品
菌株改造:优化目标产物(氨基酸/抗生素)合成通路;
食品风味:解析风味代谢物(酯/醇/醛)的合成基因。
四、优势与局限
优势
1. 因果闭环:从“因”到“果”完整解析;
2. 降低假阳性:两组学相互验证;
3. 深度挖掘:发现单一组学无法揭示的中间调控环节。
局限
1. 成本较高:需同时测转录组+代谢组;
2. 数据异质性:两组学技术平台不同,整合难度大;
3. 相关性≠因果性:仍需实验验证。
五、常用工具
生信软件:MetaboAnalyst、IPA、OmicsBean、R(WGCNA/ggplot2);
数据库:KEGG、MetaboLights、HMDB、TCGA。
六、典型研究思路(案例)
研究:水稻盐胁迫响应机制
1. 转录组:筛选1200个差异基因(抗逆相关TF、转运蛋白);
2. 代谢组:筛选80个差异代谢物(脯氨酸、柠檬酸、多胺);
3. 联合分析:MYB转录因子与脯氨酸合成基因、脯氨酸代谢物强正相关;
4. 结论:MYB→P5CS基因→脯氨酸积累→水稻耐盐。