未知代谢物鉴定
代谢组学一般根据以下四个维度对代谢物鉴定的可信度进行划分:可靠的鉴定得到的化合物(1级),通过假定注释得到的化合物(2级),通过假定注释对化合物类别进行鉴定(3级)和未知化合物(4级)。1级鉴定需要将目标代谢物的两个或多个正交特性(如保留时间、m/z和碎片质谱)与在相同分析条件下观察到的真实化学标准品的相同特性进行比较。推定(第2级或第3级)注释基本上仅依赖于一个或两个特性,且通常基于对不同实验室收集的以及不同分析方法获得的数据的比较,而不是在相同分析条件下与真正的化学标准品的直接比较。
未知代谢物指可以反复检测到的但其化学身份尚未确定的小分子。这些化合物虽然尚未被鉴定和分类,但在代谢组学实验中仍可根据光谱数据进行区分和定量。在LC-MS实验中,一个未知化合物将由唯一的保留时间、一个或多个质量或一个特定的初级离子碎片模式定义。在NMR实验中,一个未知化合物将由化学位移的模式定义。未知物可能代表先前没有被识别的小分子,例如代谢的次级产物或罕见的外源性物质,或者它们可能由已建立的途径构成分子但无法分配到现有的NMR参考谱库或MS碎裂模式。
未知化合物的鉴定非常耗时且成本高昂,通常需要进行制备规模的分离以进行NMR研究,或大量的化学合成才能使用MS/MS进行结构比较。因此,大多数报告都集中于检测具有可用的真实商业标准品或至少存在于代谢物数据库中的代谢物,即分类为1级,2级和3级的代谢物。由于许多代谢物固有的不稳定性和需求的缺乏,仅有数千种商业分析标准品可用。然而,这些标准品和数据库中存在的代谢物仅占内源性代谢物很小的一部分。因此,对于代谢组学研究来说,有效的方法来排序、研究和最终鉴定非特征代谢物是非常重要的。未知代谢物的成功鉴定将对生物标志物的发现和组学研究产生重大影响。
未知代谢物鉴定
为了鉴定代谢组学样品中的未知化合物,应区分不同类别的代谢物,具有相同可分辨公称质量(nominal mass)的,具有相同可分辨公称质量但分子式和同位素质量不同的,相同可分辨公称质量和同位素质量但化学结构不同的,都应该对其进行区分。例如,亮氨酸和异亮氨酸是结构不同的异构体,但是可分辨公称质量和同位素质量相同。此外,由于单一代谢物可以在质谱仪中检测到不同的衍生物种,所以正确地将不同的衍生物种分配给母体代谢物也是很重要的。例如,在氨基酸分析中,三甲基硅烷化(TMS)与氨基酸发生化学衍生反应会生成含有1、2或3个TMS基团的氨基酸,这些氨基酸都应属于同一母体氨基酸。
百泰派克生物科技结合NMR,LC-MS/MS和生物信息学分析法,提供基于质谱的识别未知代谢物的分析服务,可以准确鉴定复杂生物样品中的代谢物。百泰派克生物科技不断开发工具和数据库,期望能够实现以自动化的方式对所有代谢物进行真实和完整的鉴定。欢迎咨询!
外源性代谢物分析服务
外源性代谢物指外来的化学物质,可能是有毒的也可能是无害的。这些外源性代谢物不仅包括药物,还包括膳食补充剂、食品添加剂和环境污染物。当外源性代谢物极大地破坏内源性化合物的代谢和运输进入体内时,就可能对人体有害。外源性代谢物可以通过体内代谢酶代谢直接被代谢。研究外源性代谢物在人体中如何发生代谢,有助于我们加快药物发现和毒理学的研究。在药物发现中,了解药物的代谢物有助于对药物作用机理的研究。此外,代谢会引起不良的副作用,因此了解各种化学物质的代谢在毒理学领域也很很重要。代谢组学是对小分子的全面分析,是系统地分析内源性代谢物的理想工具。代谢组学在异生物研究中有许多应用,如对乙酰氨基(APAP)代谢,环磷酰胺(CP)和异环磷酰胺(IF)代谢。
环磷酰胺的代谢反应
百泰派克生物科技依托先进的分析平台和专业的分析人员及技术人员,提供外源性代谢物分析、代谢物筛选以及外源性代谢物/代谢物浓度监测服务。我们拥有针对外源性代谢物代谢组学的不同高通量分析技术,如超高效液相色谱与电喷雾电离四极杆飞行时间质谱(UPLC-ESI-QTOFMS)、气相色谱质谱(GC-MS)和核磁共振(NMR)等。针对后续分析,我们提供多元数据分析,包括但不限于:主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)、潜在结构的正交投影判别分析(OPLS-DA)。
代谢通量分析服务
代谢通量分析(metabolic flux analysis,MFA)是一种重要的分析技术,可用于检查生物系统中代谢物的产生和消耗速率。在系统代谢工程中,MFA可用于了解特定条件下的细胞生理,并在遗传或环境扰动后预测其代谢能力。MFA也可用于阐明细胞机制。通过使用稳定同位素(如2H,13C和15N)标记,MFA可以通过观察同位素标记沿代谢途径的位置来鉴定和定量评估代谢途径的代谢作用。2H和13C NMR方法以及质谱方法已被用于代谢通量分析。串联质谱法作为一项新技术用于代谢通量分析,有助于提供用于复杂生物系统中代谢通量的高分辨率定量。
代谢通量分析服务
百泰派克生物科技的代谢通量分析平台,可用于确定控制结构和代谢途径调控网络的分析,该分析平台广泛适用于可通过动力学模型描述的任何代谢系统。
百泰派克生物科技提供代谢通量分析服务,帮助加速您的研究,分析服务一般流程:
1. 实验设计:根据您的研究对象和研究目的提供定制化实验设计。
2. 样品分析:我们可以提供代谢组通量的多种分析,例如葡萄糖代谢通量、谷氨酰胺通量、三羧酸循环(TCA循环)代谢通量等。
3. 数据分析:百泰派克代谢组学分析可提供质谱原始数据处理,对质谱数据进行分析,实现数据量化及结果解读结果
百泰派克生物科技基于高稳定性、可重复和高灵敏度的分离、表征、鉴定和定量分析系统,提供可靠、快速且经济高效的代谢通量分析服务。
离子组学分析
离子组是指有机体内所有离子的总和,包括所有的金属、类金属和非金属。高通量的元素分析手段的出现,使得同时定量分析多个元素的含量成为可能。生物体的外部环境或自身内部的原因都可能导致其离子组的变化。离子组学是研究生物体内元素组成、分布与累积以及这些元素随生物体生理状况、发育阶段和环境影响等因素发生的变化及其机制。离子组学分析能够对生物体在各种刺激条件下、不同发育阶段和遗传变异等因素所导致的体内各组织和细胞中离子组的变化情况进行定量,从而反映生物体在某个特定状态下的生理特征。
百泰派克生物科技利用高通量的元素分析平台,为广大科研工作者提供离子组学分析服务。
离子组学分析流程
离子组学分析
服务优势
经验丰富的技术人员,可以提供从实验设计、样品检测、数据分析等全套专业服务;
流程明确,减少不必要的样品和时间浪费,交付时间短;
百泰派克生物科技拥有自主生信分析平台,除常规分析外,还可提供高级定制分析;
百泰派克蛋白组、代谢组等多组学分析平台,可进行多组学整合分析,提升文章质量。
代谢组学生物信息学分析
代谢组学研究中使用的高通量方法会产生大量代谢分析相关数据,这就需要采用生物信息学的方法进行处理。百泰派克公司生物信息学分析人员能够对代谢组学数据知识进行深度挖掘和全面分析,从质谱原始数据出发,进行峰对齐、保留时间校正和峰面积提取。代谢物结构鉴定采用精确质量数匹配(<25 ppm)和二级谱图匹配的方式,检索METLIN数据库和HMDB数据库;两组比较时,删除两组组内缺失值均>50%的离子峰;接着对数据进行归一化(采用autoscaling或UV法)。百泰派克应用MetaboAnalysis、SIMCA-P软件进行多维统计分析和单维统计分析,包括PCA、PLS-DA、OPLS-DA、以及通路富集分析,确保提供全面精准的代谢组学分析结果。
代谢组学生物信息学分析
代谢组学数据质量评估
百泰派克采用QC样本谱图比对和主成分分析两种方法,项目实验中的QC样本数据进行分析评价。将分析得到的QC样本UPLC-QTOF-MS总离子流图,进行谱图重叠比较,见下图。结果表明各色谱峰的响应强度和保留时间基本重叠,说明在整个实验过程中仪器误差引起的变异较小。
QC样品在正离子模式下TIC重叠图
主成分分析(PCA)
主成分分析(Principal Component Analysis, PCA)是将原本鉴定到的所有代谢物重新线性组合,形成一组新的综合变量,同时根据所分析的问题从中选取2-3个综合变量,使它们尽可能多地反映原有变量的信息,从而达到降维的目的。同时,对代谢物进行主成分分析还能从总体上反应组间和组内的变异度。总体样本PCA分析采用PCA的方法观察所有各组样本之间的总体分布趋势,找出可能存在的离散样本,综合考虑各种因素(样品数,样品珍贵程度,离散程度)决定离散点的除去与否。所有样本PCA得分图见下图(对样本进行两两分析的PCA得分图)。
图1 主成分分析得分图
百泰派克采用XCMS软件对代谢物离子峰进行提取。将25个实验样本和QC样本提取得到的峰,归一化后进行PCA分析,如图所示QC样本(黑色) 紧密聚集在一起,表明本次试验的仪器分析系统稳定性较好,试验数据稳定可靠,在试验中获得的代谢谱差异能反映样本间自身的生物学差异。
图2 总样品的PCA得分图
PLS-DA/OPLS-DA二维图
不同于主成分分析(PCA)法,Partial Least Squares Discrimination Analysis(PLS-DA)或Orthogonal PLS-DA(OPLS-DA)是一种有监督的判别分析统计方法。该方法运用PLS-DA建立代谢物表达量与样品类别之间的关系模型,来实现对样品类别的预测。分别建立两两分组比较的PLS-DA模型(图1)或OPLS-DA模型(图2),模型得到的参数评价会以表格形式提供。其中R^2X和R^2Y分别表示所建模型对X和Y矩阵的解释率,Q2标示模型的预测能力,理论上R^2、Q^2数值越接近1说明模型越好,越低说明模型的拟合准确性越差,通常情况下,R^2、Q^2高于0.5(50%)较好,高于0.4即可接受,且两者差值不应过大。临床样本由于个体差异大,不可控,尤其大样本时,R^2、Q^2大小为0.2左右亦可。图3则是对PLS-DA模型(c)的检验,直线的斜率大,Q^2的截距为X,说明PLS-DA模型没有过拟合。同时通过计算变量投影重要度(Variable Importance for the Projection, VIP)来衡量各代谢物的表达模式对各组样本分类判别的影响强度和解释能力,从而辅助标志代谢物的筛选(通常以VIP值>1.0作为筛选标准)(图4)。
图1 假手术组和模型组的PLS-DA 得分图
图2 假手术组和模型组的OPLS-DA模型
图 3 PLS-DA模型的排列检验图
图 4 假手术组和模型组的PLS-DA 模型载荷图
注:红框所圈的点为VIP>1的代谢产物
数据归一化分析
数据的完整性和准确性是后续获得具有统计学和生物学意义的分析结果的必要条件。在确保实验设计的合理性和实验数据的准确性的基础上,百泰派克首先对数据的完整性进行检查,对缺失值进行删除或者补充,删除极值,并对数据进行样本间和代谢物间的归一化处理,以确保各样本之间和代谢物之间可平行比较。原始数据中,缺失值超过50%的代谢物将被去除,不参与后续分析;对代谢物的表达量进行对数转换并利用Autoscaling方法(Mean-centered and divided by the standard deviation of each variable)进行归一化处理。下图显示了正离子模式数据经归一化处理前后的分布情况,结果表明数据经归一化处理后基本呈正态分布。
归一化前后的样本
单变量统计分析
在进行两组样本间的差异代谢物分析时,常用的单变量分析方法包括变异倍数分析(Fold Change Analysis, FC Analysis)、T检验,以及综合前两种分析方法的火山图(Volcano Plot)。利用单变量分析可以直观地显示两样本间代谢物变化的显著性,从而帮助我们筛选潜在的标志代谢物(通常以FC>2.0 且 P value<0.05作为筛选标准)。下图显示了数据的火山图,图中枚红色点为FC>2.0且P value<0.05的代谢物,即单变量统计分析筛选的差异代谢物。其余各组的火山图会以附件形式给出。
火山图分析
注:数据结果的火山图(Volcano Plot),绿、红色点为显著性差异代谢物(P value<0.05) 百泰派克选择有多维统计分析筛选标准(VIP>1)和单变量统计分析筛选标准(FC > 2.0且P value<0.05)的代谢物作为具有显著性差异的代谢物(图12)。鉴定出的显著性差异代谢物会以表格形式给出。
显著性差异的代谢物
差异代谢产物聚类分析
为了评价候选代谢物的合理性,同时更全面直观地显示样本之间的关系以及代谢物在不同样本中的表达模式差异,我们利用定性的显著性差异代谢物的表达量对各组样本进行层次聚类(Hierarchical Clustering),从而辅助我们准确地筛选标志代谢物,并对相关代谢过程的改变进行研究。一般来说,当筛选的候选代谢物合理且准确时,同组样本能够通过聚类出现在同一簇( Cluster)中。同时,聚在同一簇内的代谢物具有相似的表达模式,可能在代谢过程中处于较为接近的反应步骤中。下图显示了显著性差异代谢物层次聚类结果。
图 1显著性差异代谢物层次聚类结果
KEGG差异代谢产物通路分析
百泰派克将得到的差异代谢物使用MBRole进行代谢通路富集,使用KEGG数据库作为背景,进行相关通路分析。选取同物种的所有代谢物作为背景,分析 P value<0.05的代谢通路。图1和2为我们可提供的两种代谢通路图,富集的代谢通路以及相关T检验分析结果会以表格的形式给出。
图1 差异代谢物通路图
图2 代谢物通路图