随着代谢组学的飞速发展,分析技术的不断更新,鉴定到的代谢物在数据量和种类上也在以“5G”的速度不断累积。面临这样庞大又复杂的代谢物数据,搞清楚他们是什么、发挥什么作用至关重要。今天,小编就给大家介绍两个代谢组学常见的代谢组学数据库—Pubchem和KEGG,并手把手教大家如何利用这些数据库认识我们的代谢物。
Pubchem(https://pubchem.ncbi.nlm.nih.gov/),它是NCBI下的一个大型的、综合性的化合物数据库,目前收录了1亿多种化合物信息,支持名称、缩写、化学式、系统命名等多种方式检索,其结果包含了化合物的各种命名、相关联的数据库信息、结构、分类、理化性质、文献、质谱图等多种信息。其中页面开头的摘要部分可快速了解到该物质的特性、生物功能等信息,根据提供的文献信息可帮助我们了解目前的研究情况。今天小编以“癸酸”为例教大家如何快速了解一个陌生的代谢组化合物。首先我们在主页搜索栏中输入癸酸英文名Decanoic acid,点击搜索后会得到多个结果,置顶的一般为最佳匹配,这里是完全一致的,可以确认就是这个结果。
点击名称可打开详情页面,网页开头的总结部分展示了化合物的ID、化学结构、分子式、同义词、简介等信息,阅读简介可快速了解到它是一种脂肪酸,具有抗菌、消炎等作用,是人体和植物中都存在的代谢物。此外右侧导航条列出了多种信息方便快速跳转。
接下来,我们可能想找到这个化合物对应的KEGG注释信息,这里介绍两种快速简单的方法:一种是点击右侧导航栏的Names and Identifiers(一般是第二项),在跳转地方找到Depositor-Supplied Synonyms(可使用Ctrl+F输入关键词搜索)同义词列表,了解KEGG数据库的熟手可以一眼找到对应的KEGG ID为C01571。
不能快速定义上述方法中的KEGG ID的也没关系,我们可以直接在页面搜索关键词“KEGG”,很快就找到了(下图):
点击上述找到的链接(上图箭头)就看到其ID为C01571。
对于想找其他数据库的信息,也可采取上述的方法。
前文提到的KEGG(https://www.genome.jp/kegg/compound/)数据库相信大家都不陌生,它是日本京都大学和东京大学联合开发的数据库。它有一个化合物库,记录了与通路相关的化合物,其化合物ID以C开头,百迈客的分析结果提供了这个信息。这里我们将上述得到的C01571进行检索:
点击结果(上图箭头)就可以看到具体代谢物的信息,表格中展示了名称、分子式、结构、化学反应、通路、酶等多种信息,查看通路信息可知道其参与了脂肪酸合成,点击通路map00061可跳转查看其在通路图中的具体位置。
如果做了其他组学分析,如转录组分析,可将差异基因所富集的通路、代谢富集的通路及相关联的上下游通路联合起来推测影响代谢物的基因,有助于基因功能的研究哦!
通过前面的检索页面我们会发现相同的代谢物在不同数据库的ID不一样,不要慌,小编给大家推荐一个好用的ID转换网站:http://cts.fiehnlab.ucdavis.edu/batch。这个网站支持多种数据库,而且可以批量哦!。以C01571(类型为KEGG)为例,查询其CAS和HMDB信息,见下图:
点击covert可得到转换的信息,还可下载列表保存。真是方便又实用!
好啦~小编的入门介绍就到这了。通过这些数据库的简单搜索就可让我们大致了解代谢物的基本信息和生物功能,还等什么,赶紧动起手来了解你身边陌生的代谢物吧!