手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

#软件工具#KEGG子通路拆分流程

时间:2024-10-13 12:27:50

KEGG通路是在功能分析中非常有效的富集方法,通过富集分析,我们可以有效识别出和目的基因(interest gene)显著相关的生物学功能。常用的富集手段有超几何分布,fisher精确检验,二项分布等等。例如DAVID软件就是采用校正的Fisher exact test算法。然而这种通路富集分析的方法存在一定的局限性,那就是获得的结果只能是一条完整的大通路,如代谢通路或其他调控通路,但是通过观察,我们发现在每条通路中仍可进一步分为多个小的通路,并参与调控某些特定的功能,我们称之为——子通路。

#软件工具#KEGG子通路拆分流程

分析流程

1、导入数据导入数据为基因列表形式,即由用户提供需要进行富集的基因列表,基因为gene symbol形式,格式如图所有的通路XML格式分析文件已从KEGG通路数据库下载,作为底层分析数据进行调用。命令行操作界面如下用户输入包含基因列表的文件名,筛选显著子通路的阈值,以及计算显著性的算法。

#软件工具#KEGG子通路拆分流程
#软件工具#KEGG子通路拆分流程

2、 ID转换由于KEGG数据库使用的是自己的ID,通路中包括多种元素,如‘hsa’开头的代表蛋白质,‘cpd’开头的代表化合物等等。在通路XML格式文件中,所有的通路元素都被标记为KEGG的ID,如下所示第一列数字代表元素ID,第二列为对应的基因或化合物信息,有些ID可能对应多个基因。在富集过程中我们主要关注的是蛋白和基因,所以在拆分子通路的过程中,我们过滤掉化合物等非基因元素,最后将所有的元素ID转换成gene symbol。所有的通路内基因编号,ID,symbol等信息均来自KEGG数据库主页下载获得。

#软件工具#KEGG子通路拆分流程

3、 拆分子通路拆分过程包括以下两部分:第一步,我们通过正则表达式,从XML通路文件中提取所有的基因互作对,即对应着通路中通过边连接的两个基因,他们之间的舍膺雕沆边可能代表激活,抑制,磷酸化等,这些具体的互作类型不在我们考虑范围内,我们只想知道两个基因是否有互作关系。并且最重要的一点,从XML文件获取的互作对信息是有向互作,即它们之间的边代表了方向性,这保证了我们在后面从根节点向叶子节点grow的过程可以有向的进行。第二步,收集所有存在互作的非孤立基因,获得通路内的基因列表,对每一个基因进行迭代过程。在每一次迭代中,我们都假设这个基因为根节点,将所有与之互作的基因作为他的叶子节点,以此类推,直到获得最末端的叶子,迭代终止。这样我们就获得了一条子通路。

4、 合并子通路在拆分子通路过程中,由于每个基因节点都被作为根节点进行了一次迭代过程,所以会出现一种情况,那就是一条子通路的根节点很可能是另一条子通路的叶子节点,两条子通路具有重复性。举例来说就是一条子通路是从树干到叶子,而另一条子通路是这条树干上的一条树枝。用图来说明就是下面的情况如图,在由ABC构成的通路中,我们可以拆分得到下面三个子通路,分别是ABC, AC, BC。但是BC这条子通路其实是ABC的一部分,所以我们要将这样的子通路进行合并,最后我们期望得到的结果是1. ABC 2. AC。

#软件工具#KEGG子通路拆分流程

5、显著性计算我们从一条KEGG通路中获得了X条子通路,但是并不是每一条子通路都和我们的interest gen髫潋啜缅e显著相关,有些子通路中甚至不包含任何interest gene。为了识别出被interest gene显著富集到的重要子通路,这里我们采用超几何分布的算法。对于一个KEGG通路,我们计算通路中完整基因作为背景数据,对于M个interest gene,我们计算在一条由N个基因构成的子通路中,至少有K个基因属于interest gene的概率。输出结果如下用户可根据右侧显著性P值筛选重要的子通路,若interest gene显著富集到某一大通路,则这些显著的子通路则提示了interest gene具体的生物活动和作用机制。

#软件工具#KEGG子通路拆分流程

6、 FDR校正所有经过超几何分布或Fisher精确检验计算的子通路显著性P值均经过BH多重检验法进行校正,校正前和校正后的P值信息均保存在结果文件‘pathID_subpath_sig.txt’文件。由于对所有KEGG通路进行拆分和子通路显著性富集后由于获得数据和文件较多,所以这里增加了一个显著性阈值的筛选,例如用户在命令行设定阈值0.05,则只输出显著的主通路和子通路信息。输出文件以每个主通路命名,包括每条子通路信息,富集到子通路内的基因个数,基因列表,显著性P值,FDR值,格式如下完整代码下载地址http://pan.baidu.com/s/1bncwRUJ

#软件工具#KEGG子通路拆分流程
© 手抄报圈