KEGG使用介绍 - 图文 

导读:KEGG,KyotoencyclopediaofGenesandGenomes,不多说。目录2楼---KEGG的数据3楼---看KEGG代谢通路图4楼---KEGG的自动注释5楼---代谢通路的着色6楼---芯片数据的分析7楼---KGML与通路编辑8楼---总结欢迎大家交流小木虫图片上传慢的要死!!!!!:sweat:只能先上传到其他地方在贴过来了!!!补

KEGG使用介绍 - 图文 

KEGG,Kyoto encyclopedia of Genes and Genomes ,不多说。 目录

2楼---KEGG的数据

3楼---看KEGG代谢通路图 4楼---KEGG的自动注释 5楼---代谢通路的着色 6楼---芯片数据的分析 7楼---KGML与通路编辑 8楼---总结 欢迎大家交流

小木虫图片上传慢的要死!!!!!:sweat: 只能先上传到其他地方在贴过来了!!! 补充:

这个帖子写的早了,平日比较忙没有更新。后来发现图不能打开了,又不能原帖编辑,因此重新上图附于每楼。

KEGG应该也在不断更新,若有不同之处请见谅。 欢迎大家交流!

举报删除此信息 看天 (站内联系TA) KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外 KEGG中有一个“专有名词”KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K)标签。下面就首先来讲一下KEGG orthology。 任找一个代谢通路图,在上方有pathway meue | payhway entry | Show(Hide) description | 这3个选项,点击pathway entry, 出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了。在这个页面中的pathway map项中点击按钮状的链接Ortholog table 。就进入了Ortholog table如下的页面:

在这个表中,行与物种对应,3个字母都是相应物中的英文单词缩写,比如has表示Homo sapiens,mcc表示Macaca mulatta;列就表示相应的Ortholog分类,比如K00844就表示生物体内的己糖激酶hexokinase 这一类序列和功能相似的蛋白质类(酶类)。如上图has后有3101,3098,3099这3个条目,它表示在人类细胞中中存在3中不同的己糖激酶,它们分别由以上这3组数字代表的基因所编码,这3组数字应该是这3个基因的登录号。空白则表示在该物种中不存在这种酶。

点击K00844则这一KO分类信息及成员列表都可显示出来;点击has则链接到物种(人类)基因组去了;点击P,则显示相应的代谢通路。下面我们点击3101,如下:

如上图,就是我们常见的一个页面,3101是KEGG中的基因ID(登录号),

H.sapiens表示物种,然后是基因的名称,表达的酶,属于哪个KO分类以及参与哪些代谢途径;下面还有结构、序列信息等等。 所以从Ortholog table中可以很容易地知道一张代谢通路上有哪些KO分类(酶类),并且这些酶类的成员在各物种中分配存在的情况以及特定的名称。 wu

012.jpg

hsa:gene ID 3101

13.jpg 看天 (站内联系TA)

比如以上这个图,方框一般就是酶,方框里面的5.4.2.2不是IP 而是EC编号;小圆圈代表代谢物,你把鼠标放上去,(别放我这上面,放KEGG中去)会出现C00668的东西,C代表compound,00668是这种化合物在KEGG中的编号,一般在KEGG中数据条目都是这样的,前面一个标志,后面一个五位数编号;大的圆方块,就表示是另一个代谢图了,所以就不展开了。

但是:为什么这个图上有的小框框是绿色呢?(这是绿色吧?我蓝绿不分的,下同)

因为这是一张特定物种(S. cere. 酿酒酵母)的代谢图,蓝色的框框表示专属于这个物种。在KEGG中有两种代谢图,一种是参考代谢通路图reference pathway,是根据已有的知识绘制的概括的、详尽的具有一般参考意义的代谢图,这种图上就不会有绿色的小框,而都是无色的,所有的框都可以点击查看更详细的信息;另一种就是像上面这样的属于特定物种的代谢图species-specific pathway,会用绿色来标出这个物种特有的基因或酶,只有这些绿色的框点击以后才会给出更详细的信息。这两种图很好区分,reference pathway 在KEGG中的名字是以map 开头的,比如map00010,就是糖酵解途径的参考图,而特定物种的代谢通路图开头三个字符不是map而是种属英文单词的缩写(应该就是一个属的首字母+2个种的首字母)比如酵母的糖酵解通路图,就是sce00010,大肠杆菌的糖酵解通路图就应该是eco00010吧。 那么:怎么找这两种图呢?

(1)有下拉列表的时候,在列表选择reference 或者是特定物种即可。 (2)在pathway检索的页面http://www.genome.jp/kegg/pathway.html ,如下图:

默认的就是map,参考图,你想要什么物中的代谢图写上它的名称就好了(种属缩写),如果不知道是哪3个字母,点击organism 选择即可。(不过你点进去也是一片空白,你要提示两个字母才会给出下拉条目) 顺便问一下:怎么找基因呢?

还是上面这张图,看到了吗,除了PATHWAY之外是不是还有 BRITE、DISEASE..以及GENES等等,点击基因GENES,就可以查找基因了,如下图:

不过这里要按一定的格式(org:gene)输入要查找的目的基因,比如它给出的示例:syn表示物中,ssr3451表示基因ID,查找出来的基因名称是psbE。其实我试了一下,若直接检索基因名称(而不是KEGG中的基因ID)syn:psbE 也是一样的。因为我不知道KEGG中基因ID如何编制的,但是,我同时也不知道基因的名称是如何定义的。比如果糖1,6-二磷酸酶Fructose 1,6-biphosphatase 的基因就叫fbp,我放进去能检索,但是我把有名的gal填上去就不能检索,当然这可能与基因后面的乱七八糟的序号后缀有关,比如填上gal1就能检索了,所

以我真不知道基因到底怎么命名的?当然我在syn中没找到gal1在sce中检索到了,这也说明了基因果然不是乱长的。

依旧是上面这个图,看到KEGG2了吗?点击。也会出现检索框,这是一个总体性地检索框,在这里面输入关键词,代谢通路也好,glycolysis也好, gal也好,化合物也好,没那么多限制,KEGG中的相关东西都会检索出来,在这里浏览一下,再进行后续检索,也是一个不错的方法。

当然,代谢通路图,还有其他的查看形式(比如以KO查看),以及图上可以点击,链接到这链接到那,点来点去总能点出奇怪的页面来,熟悉一下也就熟悉了,这些东西会很有用,所以我就不说了。下面讲一下KEGG的自动注释功能。 示例代谢图1:

01.jpg

http://www.genome.jp/kegg/pathway.html 页面

02.jpg gene:

03.jpg 看天 (站内联系TA) KEGG Automatic Annotation Server,KEGG的自动注释服务简称KAAS。在线网址为http://www.genome.jp/tools/kaas/ 。就是你提交一段蛋白质序列或者基因序列(必须是fasta格式),它自动在内部进行相似性比对,找到最相似的基因,并确定检索基因的KO分类,然后给出这些基因所在的代谢通路并以以不同的颜色标示这些基因。如下图:

我在help中随便复制了它的两条示例氨基酸序列,然后粘贴到检索框中,进行了检索。检索框默认的蛋白质序列,如果不是的话要改选。然后填上一个邮箱地址,点击又下角的compute即可。不出意外的话,你在接下来的页面中应该看不到任何结果,甚至连提示都没有,原来它把结果发到你邮箱去了。我也不明白就一个网页链接为什么还硬要发送到邮箱。 首先发你一封信说已经接受,并给你一个期待结果显示的网址,一段时间后,会发你另外一封邮件,说已经完成。打开它给的网址,就能看到结果了,如下:

看来从1:20开始计算到1:50 才结束,两条氨基酸链计算了30分钟(不过我

博泰典藏网btdcw.com包含总结汇报、行业论文、表格模板、旅游景点、出国留学、自然科学、计划方案、医药卫生、初中教育以及KEGG使用介绍 - 图文 等内容。

本文共3页123