生物信息学上机实验2013--更新.ppt
《生物信息学上机实验2013--更新.ppt》由会员分享,可在线阅读,更多相关《生物信息学上机实验2013--更新.ppt(45页珍藏版)》请在三一文库上搜索。
1、生物信息学 上机练习,生物序列的信息检索 多序列比对及进化树的构建 (选做) Phylip使用,1,序列的数据库信息检索示例:,待查询序列: CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGG
2、TTGCGCTTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAAAGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATTGAGGCCTCTGGC,问题,1,这是什么基因?基因的标识符是什么?在基因组上的定位是怎样的? 2,编码的蛋白质多少个氨基酸?序列标识符为?序列是? 3,该蛋白没有保守的功能结构域 ? 4,该蛋白亚细胞定位是?它的功能是怎样的? 5,该蛋白
3、在真核生物中是否保守? 6,该蛋白有没有三级结构信息?,答案 1. 该基因为人的BIRC5基因;基因标识符:NM_001168.2;染色体定位:17号染色体,7621027776221716; 2. 人的BIRC5蛋白质包含142个氨基酸,序列标识符为:NP_001159.2; 序列为:MGAPTLPPAWQPFLKDHRISTFKNWPFLEGCACP 3. BIRC5具有保守的功能结构域BIR; 4. BIRC5的细胞亚定位:胞质,核;其功能有: (1) 在瘤形成过程中可能起一定作用; (2) 阻碍G2/M期的细胞编程性凋亡; (3) Chromosomal passenger compl
4、ex (CPC)的成员之一。等等。 5. 该基因在真核生物中最保守很可能是来自毛猩猩Pongo abelii的BIRC5蛋白:Q5RAH9; 6. 该蛋白的三级结构已知,在PDB中的标识符为1E31等。,2,多序列比对及进化树构建,构建Cytochrome C1家族进化树 在Uniprot数据库中搜索Cytochrome C1在不同物种中的氨基酸序列,下载fasta文件 使用MEGA软件对结果进行分析: 1)多序列比对(MSA multiple sequence alignment) 2)构建进化树,Cytochrome C1家族序列获取,工具网站 http:/www.uniprot.org/
5、 advanced search customize,调整结果显示格式,选择想要显示的内容,例如显示列为 Entry name Organism Sequence Protein names save 以蛋白名称:Cytochrome C1为关键词搜索,搜索结果,编辑Fasta序列文件,选择搜索结果中Entry name 以“CY1_”开头的序列(选十几个物种序列,每一个种属只选一个序列,即entry name一样的只选择一个即可) 点retrieve,编辑Fasta序列文件,Download FASTA格式的文件 直接下载下来的序列名称会很累赘,可以将该文件以文本形式打开,对序列名称进行编辑
6、,让其看起来更加简洁明了,Fasta文件格式,以为开头,后接序列名称,重启一行,输入序列 CY1_BOVIN MAAAAATLRGAMVGPRG CY1_YEAST MFSNLSKRWAQRTLSKS CY1_HUMAN MAAAAASLRGVVLGPRG ,Fasta文件要求,序列名称中不含有 = 字符 氨基酸序列可以分成多行,但内部不要有空格 每个序列的title仅保留蛋白/基因名称+种属来源,如:CY1_YEAST,MEGA 5软件使用,打开MEGA 5,拉开Align菜单,选择Edit/Build Alignment,MEGA 5软件使用,Creat a new Alignment 选
7、择Protein,MEGA 5软件使用,在新弹出的窗口中,选择Data-Open-Retrieve Sequences from File,然后导入刚才保存的fasta文件,多序列比对,Ctrl+A选择全部序列,Aligment-Align by ClustalW,多序列比对,可以修改各补偿值等参数,点OK,多序列比对,多序列比对完成 Dateexport alignment, 导出MEGE format和 Fasta format两份结果, 得到一个*.meg文件 和一个*.fas文件,进化树构建,关闭Alignment窗口,回到MEGA软件主窗口,File - Open A File/Se
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 上机 实验 2013 更新
链接地址:https://www.31doc.com/p-2998036.html