蛋白质数据库与蛋白质分析生物信息学.pptx
《蛋白质数据库与蛋白质分析生物信息学.pptx》由会员分享,可在线阅读,更多相关《蛋白质数据库与蛋白质分析生物信息学.pptx(111页珍藏版)》请在三一文库上搜索。
1、蛋白质数据库与蛋白质分析蛋白质数据库与蛋白质分析INTRODUCTION生命物质过程核酸蛋白质TheCentralDogma生物信息学生物信息学(Bioinformatics)是是由由生生物物学学和和信信息息科科学学交交叉叉融融合合形形成成的的。包包含含生生物物信信息息的的获获取取、处处理理、存存储储、发发布布、分分析析和和解解释释等等各各个个方方面面,它它综综合合运运用用数数学学、生生物物学学、计计算算机机、信信息息科科学学等等诸诸多多学学科科的的理理论论方方法法及及国国际际互互联联网网,阐阐明明和和解解释释大大量量数数据据所所包包含含的的生生物物学意义。学意义。http:/bioinfor
2、matics.oxfordjournals.org/1.数据库(DataBase)1.检索工具(RetrieveTool)1.分析软件(AnalysisSoftware)NucleicAcidsResearch杂志每年的第一期中详细介绍最新版本的各种数据库。到2013年共有1512个数据库。http:/nar.oxfordjournals.org生物信息学的重要组成:生物信息学的重要组成:利用在线工具和离线工具分析功能和结构www.bio-国际生物信息研究的主要机构国际生物信息研究的主要机构1.美国国家生物技术信息中心美国国家生物技术信息中心National Center for Biotec
3、hnology Information,NCBIhttp:/www.ncbi.nlm.nih.gov/GenBank和和Pubmed等公共数据库等公共数据库美国国家医学图书馆美国国家医学图书馆(NLM)的一部分的一部分(该图书馆是美国国该图书馆是美国国家卫生研究所家卫生研究所NIH的一部分的一部分).(美洲美洲)工具:工具:Entrez BLAST2.欧洲生物信息学研究所欧洲生物信息学研究所European Bioinformatics Institute,EBIhttp:/www.ebi.ac.uk/European Molecular Biology Laboratory(EMBL)数数据
4、库等据库等。1992年年由由欧欧盟盟资资助助建建立立在在英英国国的的一一个个非非盈盈利利性性学学术术机机构构,也是生物信息学研究与服务的欧洲中心。(欧洲)也是生物信息学研究与服务的欧洲中心。(欧洲)工具:工具:SRS FASTA 3.日本国立遗传学研究所日本国立遗传学研究所uNational Institute of Genetics,NIGuhttp:/www.nig.ac.jg/uDNA Data Bank of Japan(DDBJ),日本日本DNA数据库数据库u是是日日本本遗遗传传学学各各方方面面研研究究的的中中心心研研究究机机构构及及生生命命科科学学所所有有领域的研究基地。(亚洲)领
5、域的研究基地。(亚洲)u工具:工具:DBGET SEARCH KEGGNIG建建立立的的日日本本DNA数数据据库库(DDBJ)、欧欧洲洲EBI维维护护的的EMBL核核酸酸序序列列数数据据库库,以以及及美美国国NCBI的的GenBank数数据据库库,并并列列为为国国际际上上最最著著名的三大核酸数据库。名的三大核酸数据库。三大核酸数据库三大核酸数据库4.瑞士生物信息研究所瑞士生物信息研究所(Swiss Institute of Bioinformatics,SIB)数据库:数据库:SWISS-PROT5.美国国家生物医学基金会美国国家生物医学基金会(National Biomedical Rese
6、arch National Biomedical Research F Foundation,NBRFoundation,NBRF)数据库:数据库:PIR6.布鲁克黑文国家实验室布鲁克黑文国家实验室(Brookhaven national laboratory)数据库:数据库:PDB7.桑格研究所桑格研究所(Wellcome Trust Sanger Institute)数据库:数据库:PFAMBIOINFORMATICS OF PROTEIN一、重要的蛋白质数据库一、重要的蛋白质数据库蛋白质序列数据库蛋白质序列数据库蛋白质序列数据库蛋白质序列数据库蛋白质三维结构数据库蛋白质三维结构数据库蛋白
7、质三维结构数据库蛋白质三维结构数据库蛋白质组数据库(二维凝胶电泳数据库)蛋白质组数据库(二维凝胶电泳数据库)蛋白质组数据库(二维凝胶电泳数据库)蛋白质组数据库(二维凝胶电泳数据库)信号传导及蛋白质信号传导及蛋白质信号传导及蛋白质信号传导及蛋白质-蛋白质相互作用相关数据库蛋白质相互作用相关数据库蛋白质相互作用相关数据库蛋白质相互作用相关数据库蛋白质和蛋白质和蛋白质和蛋白质和DNADNA相互作用数据库相互作用数据库相互作用数据库相互作用数据库ProteinSequenceDatabases(HistoricalOrder)NationalBiomedicalResearchFoundation(N
8、BRF)=ProteinIdentificationResource(PIR)MargaretDayhoffAtlasofProteinSequencesPhylogenies,evolution,aminoacidsubstitutionmatrices(PAM)anddiscoveringactivesitesinenzymesPIRSFEvolutionaryFamily,iProClassFunctionalsiteanalysisandontologies,iProLinktoliteratureUniProt-UniversalProteinResourceSwissProt(EX
9、PASYsite)AmosBairochManualcurationandannotationHighlycross-referencedManyusefulanalyticaltools(EXPASYTools)2D-PAGEandMassSpectrometrydatabasesPrositefunctionalmotifdatabaseUniProt-UniversalProteinResourceTREMBLTranslationofmRNAs(RefSeq),UniGene,openreadingframes(ORFs)andpredictedgenesfromgenomesAuto
10、maticannotationsEMBL=EBIProteindatabasesClustersInterprolinkedtodomainandmotifdatabases(CATH,PANTHER,PRINTs,PROSITE,pFAM,PIRSF,PRODOM,SCOP,SMART,SUPERFAMILY)Intron-exonstructureandlinkstoORFs,codingregionsUniProt-UniversalProteinResourceNCBIProteinDatabaseProteinandnrPROdatabaseSwissProt,PIRandtrans
11、latedgenes/genomesProteinClustersDatabase(prokaryotic)andCOGSandKOGSLinkedtocodingregionsandintron/exonstructureLinkedtocodingSNPsandvariationsdatabasesLinkedtoMMDSBstructuredatabaseLinkedto3DdomainsLinkedtoCDDConservedDomainDatabaseUCSCProteomeBrowserlSWISS-PROT SWISS-PROT(瑞士日内瓦大学)蛋白质序列数据库(瑞士日内瓦大学)
12、蛋白质序列数据库 http:/www.Expasy.orghttp:/www.Expasy.org ExpertofProteinAnalysisSystem(Expasy)包括序列包括序列及功能信息、蛋白识别、蛋白质结构预测及其他功能及功能信息、蛋白识别、蛋白质结构预测及其他功能lNCBI NCBI 蛋白质数据库蛋白质数据库 包括所有蛋白质序列,及其翻译产包括所有蛋白质序列,及其翻译产物序列物序列 http:/www.ncbi.nlm.nih.gov/pubmedhttp:/www.ncbi.nlm.nih.gov/pubmedlPIR PIR(Protein Information Res
13、ourceProtein Information Resource)蛋白质序列信)蛋白质序列信息资源库(美、德)息资源库(美、德)http:/pir.georgetown.eduhttp:/pir.georgetown.edu 1.蛋白质一级结构(序列)数据库蛋白质一级结构(序列)数据库 2.蛋白质二级结构(预测)数据库蛋白质二级结构(预测)数据库 蛋白质回环数据库:蛋白质回环数据库:www.bmm.icnet.uk/loopwww.bmm.icnet.uk/loop同源模型数据库:同源模型数据库: of Secondary Structure of Proteins,DSSP(Definit
14、ion of Secondary Structure of Proteins,DSSP(Definition of Secondary Structure of Proteins,DSSP(Definition of Secondary Structure of Proteins,蛋白质蛋白质二级结构构象参数数据库二级结构构象参数数据库):http:/www.cmbi.kun.nl/gv/dssphttp:/www.cmbi.kun.nl/gv/dsspFSSP(Families of Structural Similar Proteins)FSSP(Families of Structura
15、l Similar Proteins)FSSP(Families of Structural Similar Proteins)FSSP(Families of Structural Similar Proteins)蛋白质家族蛋白质家族数据库:数据库:http:/www.embl-ebi.ac.uk/dall/fssphttp:/www.embl-ebi.ac.uk/dall/fsspHSSP(Homology Derived Secondary Structure of Proteins,HSSP(Homology Derived Secondary Structure of Protei
16、ns,HSSP(Homology Derived Secondary Structure of Proteins,HSSP(Homology Derived Secondary Structure of Proteins,同源同源蛋白质数据库蛋白质数据库):www.cmbi.kun.nl/gv/hsspwww.cmbi.kun.nl/gv/hssp3.蛋白质三级结构数据库蛋白质三级结构数据库 lPDB(ProteinDataBank)数据库,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库http:/www.rcsb.org/pdb/lNCBISTRUCTUREMMD
17、B(MolecularModellingDataBase)数据库,包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库http:/www.ncbi.nlm.nih.gov/structurelSWISS-MODELRepository数据库,由瑞士生物信息研究所负责的蛋白质三维结构数据库http:/swissmodel.expasy.org/repository/lCATH CATH 数据库:数据库:CATHCATH (Class,Architecture,Topology(Class,Architecture,Topology and Homologous superfamily)an
18、d Homologous superfamily)是与是与SCOPSCOP类似的一个数据库。类似的一个数据库。http:/www.cathdb.info/lSCOP(Structuralclassificationofproteins)数据库,英国医学研究会(MRC)剑桥分子生物学实验室开发的蛋白质结构分类数据库。包含描述蛋白质域的家族、超家族、折叠、等级等信息。http:/scop.mrc-lmb.cam.ac.uk/scop蛋白质晶体学是一门十分活跃的边缘学科,1960年2012年之间已经有15名蛋白质晶体学家荣获诺贝尔奖。X-X-射线衍射(射线衍射(X-ray diffractionX-
19、ray diffraction)和核磁共振)和核磁共振(nuclear magnetic resonance(nuclear magnetic resonance,NMR)NMR)技术技术是当前人们认识蛋白高级结构的主要手段,但两种技术都有不足之处。前者要求必需得到高标准的蛋白晶体,后者对分子量大于3万的大蛋白不能测定。英国女化学家多萝西霍奇金(DorothyHodgkin)在20世纪30年代初通过X射线发现胃蛋白酶拥有完美的晶体,这个里程碑式的发现开启了生物结晶学研究的时代。霍奇金1949年测定出了青霉素的结构,1957年又测定出了维生素B12的结构,并因此获得1964年诺贝尔化学奖。蛋白质
20、三级结构:蛋白质三级结构:19881988年,在世界上首次解析了一种膜蛋白年,在世界上首次解析了一种膜蛋白紫细菌光合反应中心的高分辨率三紫细菌光合反应中心的高分辨率三维结构维结构 ,诺贝尔化学。诺贝尔化学。20022002年,钾离子通道和水通道的晶体结构,诺贝尔化学奖。年,钾离子通道和水通道的晶体结构,诺贝尔化学奖。2 2009009年,核糖体的晶体结构,诺贝尔化学奖。年,核糖体的晶体结构,诺贝尔化学奖。2012年,Lefkowitz和和Kobilka因研究因研究GPCR的结构和功能而获得诺贝尔化学奖的结构和功能而获得诺贝尔化学奖2025/7/1121X X射线衍射技术射线衍射技术在蛋白质分析
21、中的应用在蛋白质分析中的应用l蛋白质结构测定:1959年佩鲁茨和肯德鲁用了23年的时间对血红蛋白和肌血蛋白进行了X射线衍射分析,解决了血红蛋白的三维空间结构获得了1962年诺贝尔化学奖。血红蛋白的空间结构 血红蛋白的X射线衍射图二、蛋白质数据库检索工具二、蛋白质数据库检索工具SRS,(SequenceRetrievalSystem)是欧洲分子生物学网EMBnet的主要检索工具,现已直接进入。http:/www.ebi.ac.ukEntrez是美国NCBI的主要检索工具,现在可以直接从Pubmed上进入。http:/www.ncbi.nlm.nih.gov/pubmed三、蛋白质分析软件三、蛋白
22、质分析软件序列相似性分析蛋白质理化性质分析特征序列分析翻译后修饰分析结构功能域分析亚细胞定位分析1.整体相似性序列对比:理论基础是进化学说2.局部相似性序列对比:其生物学基础是蛋白质功能结构域的高度保守性。所以,通过比较分析保守位点上的残基可以对蛋白质的结构和功能进行预测。3.序列两两对比:通常用打分矩阵的方法。即两条序 列分别作为矩阵的两维,矩阵点是两维上对应两个序列的相似性分数,分数越高则说明两个序列越相似。常用对比程序BLASTP:http:/blast.ncbi.nlm.nih.gov/Blast.cgi4.多序列对比:是把两条以上可能有系统进化关系的序列进行对比的方法。也可用作同源性
23、分析。目前,使用最广泛的多序列对比程序是CLUSTALX:www.ebi.ac.uk/clustalx/序列相似性分析目目前前,应应用用较较广广泛泛的的序序列列相相似似性性搜搜索索工工具具:FASTAFASTA、BLASTBLAST和和BLITZBLITZ等。等。对对于于DNADNA和和蛋蛋白白质质序序列列相相似似性性检检索索,FASTAFASTA的敏感度较高,但的敏感度较高,但BLASTBLAST检索速度较快。检索速度较快。BLITZBLITZ的运算速度较慢,但其特异性较高。的运算速度较慢,但其特异性较高。数据库序列比对软件数据库序列比对软件程序程序数据库数据库简述简述Blastp蛋白质蛋白
24、质可能找到具有远源进化关系的匹配序列可能找到具有远源进化关系的匹配序列Blastn核苷酸核苷酸适合寻找分值较高的匹配,不适合远源适合寻找分值较高的匹配,不适合远源关系关系Blastx蛋白质蛋白质适合新适合新DNA序列和序列和EST序列的分析,能序列的分析,能够发现未知核酸序列潜在的翻译产物够发现未知核酸序列潜在的翻译产物Tblastn所有阅读框动态翻所有阅读框动态翻译的核苷酸序列译的核苷酸序列适合寻找数据库中尚未标注的编码区适合寻找数据库中尚未标注的编码区Tblastx核苷酸序列核苷酸序列6个阅个阅读框的翻译产物读框的翻译产物适合表达序列标签(适合表达序列标签(EST)分析)分析BLAST(B
25、asic Local Alignment Search Tool)蛋白质理化性质分析u分析内容包括分子质量、等电点、亲水性和疏水性u分析软件可用本地下载软件如MacVector、OMIGA、DNAMA、BioEdit等,也可用在线软件u常用在线网址:www.expasy.org蛋白质理化性质分析蛋白质理化性质分析蛋白质理化性质分析蛋白质特征序列分析包括二级结构以及二级和三级之间的模序(Motif)、结构域(Domain)和折叠单元(Fold)等。跨膜区、前导肽、信号肽及蛋白质定位。其它功能基团。螺旋片层/折叠+折叠蛋白质特征序列分析蛋白质特征序列分析蛋白质翻译后修饰分析蛋白质翻译后修饰分析蛋白
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蛋白质 数据库 分析 生物 信息学
