生物信息学及其发展历史.ppt
《生物信息学及其发展历史.ppt》由会员分享,可在线阅读,更多相关《生物信息学及其发展历史.ppt(78页珍藏版)》请在三一文库上搜索。
1、第二节 生物信息学及其发展历史,1、生物信息学的概念,生物信息学(Bioinformatics) 这一名词的来由,八十年代末期,林华安博士认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是“CompBio”;之后,又将其更改为兼具法国风情的“bioinformatique”,看起来似乎有些古怪。因此不久,他便进一步把它更改为“bio-informatics(或bio/informatics)”。但由于当时的电子邮件系统与今日不同,该名称中的-或/符号经常会
2、引起许多系统问题,于是林博士将其去除,今天我们所看到的“bioinformatics”就正式诞生了,林博士也因此赢得了“生物信息学之父”的美誉。,生物信息学,HGP 生物数据的激增 (每15个月翻一番),生物学家,数学家,计算机 科学家,生物信息学 (bioinfomatics) 的诞生,三种科学文化的融合,生物学家 (生物学问题),数学物理学家 计算机科学家 (基础理论问题),工程师 (技术应用),生物信息学(bioinformatics)是80年代未随着人类基因组计划(Human genomeproject)的启动而兴起的一门新的交叉学科。它涉及生物学、数学、计算机科学和工程学,依赖于计算
3、机科学、工程学和应用数学的基础,依赖于生物实验和衍生数据的大量储存。,概念(广义),生物体系和过程中信息 的存贮、传递和表达,细胞、组织、器官的生理、病理 、药理过程的中各种生物信息,信息科学,生 命 科 学 中 的 信 息 科 学,广义的说,生物信息不仅包括基因组信息,如基因的DNA序列、染色体定位,也包括基因产(蛋白质或RNA)的结构和功能及各生物种间的进化关系等其他信息资源。生物信息学既涉基因组信息的获取、处理、贮存、传递、分析和解释,又涉及蛋白质组信息学如蛋白质的序列、结构、功能及定位分类、蛋白质连锁图、蛋白质数据库的建立、相关分析软件的开发和应用等方面,还涉及基因与蛋白质的关系如蛋白
4、质编码基因的识别及算法研究、蛋白质结构、功能预测等,另外,新药研制、生物进化也是生物信息学研究的热点。,概念(狭义),生物 分子数据,深层次 生物学知识,分子生物信息学 Molecular Bioinformatics,挖掘,获取,生物分子信息的获取、存贮、分析和利用,由于当前生物信息学发展的主要推动力来自分子生物学,生物信息学的研究主要集中于核苷酸和氨基酸序列的存储、分类、检索和分析等方面,所以目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。,1995年,在美国人类基因组计划(HG
5、P)第一个五年总结报告 中给出了一个较为完整的生物信息学的定义:生信息学是包含生物信息的获取、处理、贮存、分发、分析和解释的所有方面的一门学科,它综合运用数学、计算机科学和生物学的各种工具进行研究,目的在于了解大量的生物学意义。,Bioinformatics,2、生物分子信息,细胞,分子,存贮、复制、传递和表达 遗传信息的系统,生物信息的载体,生物信息学主要研究两种信息载体 DNA分子 蛋白质分子,Protein Machines,From the Cell to Protein Machines,生物分子至少携带着三种信息 遗传信息 与功能相关的结构信息 进化信息,(1)遗传信息的载体DNA
6、,遗传信息的载体主要是DNA 控制生物体性状的基因是一 系列DNA片段 生物体生长发育的本质就是遗 传信息的传递和表达,DNA通过自我复制,在生物体的繁衍过 程中传递遗传信息,基因通过转录和翻译,使遗传信息在生物 个体中得以表达,并使后代表现出与亲代 相似的生物性状。,基因控制着蛋白质的合成,DNA,RNA,蛋白 质,转录,翻译,基因的DNA序列,DNA,前体RNA,mRNA,多肽链,蛋白质序列,对 应 关 系,遗 传 密 码,(2)蛋白质的结构决定其功能,蛋白质功能取决于蛋白质的空间结构 蛋白质结构决定于蛋白质的序列(这是目前基本共认的假设),蛋白质结构的信息隐含在蛋白质序列之中。,(3)
7、DNA分子和蛋白质分子 都含有进化信息,通过比较相似的蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基因复制而产生的分子进化证据。 通过比较来自于不同种属的同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚至种属之间的系统发生关系,推测它们共同的祖先蛋白质。,生 物 分 子 信 息,DNA序列数据,蛋白质序列数据,生物分子结构数据,生物分子功能数据,最基本,直观,复杂,生物分子数据类型,生物分子数据及其关系,第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少 对于第二部密码,目前则只能用统计学的方法进行分析 无论是第一部遗传密码,还是第二部遗传密码,都隐藏
8、在大量的生物分子数据之中。,生物分子数据是宝藏, 生物信息数据库是金矿,等待我们去挖掘和利用。,生物分子信息的特征,生物分子信息数据量大 生物分子信息复杂 生物分子信息之间存在着密切的联系,3、生物信息学的发展历史,生物信息学 基本思想的产生,生物信息学 的迅速发展,二十世纪 50年代,二十世纪 80-90年代,生物科学和 技术的 发展,人类基因组 计划的 推动,20世纪50年代,生物信息学开始孕育 20世纪60年代,生物分子信息在概念上将计算 生物学和计算机科学联系起来 20世纪70年代,生物信息学的真正开端 20世纪70年代到80年代初期 ,出现了一系列著 名的序列比较方法和生物信息分析方
9、法 20世纪80年代以后,出现一批生物信息服务机 构和生物信息数据库 20世纪90年代后 ,HGP促进生物信息学的迅速 发展,关于生物信息学发展历程中的重要大事, 请参见下面两个网站的介绍: http:/www.ncbi.nlm.nih.gov/Education /BLASTinfo/milestones.html、 http:/www.biosino.org/bioinformatics/。,第三节 生物信息学主要研究内容,生物信息学主要研究内容,1、 生物分子数据的收集与管理 2、 数据库搜索及序列比较 3、 基因组序列分析 4、基因表达数据的分析与处理 5、蛋白质结构预测,基因组 数据
10、库,蛋白质 序列 数据库,蛋白质 结构 数据库,DDBJ,EMBL,GenBank,SWISS-PROT,PDB,PIR,1、 生物分子数据的收集与管理,2、 数据库搜索及序列比较,搜索同源序列在一定程度上就是通过序列比较寻找相似序列 序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述 多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。,发现同源分子,3、 基因组序列分析,
11、遗传语言分析天书 基因组结构分析 基因识别 基因功能注释 基因调控信息分析 基因组比较,4、基因表达数据的分析与处理,基因表达数据分析是目前生物信息学研究的热 点和重点 目前对基因表达数据的处理主要是进行聚类分 析,将表达模式相似的基因聚为一类,在此基 础上寻找相关基因,分析基因的功能 所用方法主要有: 相关分析方法 模式识别技术中的层次式聚类方法 人工智能中的自组织映射神经网络 主元分析方法,基因芯片,层次式聚类,二维电泳图,5、蛋白质结构预测,蛋白质的生物功能由蛋白质的结构所决定 ,蛋白质结构预测成为了解蛋白质功能的重要途径 蛋白质结构预测分为: 二级结构预测 空间结构预测,蛋白质折叠,二
12、级结构预测,在一定程度上二级结构的预测可以归结为模式识别问题 在二级结构预测方面主要方法有: 立体化学方法 图论方法 统计方法 最邻近决策方法 基于规则的专家系统方法 分子动力学方法 人工神经网络方法 预测准确率超过70%的第一个软件是基于神经网络的PHD系统,空间结构预测,在空间结构预测方面,比较成功的理论方法是同源模型法 该方法的依据是:相似序列的蛋白质倾向于折叠成相似的三维空间结构 运用同源模型方法可以完成所有蛋白质10-30%的空间结构预测工作,第四节 生物信息学当前的主要任务,纵观当今生物信息学界的现状,可以发现,大部分人都把注意力集中在基因组、蛋白质组、蛋白质结构以及与之相结合的药
13、物设计上,1. 基因组,1.1 新基因的发现,通过计算分析从EST(Expressed Sequence Tags)序列库中拼接出完整的新基因编码区,也就是通俗所说的“电子克隆”;通过计算分析从基因组DNA序列中确定新基因编码区,经过多年的积累,已经形成许多分析方法,如根据编码区具有的独特序列特征、根据编码区与非编码区在碱基组成上的差异、根据高维分布的统计方法、根据神经网络方法、根据分形方法和根据密码学方法等。,1.2 非蛋白编码区生物学意义的分析,非蛋白编码区约占人类基因组的95%,其生物学意义目前尚不是很清楚,但从演化观点来看,其中必然蕴含着重要的生物学功能,由于它们并不编码蛋白,一般认为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 及其 发展 历史
链接地址:https://www.31doc.com/p-2158314.html