孕前优生咨询指南PPT演示课件.ppt
《孕前优生咨询指南PPT演示课件.ppt》由会员分享,可在线阅读,更多相关《孕前优生咨询指南PPT演示课件.ppt(72页珍藏版)》请在三一文库上搜索。
1、 序列比对序列比对原理原理 Principles of Sequence AlignmentBiology -What is the biological question or problem?Data -What is the input data?-What other supportive data can be used?Model -How is the problem formulated computationally?-Or,whats the data model?Algorithm -What is the computational algorithm?-How abo
2、ut its performance/limitation?序列比对(sequence alignment)的定义:运用某种 特定的数学模型或算法,找出两个或多个序列之间的最大匹配碱基或氨基酸残基数,比对的结果反映了算法在多大程度上提供序列之间的相似性关系及它们的生物学特征。序列:核酸或蛋白质第一节 序列比对相关概念为什么要进行序列比对?基于同源物鉴定的功能预测Cystic Fibrosis(囊性纤维化)and the adenosine triphosphate binding Protein囊囊肿性性纤维化化(Cystic Fibrosis,CF),亦称为囊性囊性纤维化化、囊囊肿性性纤维变
3、性性或囊囊纤维变性性,是一种常一种常见的的遗传疾病。疾病。此病症会影响病患的全身,此病症会影响病患的全身,导致逐致逐渐的的行行动困困难以及提早死亡。最常以及提早死亡。最常见的症状的症状是因是因为长期反复的肺部感染所期反复的肺部感染所导致的呼致的呼吸困吸困难,其他可能的症状包括鼻,其他可能的症状包括鼻窦炎、炎、发育不良、腹泻以及不孕。育不良、腹泻以及不孕。基本假设:序列的保守性 功能的保守性注意:蛋白质一般在三级结构的层面上执行功能;蛋白质序列的保守性决定于其编码DNA的保守性。序列同源性模型中的进化假设1.所有的生物都起源于同一个祖先;2.序列不是随机产生,而是在进化上,不断发生着演变;3.基
4、本假设:序列保守性 结构保守性注意:反之可以不为真。结构保守性 序列保守性序列同源性模型中的进化假设1.所有的生物都起源于同一个祖先;2.序列不是随机产生,而是在进化上,不断发生着演变;3.基本假设:序列保守性 结构保守性注意:反之可以不为真。结构保守性 序列保守性同源性(同源性(homology)-具有共同的祖具有共同的祖先先(质的判断质的判断)相似性(相似性(similarity)同一性(同一性(identity)(三个重要概念见教材三个重要概念见教材P47)同源序列一般是相似的同源序列一般是相似的 相似序列不一定是同源的相似序列不一定是同源的 进化趋同(同功能)进化趋同(同功能)“同源性
5、与“相似性”的用法使用ClustalW和DNAMAN 310分析了本实验室克隆的15个黄瓜抗病基因类似序列(RGA)之间以及与烟草的N 基因、亚麻的L6基因和拟南芥的RPS2基因之间的同源性,并对这些RGA进行了PCR和Southern验证与分析。结果表明:15个黄瓜RGA中,核苷酸序列同源性最高的是CsRGA2、CsR2GA4和CsRGA5,其次是CsRGA6、CsRGA7、CsRGA8和CsRGA9,CsRGA1和CsRGA3也存在较高的同源性;其余的RGA同源性较低。在氨基酸序列上也表现了相同的特征。与N、L6和RPS2等抗病基因的产物之间同源性最高46%,最低22%。(丁国华等,20
6、07)相似性(相似度)直系同源与旁系同源序列的相似性描述序列的相似性描述定性的描述定性的描述:画图画图定量的数值:定量的数值:相似度相似度距离距离第二节第二节 序列比对打分方法序列比对打分方法比对比对就是两条序列字符间简单的两两匹配。比对可以反映出两条或多条同源序列间的进化关系.最简单的情况下即不考虑空位,当两条序列对比时,要做的仅是为较短的序列选择比对的起始点。考虑这样的两条核苷酸序列:AATCTATA和AAGATA 仅有三种比对方式不考虑空位的简单比对,它的打分函数是有对比奖励和罚分的和来决定上例中三个比对从左至右分别是 4、1、3匹配得分:匹配得分:1失配得分:失配得分:0空位空位两条或
7、多条序列比对时,如果考虑到插入与删除时间发生地可能性,那么候选的比对数量就会大大增加,也就导致了比对的复杂性。上节中两条核苷酸序列,在不考虑空位时仅有三种比对,而较短的那条加入了两个空位后,变产生了28种不同的比对,例如:等等简单空位罚分简单空位罚分对含有空位的比对打分时,空位罚分空位罚分就必须包含到打分函数中,空位比对的简单打分公式如下:例如:假设匹配得分为1,失配得分为0,空位罚分为-1三种空位比对的得分从左至右分别是1、3、3起始罚分与长度罚分起始罚分与长度罚分使用简单空位罚分对两条序列进行比对时,经常能找到若干同格式最优的比对。进一步区分这些比对的方法是找出哪些比对包含较多的不连续空位
8、哪些包含较少长度较长的空位片段。插入插入/删除事件删除事件假设两条序列长度分别是12和9假设这两条序列是真正的同源序列,那么它们之间长度的差异可以解释为(1)较长的序列有核苷酸的插入,或者(2)较短的序列发生了核苷酸的删除,或者(3)两者都发生了。在不知道原始父辈序列的情况下,无法判断导致空位的原因是由于一条序列的插入事件还是另一条的删除事件,通常把这类事件称为插入插入/删除事删除事件件。多联核苷酸的插入删除事件插入删除事件相对于单个核苷酸来说会较经常发生。统计结果表明,两条序列长度上的差异更可能是单个三联核苷酸的插入删除事件导致的,而多个不连续核苷酸插入删除事件的可能性比较小。空位罚分空位
9、罚分由序列中产生的新空位串引起的起始罚分起始罚分和根据缺少的字符数而定的长度罚分长度罚分。预设长度罚分小于起始罚分,以此建立的打分函数便能奖励空位连在一起的比对。假设起始罚分为-2,长度罚分为-1,匹配得分为+1,失配得分为0,则对于这三个比对,从左至右比对的得分分别是-3,-1,+1在后两种比对在使用简单空位罚分时,最后得分都是在后两种比对在使用简单空位罚分时,最后得分都是+3,现在却得到了不同的分数。,现在却得到了不同的分数。打分矩阵打分矩阵正如空位罚分空位罚分可以奖励与进化相关的的比对,失配罚分失配罚分也可以用来进一步区分相似比对。统计结果表明,两条同源的序列比对时,某些替换比其他替换常
10、见的多。例例:两条蛋白质序列,其中一条在某一个位置上是丙氨酸,如果该位点被替换成另一个较小的且疏水的氨基酸,比如缬氨酸对蛋白质的影响很小,如果被替换成较大且带电的残基,比如赖氨酸,那么对蛋白质的影响可能就会非常大。直观的讲,比较保守的替换比随机替换更可能维持蛋白质的功能,更不容易被淘汰,因此在打分上更倾向于丙氨酸而不是赖氨酸。打分矩阵(打分矩阵(Scoring Matrix)核酸打分矩阵设DNA序列所用的字母表为 =A,C,G,T a.单位矩阵 b.BLAST矩阵 c.转换-颠换矩阵(transition,transversion)(嘌呤:腺嘌呤A,鸟嘌呤G;嘧啶:胞嘧啶C,胸腺嘧啶T)ATC
11、GA1000T0100C0010G0001ATCGA5-4-4-4T-45-4-4C-4-45-4G-4-4-45ATCGA1-5-5-1T-51-1-5C-5-11-5G-1-5-51单位矩阵单位矩阵转换转换-颠换矩阵颠换矩阵BLAST矩阵矩阵如果不考虑颠换和置换,可采用以下打分矩阵如果不考虑颠换和置换,可采用以下打分矩阵PAM矩阵(矩阵(Point Accepted Mutation)基于进化的点突变模型基于进化的点突变模型 一个一个PAM就是一个进化的变异单位就是一个进化的变异单位,即即1%的氨基酸改变的氨基酸改变相对突变率相对突变率仅仅是某种氨基酸仅仅是某种氨基酸 被其他任意氨基酸替换
12、的次数被其他任意氨基酸替换的次数例如:ma是指丙氨酸与非丙氨酸残基比对的次数,是指丙氨酸与非丙氨酸残基比对的次数,Ma为概率为概率然而我们针对每个氨基酸对然而我们针对每个氨基酸对i 和和j,计算氨基酸,计算氨基酸j 被氨基酸被氨基酸i 替换的次数替换的次数 Aij例如:Acm 是被比对序列中,甲硫氨酸被半胱氨酸替换的次数是被比对序列中,甲硫氨酸被半胱氨酸替换的次数以以Aij除以除以ma 利用每个氨基酸出现的频度对起进行标准化,得到利用每个氨基酸出现的频度对起进行标准化,得到PAM-1矩矩阵中的元素阵中的元素Rij式中Mab为任意氨基酸b替代a的概率式中pa为氨基酸a未被替换的概率100个残基发
13、生一次替换的Dayhoffs PAM-1矩阵针对不同的进化距离采用针对不同的进化距离采用PAM 矩阵矩阵序列相似度序列相似度=40%50%60%|打分矩阵打分矩阵 =PAM120 PAM80 PAM 60PAM250 14%-27%Dotplot算法 评估两条序列相似度最简单的方法之一是利用点阵点阵图图。第一条被比较的序列排列在点阵图空间的横轴,第二条序列则排列在纵轴。点阵空间中两条序列中的残基相同时,在对应的位点上画上圆点,两条序列间连续相同的区域在图中会形成由圆点组成的上斜线。第三节 序列比对算法具有连续相似区域的两条具有连续相似区域的两条DNA序列的简单点阵图序列的简单点阵图滑动窗口技术
14、滑动窗口技术 使用滑动窗口滑动窗口代替一次一个位点的比较是解决这 个问题的有效方法。假设窗口大小窗口大小为10,相似度阈值相似度阈值为8,则每次比较取10个连续的字符,如相同的字符超过8个,则标记 基于滑动窗口滑动窗口的点矩阵点矩阵方法可以明显地降低点阵图的噪声,并且明确无误的指示出了两条序列间具有显著相似性的区域。(a)对人类()对人类(Homo sapiens)与黑猩猩()与黑猩猩(Pongo pygmaeus)的)的球蛋球蛋白基因序列进行比较的完整点阵图。(白基因序列进行比较的完整点阵图。(b)利用滑动窗口对以上的两种球蛋)利用滑动窗口对以上的两种球蛋白基因序列进行比较的点阵图,其中窗口
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优生 咨询 指南 PPT 演示 课件
