《第3章基因组学、蛋白组学.ppt》由会员分享,可在线阅读,更多相关《第3章基因组学、蛋白组学.ppt(199页珍藏版)》请在三一文库上搜索。
1、第三章 基因组和基因组学,Genome and Genomics,基因(Gene)的概念,定义:基因是决定一定功能产物的DNA序列(片断),是遗传的结构和功能单位。 功能产物:RNA和蛋白质,染色体组 (Chromosome set ),每个生殖细胞中的全部染色体称为一个染色体组。人体体细胞内含两个染色体组。,基因组(Genome),每个染色体组的DNA构成一个基因组。广义的基因组包括细胞核染色体基因组和细胞质中的线粒体基因组。 是一个细胞或一种生物体的整套遗传物质,基因组学(Genomics),是指对所有基因进行基因组作图,核苷酸序列分析,基因定位和基因功能分析。,第一节,原核生物基因组,原
2、核生物的生命活动,可进行基因复制 复杂的代谢活动 适应环境的变化,获取自身所需的能量,合成自身生长所需的原料,调节自身的酶系统组成及功能,调节细胞内某种蛋白质的数量,一、原核生物基因组一般特征,DNA较小,一般为106107碱基对 基因数目较少,大约为3500个基因 通常为一条环状双链DNA(dsDNA) 只有一个DNA复制起始点 GC含量差异很大,25%75%之间,可用于推测细菌的种类,(一)原核生物的类核结构,基因组DNA位于细胞中央的核区,无核膜 形成类核结构,中央为RNA和支架蛋白,外围是双链闭环的超螺旋DNA,原核基因组类核结构,(二)原核生物的操纵子结构,是指数个功能上相关联的结构
3、基因串联在一起,连同上游的调控区(包括调节基因、启动子、操纵基因)以及下游的转录终止信号,共同组成的一个基因表达单位。,(三)原核生物的结构基因,结构基因是连续的,无内含子成分 多顺反子结构 多数为单拷贝基因,编码rRNA、tRNA的基因为多拷贝 结构基因的编码顺序一般不重叠 基因重叠是指基因组DNA中某些顺序被两个及以上基因所共用,(四)具有编码同功酶的基因,表达功能相同的产物的一类基因,但基因结构不完全相同。,二、质粒,质粒 (plasmid)指细菌细胞染色体以外,能独立复制并稳定遗传的共价闭合环状DNA分子,(一)质粒的结构及理化性质,环状双链超螺旋DNA分子 分子量4 1061 108
4、D 可发生构象变化,出现超螺旋、半开环、线状三种构象 具有较强的抗切割和抗变性的能力,(二)质粒的命名与分类,命名:用p代表质粒,后面用两个大写字母代表作者或实验室名称及编号。如pUC118 分类:可根据复制机制、功能、转移方式、大小以及对宿主的依赖程度不同进行分类。,(三)质粒的生物学特性,可移动性; 自我复制的能力; 携带筛选标记(抗药性基因、营养缺陷型基因、抗重金属基因、抗紫外线X射线抗性基因); 不相容性。,pBR322 质粒物理图谱,三、可移动的DNA序列,定义:又称转座因子(tranposable element)或转座元件。是一类在细菌染色体、质粒或噬菌体之间自行移动并具有转位特
5、性的独立DNA序列。是基因重组的一种方式。 分类:可分为三类,插入序列,转座子,可转座的噬菌体,(一)插入序列,插入序列(insertion sequence,IS): 具有转座能力的简单遗传因子,长度一般小于2kb。 IS因子只含有与转座有关的基因与序列。共同特征是在其末端都具有一段反向的重复序列(IR)。,(二)转座子,转座子(transposons): 每个转座子都带有3个基因:一个是编码对氨苄青霉素抗性的内酰胺酶(-lactamase)基因,其它二个是编码与转座作用有关的基因(TnpA和TnpR)。,(三)可转座的噬菌体,可转座的噬菌体(transposable phage): 是一类
6、温和型噬菌体,如Mu噬菌体。,(四)转座子的遗传效应,引起突变 引入新的基因 基因重排,第二节,病毒基因组,病毒的生物学特性,结构简单,不能独自复制 依赖宿主细胞完成复制 完整的病毒颗粒由核酸和蛋白质组成,一、病毒基因组特征,分子较小,一般为1.51033.6106,基因数少; 每种病毒只含一种核酸(RNA或DNA),可为双链或单链、环状或线性; 核酸分正链和负链,与mRNA序列一致的为正链,与mRNA序列互补的为负链; 反转录病毒(逆转录病毒)是一类特殊类型的单链正链RNA病毒,含有RNA指导的DNA聚合酶,能使RNA反转录生成DNA。,一、病毒基因组特征,基因组中有基因重叠现象,能携带较多
7、的遗传信息; 有操纵子结构和相关基因丛集; 感染真核细胞的病毒基因内部含有内含子; 少或无重复序列; 基因组中编码序列占90%以上; 基因组多为单倍体; 含有不规则结构基因,病毒基因组结构,二、几种典型的病毒基因组,SV40病毒基因组: 又称为猴猿病毒40, 分离于猴肾细胞。 双链环状DNA。 引起细胞空泡变性 或诱发肉瘤。 是分子病毒学研究 的工具。,SV40病毒转录后加工,二、几种典型的病毒基因组,腺病毒基因组: 线状双链DNA 全长36kb 含轻链(L链) 重链(H链),5均与蛋白质结合 L链与H链可分开自行成环,二、几种典型的病毒基因组,乙型肝炎病毒基因组: 双链环状DNA 两条链长度
8、不等, 长链为负链L(); 短链为正链S(+) 正、负链5为粘性末端,HBV DNA复制周期,二、几种典型的病毒基因组,HIV病毒基因组: 含两条相同的正链RNA 5端、3端各有一LTR,HIV复制过程,二、几种典型的病毒基因组,丙型肝炎病毒基因组: 单链正链RNA病毒,链长约9.5kb 整个基因组只有一个ORF,编码3011或3010个氨基酸 5有一长度和序列非常稳定的保守序列(非编码区UTR),由324341nt组成,是临床诊断的靶序列。,第三节,真核生物基因组,一、真核基因组一般特征,分细胞核基因组和细胞核外基因组 细胞核基因组含有两份同源基因组(二倍体) 核外基因组可有多个拷贝 基因组
9、庞大,但非编码序列占90%以上 转录产物为单顺反子 细胞核基因组存在重复序列 基因是不连续的断裂基因 线性双链DNA分子,眼型复制模式,真核生物基因结构,(一)单顺反子结构,单顺反子(monocistron) 一个结构基因经过转录生成一个单顺反子mRNA分子,翻译成1条多肽链。,(二)断裂基因,断裂基因(split gene) 真核细胞的结构基因内部大多由不连续的几个编码序列所组成,之间插入非编码的间隔序列(intervening sequences)。 真核生物基因之间存在非编码区,称为间隔区DNA(spacer DNA),是结构基因彼此分开。,内含子与外显子,1.内含子(intron):是
10、结构基因的非编码序列,与编码序列间隔排列。 2.外显子(exon):是结构基因的编码序列。基因转录后,剪去内含子,拼接外显子成为成熟的mRNA,(三)重复序列,高度重复序列,在真核生物基因组中普遍存在,约占10%60%,占人类基因组约20% 重复频率达106以上 重复片段10300bp 复性速率高 可为反向重复序列或顺向重复序列,反向重复序列,指两个顺序相同的拷贝在DNA链上呈反向排列,其间可间插间隔顺序或无间隔顺序(又称回文结构),与基因表达调控有关。,反向重复序列,反向重复序列复性时,形成十字结构,串联重复序列,指固定的重复单位头尾相连形成重复顺序片段 重复单位多为27bp组成 与主体DN
11、A的碱基组成不同,用CsCl2密度梯度离心,可在主带的两侧出现小带,称为卫星DNA。,卫星DNA,卫星DNA,大卫星DNA:根据浮力密度不同可分为、和、卫星DNA 小卫星DNA:位于端粒及端粒附近,显示丰富的限制性片段长度多态性 微卫星DNA:重复单位25bp,重复1060次,重复总长度150bp,存在于内含子、间隔DNA以及编码区中。目前已成为DNA分析的遗传标记。,高度重复序列的主要功能功能,参与复制水平的调节:反向重复序列常位于DNA复制起始点附近,是蛋白质和酶的结合点。 参与基因表达调控:反向重复序列可形成发夹结构,转录到hnRNA分子中可稳定RNA分子免遭降解。 参与转位作用:转位因
12、子的末端包含反向重复序列。 可作为DNA指纹反映个体特征。 与染色体构象、着丝粒形成有关,中度重复序列,重复序列重复数十数万次 复性速度介于高度重复序列与低度重复序列之间 大多不编码蛋白质,但中度重复序列有一部分是结构基因,如HLA、rRNA 、tRNA、组蛋白、免疫球蛋白等结构基因 一般具有种属特异性,可作为DNA标记。,低度重复序列,低度重复序列中在单倍体基因组中只出现一次或数次 占基因组50%80% 复性速度慢 贮存大量遗传信息,(四)基因家族,基因家族(gene family): 是指核苷酸序列或编码产物的结构上具有一定程度同源性的一组基因。同一家族的基因成员由同一祖先基因进化而来。,
13、核苷酸序列相同,如tRNA基因。基因家族成员成簇分布在一条染色体上,同时发挥作用。 核苷酸序列高度同源,如珠蛋白基因家族。可散在地分布于不同的染色体上,编码一组功能相关的蛋白质。 编码的蛋白质高度同源,但核苷酸序列不同,如src癌基因家族。其产物均有250个氨基酸序列的同源蛋白激酶结构域。,基因家族的特点,是由一组多基因家族及单基因家族组成的更大的基因家族。它们的结构有程度不同的同源性,但起源于相同的祖先基因。如免疫球蛋白基因超家族。,超基因家族(gene superfamily),在多基因家族中,某些与正常功能基因在核苷酸序列上相似,但不能转录或转录后生成物功能基因产物的DNA序列称为假基因
14、。用表示。 假基因原来也是有功能的基因,由于发生缺失、倒位、点突变等,成为无功能基因。可能为进化的痕迹。,假基因(pseudogene),(五)端粒,端粒是位于染色体3末端的一段富含G的DNA重复序列,端粒和端粒结合蛋白组成核蛋白复合物,广泛存在于真核生物细胞中,具有特殊的功能。,(六)DNA多态性,基因组中某个基因在同种生物的不同个体中,同时存在两种或以上的变异型或基因型的现象,称为基因多态性(gene polymorphism)。,限制性片段长度多态性 (restriction fragment length polymorphism,RFLP),分为两类: 一类是由于限制性内切酶位点上发
15、生了单个碱基突变,导致酶切位点的丢失或获得 一类是由于基因内部发生缺失、插入、串联重复序列拷贝数变化,导致酶切位点的相对位置发生改变。,短串联重复序列 (short tandem repeat, STR),分布广泛,每隔1520kb就有一个STR位点,占基因组的10%, 具高度多态性,是非常重要的遗传标记 主要用途:制作人类基因遗传图谱的;目的基因筛选;个体识别和亲子鉴定;基因诊断,STR与疾病的关系,STR主要以三个核苷酸为重复单位,重复次数超过正常个体的上限,即可出现一些遗传性疾病。 脆性X综合征:5非翻译区CCG拷贝数过度增加100次。(正常人中的CGG重复次数60次 Friedreic
16、h共济失调症:内含子CAA拷贝数过度增加 霍亭顿舞蹈病:编码区CAG拷贝数过度增加所 强直性肌营养不良:3非翻译区CTG拷贝数过度增加 肿瘤病人中STR不稳定。,单核苷酸多态性 (single nucleotide polymorphism,SNP),指单个碱基的变异引起的DNA序列多态性,即在特定的核苷酸位置上存在两种不同的碱基,其中最少的一种在群体中的频率不小于1%,常出现C转变为T。 主要用途:疾病的连锁分析与基因的定位(以STR用作遗传标记);指导用药和药物设计;用于进化和种群多样性的研究。,二、核外基因组特征,核外基因组包括:线粒体、叶绿体 能独立复制和表达 线粒体基因组DNA(mt
17、RNA)为双链环状超螺旋结构,主要编码rRNA、tRNA和与细胞氧化磷酸化有关的蛋白多肽链 具有独特的遗传特征,线粒体基因组的遗传特性,母系遗传 突变率高 遗传密码与通用密码不完全相同 mtDNA突变与一些疾病发生密切相关,第四节,人类基因组计划,一、人类基因组的特点,大小:单倍体基因组约为3.2109bp。 结构基因数量:仅占基因组DNA序列的1.5%。约3.5万个基因 存在大量的非编码序列:高度重复序列、内含子、间隔区DNA 富含CpG顺序,称为CpG岛。常位于转录调控区,其甲基化后可致基因表达沉默 具DNA多态性:RFLP、STR、SNP,甲基化,在甲基转移酶的作用下将C转变为5-甲基胞
18、嘧啶。DNA甲基化与基因表达呈负相关,甲基化的基因表达能力减弱或无表达,非甲基化的基因表达能力增强。DNA的甲基化参与基因的表达调控。,二、人类基因组计划,为一项世界范围内执行的科研项目 实时公布研究成果 实验资源共享 1993年修订的目标:人类基因组的基因图的构建与序列分析;人类基因的定位;基因组研究技术的建立;人类基因组研究的模式生物;信息系统的建立、储存及相关软件的开发等。,(一)人类基因组计划的启动,1985年5月提出“人类基因组计划”草案 1986年3月Dulbecco R在science发表了题为癌症研究的转折点:测序人类基因组的文章,被称为人类基因组计划的“标书”。 1990年1
19、0月美国国会批准美国的“人类基因组计划”,预计15年投资30亿完成 1999年中国获准加入,承担1%测序任务英国30%、日本7%、法国3%,遗传图谱,遗传图(genetic map),又称连锁图(linkage map),是以具有遗产多态性的遗传标记作为“位标”,遗传学距离作为“图距”的基因组图。,连锁的遗传标志之间的遗传学距离是通过计算它们的重组频率来确定的,一般用厘摩(CM)表示,遗传标志,第一代遗传标志:RFLP,在整个基因组中确定的位点数目达到105以上。但提供的信息量有限,并受工作环境和费用等的限制 第二代遗传标志:STR,又称微卫星标志。高度多态性,提供的信息量大,可实现PCR操作
20、自动化,在基因定位中大量应用 第三代遗传标志:SNP,在人类基因组中可达到300万个,平均每1 000个碱基对就有一个,检测不需用凝胶电泳。,物理图谱,物理图(physical map):是用于确定各遗传标记之间的物理距离。 可使用的遗传标记:限制酶酶切位点、已知序列的DNA片段(称为序列标签位点 sequence tagged site,STS)、特征性序列、载体连续克隆重叠群 长度单位:以DNA实际长度(Mb、kb)为图距,以DNA探针的STS序列为路标 主要内容:构建“片段重叠群”,序列图谱,任务:完成总长度30亿个核苷酸组成的人类基因组序列测定 策略:把庞大的基因组分成若干有路标的区域
21、后进行测序分析 基础:序列分子需要用一个区域的DNA片段重叠群使测序工作不断延伸,因此遗传图和物理图是绘制序列图的基础,(三)功能基因组计划,基因组的研究内容 后基因组时代:人类基因组计划的完成 基因组功能研究的开始,结构基因组学:全基因组测序,功能基因组学:基因功能鉴定,转录图谱,转录图谱:就是在人类基因组中鉴别出全部基因的位置、结构和功能 方法:通过基因的表达产物mRNA反向追索基因在染色体上的位置 原理:利用cDNA或表达序列标签(expressed sequence tages,EST)的部分cDNA片段作为探针进行杂交,鉴别出与转录有关的基因,后基因组时代研究热点,系统生物学,系统生
22、物学(systems biology): 是了解一个生物复杂系统中所有组成成分(基因、mRNA、蛋白质、代谢小分子等)的构成以及在特定条件下这些组分间的相互关系,并分析该系统在一定时间内的动力学过程。,生物信息学,生物信息学(Bioinformatics): 是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学和蛋白学。,第四章 蛋白质组与蛋白组学,proteome and proteomics,DNA,mRNA,蛋白质,转录,翻译,基因,蛋白质,细胞特异性基因表达,生理状态,蛋白质相互作用,温度,应激状态,培
23、养条件,药物作用,数量有限,结构相对稳定,复杂性,多变性,直接反应生命现象,复杂的调控,蛋白质组(proteome),概念:意指“proteins expressed by a genome”,即“一个细胞或一个组织基因组所表达的全部蛋白质”。这是一个在时间和空间上动态变化着的整体。,蛋白质组 protein + genome proteome 一种基因组所表达的全部蛋白质 一个细胞或一个机体的基因所表达的全部蛋白质,蛋白质组与基因组的差别,蛋白质组随着组织、甚至环境状态的不同而改变。在转录时,一个基因可以多种mRNA形式剪接,并且,同一蛋白可能以许多形式进行翻译后的修饰。故一个蛋白质组不是一
24、个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目。,蛋白质组学(proteomics),概念:是指应用各种技术手段来研究蛋白质组的一门新兴学科. 目的:从整体角度分析细胞内动态变化的蛋白质组成成分;表达水平(定量);蛋白质结构及修饰状态(三维结构、活性部位);蛋白质之间的相互作用(蛋白质网络),功能蛋白质组学 ( functional proteomics),功能蛋白质组指细胞在一定阶段或与某一生理现象相关的所有蛋白质,这一群体可大可小,最终将多个功能亚群体组合起来,逐步描绘出接近生命细胞的“全部蛋白质”的蛋白质组图谱。 目前,蛋白组学的研究主要把目标定位在功能蛋白质组学,蛋
25、白组学研究的意义,(1)生命现象的发生往往是多因素影响的,必然涉及到多个蛋白质。 (2)多个蛋白质的参与是交织成网络的,或平行发生,或呈级联因果。 (3)在执行生理功能时蛋白质的表现是多样的、动态的,并不像基因组那样基本固定不变。 因此要对生命的复杂活动有全面和深入的认识,必然要在整体、动态、网络的水平上对蛋白质进行研究。,蛋白组学研究的特点,整体性:基因组表达的全部蛋白质;各种蛋白质其各自功能的发挥依赖于整体性;研究的策略要求整体性。 动态性:同一机体的不同组织和细胞、不同发育阶段;机体在不同生理和病理状态下的表达差异。 复杂性: mRNA的转录水平并不能代表蛋白质表达水平;蛋白的多样性和复
26、杂性更多体现在翻译后修饰。,蛋白组学研究的内容,蛋白质组学集中于动态描述基因调节,对 基因表达的蛋白质水平进行分离、分析与鉴定、蛋白质结构分析、生理与病理状态或不同发育阶段蛋白质组表达差异的研究,解释蛋白质功能调节的机制。,蛋白质组及其质点的分离与纯化,一、分离纯化,二、分析鉴定,蛋白质组学研究技术路线,第一节,蛋白质组 分离分析技术,一、蛋白质分离纯化的一般程序,生物体组织细胞,离心技术,盐析法,亲和层析,凝胶层析,离子交换层析,电泳法,纯化蛋白,材料选择,细胞破碎,有机溶剂沉淀法,等电点法,(一)蛋白质样品的制备,匀浆组织:组织匀浆后不同细胞类型的蛋白质混杂在一起,最后得到的研究数据根本无
27、法解释蛋白质在每类细胞中的表达情况,因此其研究结论值得怀疑。 培养细胞:可以得到单一类型细胞,但体外培养很难模拟体内细胞的环境,因此其结论也很难用于解释体内实际情况。 LCM技术粘取细胞:能从复杂组织中选取特定的单一细胞用于研究,客观地反映发生在生物细胞中的真实变化。,LCM技术,LCM称激光显微捕获系统,其核心是用 近红外激光熔化一种特殊的胶膜来粘取细 胞。能从复杂组织中选取特定的单一细胞 用于研究,使分子生物学的研究更加准确 ,精细,客观地反映发生在生物细胞中的 真实变化。,(二)盐析法,根据不同蛋白质在一定浓度的盐溶液中溶解度降低程度的不同而达到彼此分离的方法 盐析(salting in
28、):蛋白质在低盐浓度下的溶解度随着盐浓度的升高而增加。这是由于少量盐类离子与水分子影响蛋白质分子上的极性基团,使其溶解度增大。 盐析(salting out):当盐浓度增加到一定程度时,蛋白质表面的电荷被大量中和,水化膜被破坏,蛋白质分子相互聚集而沉淀析出。,(三)电泳技术,原理:利用蛋白质分子所带电荷不同或分子大小及形状不同,在外界电场的作用下,蛋白质带电粒子在电场中具有不同的泳动速率而进行的分离。 电泳介质:聚丙烯酰胺凝胶、缓冲液 电泳类型:板状或管状聚丙烯酰胺凝胶电泳/毛细管电泳;分析型凝胶电泳/制备型凝胶电泳,(四)层析技术,又称分子筛层析 是根据分子大小分离蛋白质混合物的最有效方法之
29、一 常用的分子筛填充物:葡聚糖凝胶、琼脂糖凝胶。凝胶颗粒形成不同交联度的网状结构。 分离原理:不同分子大小的蛋白质在重力作用下通过凝胶颗粒,不能进入“网眼”的大分子蛋白由于路径较短首先被洗脱出来;小分子蛋白能进入“网眼”路径较长则后被洗脱出来。,凝胶过滤层析,填充剂:离子交换树脂(剂),分为阴离子交换剂(带正电荷,能结合阴离子)、阳离子交换剂(带负电荷,能结合阳离子) 原理:带电荷的蛋白质由于所带电荷数不同,对交换剂的亲和力出现差异,通过离子交换与洗脱,使不同的离子先后被洗脱下来,达到分离的目的。,离子交换层析:,原理:利用生物大分子具有与其结构相对应的分子(酶-底物、抗原-抗体、配体-受体、
30、生物素-亲和素等)发生可逆性特异结合的特性达到专一的分离。 固定相:结合有亲和物的不溶于水的固相支持物 流动相:含有与亲和物匹配的待分离物缓冲液。先用流动相洗去杂质,再用特殊流动相解离待分离蛋白。,亲和层析:,第二节,蛋白质组 鉴定分析技术,(一)Western印迹杂交,基本操作步骤: 蛋白样品的制备 SDS聚丙烯酰胺凝胶电泳 蛋白质的电转移 蛋白质与抗体的结合反应 目标蛋白质的显示,western 印迹基本步骤图示,(二)双向凝胶电泳 (two-dimensional gel electrophoresis,2-DE),双向电泳技术是蛋白质组研究中最有效的分析鉴定技术之一 。它是由O Far
31、rells于1975年首次建立并成功地分离约1 000个E.coli蛋白,并表明蛋白质谱不是稳定的,而是随环境而变化。目前,随着技术的飞速发展,二维电泳技术已能分离出10 000个斑点(spot)。,双向电泳原理,由两向电泳组成 第一向是以蛋白质电荷差异基础进行分离的等电聚焦凝胶电泳 第二向是以蛋白质分子量差异为基础的沿垂直方向进行的SDS-聚丙烯酰胺凝胶电泳。,2-DE 技术原理,等电聚焦凝胶电泳 (isoelectric focusing gel electrophoresis,IEF),在等点聚焦过程中,载体两性电解质在电场中形成正极为酸性、负极为碱性的连续pH梯度。带电荷的蛋白分子在连
32、续pH梯度中电泳,当蛋白质迁移到其等电点位置时,净电荷为零,在电场中不再移动,由此可分离各种不同等电点性质的蛋白质。,固相pH梯度等电聚焦 (immobilized pH gradients isoelectric focusing,IPG-IEF),1988年Gorg A建立的一种新型等电聚焦凝胶电泳 所用介质为具有弱酸或弱碱性质的丙烯酰胺衍生物,为一种固定化电解质,在凝胶聚合时形成pH梯度,不随环境电场的改变而改变 比传统的IEF具有更高的分辨率(可达0.001pH),上样量大,预制的商品化IPG胶条易于自动化操作、结果重复性好,SDS-聚丙烯酰胺凝胶电泳,十二烷基硫酸钠(SDS)是一种阴
33、离子去污剂,能与蛋白质的疏水基团相结合,从而使蛋白质获得大量的负电荷,消除了电荷效应,使电泳迁移率只与分子的大小有关,2-DE分析的基本步骤,蛋白质 溶解 变性 还原 去除蛋白 质杂质,利用不同 pK固定化 电解质配 置不同pH 范围的凝 胶 利用软件 设计配置,第一相电泳 (IPGIFE) 平衡 第二相电泳 (SDSPAGE),考马斯亮 蓝染色 银染色 铜染色,样品制备,IPG胶制备,双相电泳,染色,双向电泳的样品制备,样品的预处理涉及: 溶解、变性和还原以完全破坏蛋白间的相互作用; 除去如核酸等非蛋白物质; 使用蛋白酶抑制剂,以保持蛋白质不被蛋白酶水解;,第一向等电聚焦电泳,商品化IPG胶
34、条的选择 大小选择:厚宽长=0.5 3 3mm (或11、13、18mm等) pH范围选择:310;47;611等 宽pH胶带分辨率差一些,用于初筛 窄pH胶带分辨率较高,上样量也较大,用于蛋白质更精确的分离和分析 特殊胶带选择:偏酸偏碱的蛋白质,第二向SDS凝胶电泳,电泳凝胶的选择: 第二向电泳之前应用第二向电泳缓冲液平衡第一向电泳IPG胶带 根据蛋白质分子量的大小选择合适的凝胶浓度 为了获得高分辨率可以加大凝胶的面积,蛋白质染色,考马斯亮蓝染色:利于图谱分析,但敏感性较低 银染色:灵敏度高,分辨率好,但染色深浅与蛋白质量不成比例,不利于图谱分析 荧光染色:应用两种不同的染料荧光标记两个样品
35、,使在同一凝胶上电泳后的凝胶图象为两个,避免了几种2-DE的比较,可在纳克级进行检测 放射性标记:不依赖其代谢的活性,仅适于对合成的蛋白质检测 有机染料:不适合PVDF膜,考马斯亮蓝染色,银染色,银染色显示蛋白斑点,2-DE的不足,极酸、极碱性蛋白质,疏水性蛋白质,极大、极小蛋白质,低丰都蛋白质难以有效分离;胶内酶解过程费时费力,难以与质谱联用实现自动化。,(三)非凝胶分离技术,液相色谱法、毛细管电泳技术简化了蛋白质分离步骤,可与质谱联用实现自动化,(四)图像分析技术 (Image analysis),应用2-DE图像分析软件包进行分析,包括:图像采集、斑点检测、背景消减、图像比较 摄像或扫描
36、将满天星状的蛋白质分离图谱转换为以像素为基础的,具有不同灰度强弱和一定边界方向的斑点数字信号 数据库构建及数据处理:获取蛋白质斑点的上调/下调;出现/消失的信息,2-DE图像分析软件包操作过程:,图像采集,斑点检测,背景消减,获得蛋白质相关信息,图像内及图像间的比较,图像采集,摄像或扫描将满天星状的蛋白质分离图谱转换为以像素为基础的,具有不同灰度强弱和一定边界方向的斑点数字信号,背景消减,使有意义的区域与背景分离,精确限定斑点的强度、面积、周长和方向。 多数系统以控制斑点的重心或最高峰来分析,边缘检测的软件可精确描述斑点外观,并进行边缘检测和邻近分析,以增加精确度。 通过阈值分析、边缘检测、销
37、蚀和扩大斑点检测的基本工具还可恢复共迁移的斑点边界。,图像比较,IPG技术的出现使斑点配比变得容易,较大程度的相似性可通过斑点配比向量算法在长度和平行度方面进行观测。 用来配比的著名软件系统包括Quest,Lips,Hermes,Gemini等。 计算机方法如相似性、聚类分析、等级分类和主要因素分析已被采用,2-DE获得的蛋白质图谱,(五)蛋白质微量测序 (micro-sequencing),传统的 N-末端Edman降解是进行鉴定的主要技术。目前已实现蛋白质微量测序的自动化。 首先使经凝胶分离的蛋白质直接印迹在PVDF(聚偏氟乙烯) 膜或玻璃纤维膜上,染色、切割,然后直接置于测序仪中进行蛋白
38、质鉴定。 Edman降解缓慢、试剂昂贵,不适合分析成百上千的蛋白质。,Edman降解法是用异硫氰酸苯酯在弱碱条件下与肽段N端-氨基结合生成苯氨基硫甲酰肽(PTC-肽),然后在酸性条件下经环化、水解处理,生成苯乙内酰硫氨基酸(PTH-aa) 和失去原N-端氨基酸的肽。剩下的肽可反复进行上述处理,依次生成各种PTH-AA,经层析鉴定就可从N-端开始确定被测肽段的氨基酸排列顺序。,N-末端Edman化学降解法 测序原理,(六)质谱技术 (mass spectrometry),质谱技术原理 质谱技术是将样品分子离子化后,根据不同离子间的质量、电荷比值(m/z)差异来确定相对分子质量的技术。 可大规模自
39、动化的进行蛋白质鉴定。,Ion source,Ion separator,detector,离子资源: 底物变成离子气 质量分析: 根据质量/电荷 (m/z) 检测: femtomole attomole (10-15 10-18 mole),“软电离” 技术,80年代末随着“软电离” 技术的出现,质谱才真正用于生物大分子的鉴定。 所谓“软电离” 是指样品分子电离时保留整个分子的完整性不形成碎片离子。 “软电离”技术灵敏度高、快速、能同时提供样品的精确分子质量和结构信息,既可定性又可定量。 电喷雾离子化(ESI)、基质辅助激光解吸离子化是目前应用的主要方法。,离子化源和质量分析器为两个主要的部
40、件,进样系统按电离方式的需要,将样品送入离子源的适当部位; 离子源用来使样品分子电离生成离子,并使生成的离子会聚成有一定能量和几何形状的离子束; 质量分析器利用电磁场(包括磁场、磁场和电场的组合、高频电场、和高频脉冲电场等)的作用将来自离子源的离子束中不同质荷比的离子按空间位置,时间先后或运动轨道稳定与否等形式进行分离; 检测器用来接受、检测和记录被分离后的离子信号。,常用的离子化源,电喷雾离子化electrospray ionization,ESI 气化后的样品分子进入离子化室后,受到由钨或铼灯丝发射并加速的电子流的轰击产生正离子。有较好的重现性。 基质辅助的激光解吸离子化(MALDI) 将
41、溶于适当基质中的样品涂布于金属靶上,用高强度的紫外或红外脉冲激光照射实现样品的离子化。,常用的质量分析器,飞行时间质谱(time of flight-MS) 四极杆质谱(),常见离子化源与质量分析器的组合,商品化的 MALDI-Tof,Microflex , Bruker,Voyager DE-PRO, ABI,MALDI micro, Micromass,MALDI-TOF 质谱仪原理,两种主要类型的 MALDI-TOF,图像分辨率的增强,MALDI-Tof 的典型结果,MALDI-TOF检测的多肽指纹,ESI 四极质谱原理,Nano electrospray: 30 min spray t
42、ime for 1 mL sample Highly charged molecules are selected by ac modulation of transverse fields,四极质谱过滤,鉴定和注释蛋白质的路线,通过肽质谱指纹图(peptide mass fingerprinting,PMF)和数据库搜寻匹配 通过测出样品中部分肽段二级质谱信息或氨基酸序列标签和数据库搜寻匹配,ESI Quadrupole MS 的典型结果,3倍 四极质谱分析仪,CID: Collision Induced Dissociation for acquiring Molecular weight
43、 and Structural information,Q-TOF 质谱分析仪,CID 片段的命名法,CID 质谱,商品化的 LC/MS/MS,API 4000, API,Q-Tof ultima API, Micromass,HCT plus, Bruker,LC/MS/MS解释的结构信息,Peptide sequence Post translational modifications Proteolytic processing, truncation Trypsin, Endoproteinase mapping Acylation Missing of N-terminal pept
44、ide Phosphorylation Differential mapping /phosphatase treatment Fe 3+ -loaded IMAC column Glycosylation Neuraminidase treatment,质谱仪的特点,MALDI-TOF,仪器类型: TOF 分析仪 样品状态: 固态. 优点: (1) easy (2) fast (3) high-through (4) sensitive. 缺点: (1) only fingerprint of protein, no sequence information (2) results is h
45、ighly dependent on sample quality.,(LC) -tandem MS:,仪器类型: (1) 三倍四级质谱仪 (2) Ion trap (3) Q-TOF 样品状态: 液态 优点: (1) de novo sequencing data available. (2) high sensitivity 缺点: (1) Lower through put (2) pricey,质谱技术在蛋白组学研究中的应用,蛋白质的序列分析 通过串联质谱(tandem-MS)实现 研究蛋白质修饰 磷酸化 糖基化 N-端封闭,(七)蛋白质分子结构分析,溶液中蛋白质分子结构分析方法 磁共
46、振(nuclear magnetic resonance,NMR)、圆二色谱法、激光拉曼光谱法、荧光光谱法、紫外差光谱法、氢放射性核素交换法 晶体蛋白分子结构分析 X射线衍射分析法、小角中子衍射法,(八)蛋白质芯片技术,蛋白质芯片技术是一种高通量、平行、自动化、微型化的蛋白质表达、结构和功能分析技术。分为生物化学芯片、化学性芯片、生物反应器芯片三类。,蛋白质芯片,第三节,蛋白质相互作用研究,一、蛋白质相互作用研究方法,酵母双杂交系统(yeast two-hybrid system) 噬菌体表面显示技术(phage display) 基于质谱的蛋白质相互作用研究方法 亲和层析+多维液相色谱耦联质
47、谱技术(MDLC-ESI-MS/MS) 免疫共沉淀耦联质谱技术; 生物传感器耦联质谱技术; 串联亲和纯化耦联质谱技术,酵母双杂交系统,DNA-BD具有与报告基因转录调控区特异结合的功能,DNA-AD则具有活化转录的功能。,报告基因,DNA-BD和DNA-AD分开时不能激活转录,只有当两者在空间上接近时,才能呈现转录因子的活性。 只有当蛋白质X与蛋白质Y间发生相互作用时,才能激活报告基因的转录,而当两者单独作用时均无此功能 。,二、蛋白质-核酸相互作用 研究方法,凝胶滞后实验 滤膜结合法 甲基化干扰试验 DNase足纹分析 核酸-蛋白质杂交实验,凝胶滞后试验,蛋白质可以与末端标记的核酸探针特异性
48、结合,所形成的复合物电泳时在凝胶中的泳动速度比未与蛋白结合的游离探针慢,即表现为相对滞后 该实验可以评价蛋白与核酸结合的特异性,滤膜结合法,利用硝酸纤维素滤膜不能结合双链DNA,但可与蛋白质结合的特性,将与蛋白质结合的DNA片段与游离DNA片段分离开。,甲基化干扰,将DNA 甲基化后与蛋白质进行反应,只有在结合位点上未被修饰的DNA 片段才能与蛋白质结合。 用特殊方法将DNA从被修饰的碱基处进行切割,并经电泳分离。 未结合蛋白质的DNA可在随机修饰的位点被切割,而结合蛋白质的DNA在结合位点上未被修饰而不能被切割,由此可获得蛋白质与核酸定位结合的信息。,DNA探针的末端标记 及探针的甲基化,蛋
49、白质与甲基化探针的结合及 DNA蛋白质结合探针的分离,结合物及对照探针 的化学切割,DNA片段的序列测定,DNase足纹,目前广泛用于蛋白质精确结合位点的研究方法 原理: DNase可以随机水解核苷酸中的磷酸二酯键,将DNA切成单核苷酸,而结合有蛋白质的DNA免于DNase的水解。,DNase足纹分析原理示意图,核酸-蛋白质杂交实验,TBE缓冲液中DNA蛋白质杂交,放射自显影,用于鉴定蛋白质与DNA的特异性结合和确定结合蛋白质的分子量。 基本步骤:,蛋白质杂交,SDS-PAGE,转移至NC膜或Nylon膜,缓慢复性、封闭、预杂交,加入同位素标记的DNA片段作探针,多次洗膜,第四节,蛋白质数据库及其应用,一、蛋白质组数据库 (proteome database),蛋白质组数据库被认为是蛋白质组知识的储存库,包含所有鉴定的蛋白质信息,如蛋白质的顺序、核苷酸顺序、2-D PAGE、3-D结构、翻译后的修饰、基因组及代谢数据库等,(一)蛋白质序列数据库
链接地址:https://www.31doc.com/p-2973691.html