利用生物信息学方法对基质细胞衍生因子(SDF)进行基因序列和蛋白质序列分析毕业372092.doc
《利用生物信息学方法对基质细胞衍生因子(SDF)进行基因序列和蛋白质序列分析毕业372092.doc》由会员分享,可在线阅读,更多相关《利用生物信息学方法对基质细胞衍生因子(SDF)进行基因序列和蛋白质序列分析毕业372092.doc(45页珍藏版)》请在三一文库上搜索。
1、利用生物信息学方法对基质细胞衍生因子1(SDF-1)进行基因序列和蛋白质序列分析毕业论文前 言动 动脉粥样硬化(Atherosclerosis,As)是由多因素所致的血管炎症性疾病,其病变特点之一是动脉粥样硬化斑块部位有炎症细胞的浸润,巨噬细胞源性泡沫细胞是动脉粥样硬化早期的重要事件。实验报道,动脉粥样硬化病变部位的趋化因子较正常高。 趋化因子是由不同类型的细胞分泌的低分子量(8-10KD) 的与白细胞趋化和激活有关的蛋白质。到目前为止已发现50多种,按照NH2-半胱氨酸基序的不同,可将趋化因子分为4个亚家族,即C、CC、CXC和CX3C。趋化因子受体是GPCR(G-protein-coupl
2、ed receptors)超家族成员,是一族与G蛋白偶联的、具有7个疏水的跨膜结构的受体。它广泛表达于各类淋巴细胞、内皮细胞、神经元等。趋化因子在动脉粥样硬化发生中起着主导作用,针对趋化因子及其受体的干预药物,应用于动脉粥样硬化的治疗将有着诱人的前景。基质细胞衍生因子-1(stromal cell-derived factor-1 alpha, SDF-1)及其特异受体CXCR4在胚胎发育、肿瘤细胞迁移及介导免疫缺陷病毒(HIV) 感染中发挥重要作用,最近又在动脉粥样硬化斑块中发现SDF-1高表达,SDF-1/CXCR4与动脉粥样硬化的关系已经引起重视,从生物信息学角度对其进行分析有重要的意义
3、。生物信息学主要是利用生物学数据库,运用计算机、网络及生物学软件,对海量生物原始数据进行基因组序列注释,以作为科研的实验依据。从生物信息学研究的角度出发主要有三大类方法可用于大通量的基因组功能注释工作: 用最大相似的同源基因的功能注释咨询序列; 用模体(MOTIF) 搜索,因为模体往往是功能相关的保守序列; 直系同源簇方法 (cluster of orthologous group, COG),即用不同种族的基因成对相似聚类法把它们划分成各种直系同源簇,从而可以用同一簇中的已知基因注释未知基因。同时结构基因组的研究使得三维结构模建和结构类的识别成为基因组功能注释的一个重要方面13。 我们选择该
4、序列进行研究。从核酸和蛋白质两个方面对SDF-1进行详尽的生物信息学分析。核酸分析方面主要分析其核酸序列的基本性质,如限制性酶切位点,基因组在染色体上的定位。蛋白质分析方面,首先分析SDF-1序列的基本性质,包括氨基酸组成、分子量、等电点、亲疏水性、蛋白酶切位点、信号肽,分析其二级结构和三级结构,重点分析其保守结构、模体(motif),分子立体结构的裂口和穴,A、B链间的相互作用,配基,多重序列比对,进化分析等。 研究目的:通过以上过程,搜寻并整理网上储存的SDF-1信息,进一步熟练巩固生物信息学课程的理论与实践知识,熟练操作Bioedit、DNAMAN等生物信息学分析软件,为生物信息学课程建
5、设提供和补充新的血液,并以SDF-1为入口,学习与研究生物信息学方面的前沿知识和更新后的软件操作,得到SDF-1基因和蛋白方面的资料,配合正在开展的对SDF-1 基因的研究,分别从氨基酸序列和空间构象入手搜寻SDF-1的相似分子,为进一步研究该基因的调控及以此为靶点的药物筛选收集信息,并从分子水平分析SDF-1分子结构与功能的关系,重点研究其趋化功能相应的分子结构。一、 生物信息学分析(一)工具与方法采用Bioedit7.0和DNAMAN3.0分析软件工具和在线有关蛋白质和核酸方面的分析软件,分别进行核酸和蛋白质两个方面的分析。核酸分析首先从pubmed核酸数据库中搜索到人的SDF-1A链核酸
6、序列,分别进行序列的基本性质分析,限制性酶谱分析及其基因在染色体上的定位分析。具体操作方法将根据上述各个软件上“Help”文件进行,基因在染色体上的定位分析根据网页上的操作说明进行。从pubmed蛋白质数据库中搜索到人的SDF-1A链、B链和整个前体SDF-1蛋白质序列,分别进行蛋白序列的基本性质分析(氨基酸组成、分子量、等电点),亲疏水性分析,蛋白酶切位点分析,信号肽序列分析,二级结构和三维结构分析,同源序列和进化分析。二级结构分析包括结构功能域、Motif、保守位点、AB链间的相互作用及离子配基等,具体操作方法将根据上述各个软件上“Help”文件和网页上的操作说明进行。(二)结果 PDB入
7、口从下表可见,人的SDF-1有“a”、“b”两条链,其可形成2具体,但它的活性形式为单链,通常讲的SDF-1就是指其“a”链。另外表中还有PDBid(1a15)及系统入口编号(P48061)。PDB Id:1a15Name:ChemokineTitle:Sdf-1alpha Structure:Stromal derived factor-1alpha. Chain: a, b. Synonym: sdf-1. Engineered: yes. Mutation: n33aSource: Synthetic: yes. Homo sapiens. Human. Other_details: c
8、hemically synthesizedUniProt: Chains A, B: P48061 (SDF1_HUMAN) Pfam表1.SDF-1蛋白数据库入口1核酸序列分析 SDF-1的核酸序列的基本性质分析:分析结果显示:我们获得SDF-1cDNA序列长度为279bp,其分子量为:ssDNA:84.55KDa,dsDNA:169.70KDa.四碱基的含量分别为:A: 26.16%,C: 21.86%,G: 29.39%,T: 22.58%.ORIGIN 1 ccatggacgc caaggtcgtc gctgtgctgg ccctggtgct ggccgcgctc tgcatcagtg
9、 61 acggtaagcc agtcagcctg agctacagat gcccctgccg attctttgag agccatgtcg 121 ccagagccaa cgtcaaacat ctgaaaatcc tcaacactcc aaactgtgcc cttcagattg 181 ttgcaaggct gaaaagcaac aacagacaag tgtgcattga cccgaaatta aagtggatcc 241 aagagtacct ggacaaagcc ttaaacaagt aagcacaaca gcccaaagga cttDNA molecule: Length = 279 b
10、ase pairsMolecular Weight = 84555.00 Daltons, single strandedMolecular Weight = 169700.00 Daltons, double strandedG+C content = 51.25%A+T content = 48.75%Nucleotide Number Mol% A 73 26.16 C 61 21.86 G 82 29.39 T 63 22.58图2-1 SDF-1cDNA的碱基组成 限制性酶切分析 限制性酶切分析是分子生物学实验中的日常工作之一。 利用DNAMAN软件分析该基因cDNA序列的限制性内切
11、酶的酶切位点,分析结果如下:该基因序列含有24种限制性内切酶的酶切位点(这24种限制性内切酶为TspDTI、MwoI、Bpu10I、AgeI、HpyF10VI、BseMII、BspCNI、BsaWI、BsrFI、BceAI、Cac8I、ApoI、BbvI、HphI、BssHII、HgaI、AlwI、PstI、SfcI、Hpy188III、HaeII、AclI、AfeI、DraI)。同时,从图(2.2)中我们获得了这些内切酶在SDF-1基因上的具体酶切位点。Restriction Enzyme Map:1 ATGAACGCGAAAGTGGTGGTGGTGCTGGTGCTGGTGCTGACCGCG
12、CTGTGCCTGAGCGATGGCAAACCGGTGAGCCTGAG 801 TACTTGCGCTTTCACCACCACCACGACCACGACCACGACTGGCGCGACACGGACTCGCTACCGTTTGGCCACTCGGACTC 80 TspDTI MwoI Bpu10I AgeI Bpu10I HpyF10VI BsaWI BseMII BsrFI BspCNI BseMII BspCNI 81 CTATCGTTGCCCGTGCCGTTTTTTTGAAAGCCATGTGGCGCGTGCGAACGTGAAACATCTGAAAATTCTGAACACCCCGA 16081 GATAGC
13、AACGGGCACGGCAAAAAAACTTTCGGTACACCGCGCACGCTTGCACTTTGTAGACTTTTAAGACTTGTGGGGCT 160 BceAI HpyF10VI Cac8I ApoI BbvI HphI MwoI 161 ACTGCGCGCTGCAGATTGTGGCGCGTCTGAAAAACAACAACCGTCAGGTGTGCATTGATCCGAAACTGAAATGGATTCAG 240161 TGACGCGCGACGTCTAACACCGCGCAGACTTTTTGTTGTTGGCAGTCCACACGTAACTAGGCTTTGACTTTACCTAAGTC 240 Bss
14、HII HgaI AlwI Hpy188III Cac8I PstI SfcI 241 GAATATCTGGAAAAAGCGCTGAACAAACGTTTTAAAATG 279241 CTTATAGACCTTTTTCGCGACTTGTTTGCAAAATTTTAC 279 Hpy188III HaeII AclI AfeI DraI 图2.2 SDF-1的cDNA限制性酶谱分析(http:/www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=9606&query=) 从NCBI查询SDF-1基因在人类基因组中的定位基因组的定位分析显示,该基因定位在第
15、10号染色体长臂的第一区第一亚区,第2小区内。红色部分CXCL12指示SDF-1基因的具体位置。 图2-3:SDF-1基因定位:红色部分CXCL12指SDF-1 sdf基因表达调控(http:/www.gene- ) 2蛋白质序列分析 利用ExPASy软件包对该基因进行氨基酸组成统计、分子量、等电点等分析(http:/www.expasy.ch/tools/)Compute pI/MW:是ExPASy工具包中的程序,计算SDF-1蛋白质的氨基酸组成统计、等电点和分子量。分析结果显示该蛋白为分子量10665.85Da,pI为9.92,为一碱性蛋白质。SDF-1的A链分子量7835.26Da,pI
16、为10.33(见图3-1,示其等电点和理论分子量,从图中可以清楚地看出不同pH值条件下其所带电荷,pH为10时,其还带正电荷,pH值为10.50时其已经带上了负电荷,故计算得其理论等电点为10.33),为一碱性蛋白质,B链分子量6718.98 Da,pI为9.76,为一碱性蛋白质。SDF1_HUMAN (P48061)DE Stromal cell-derived factor 1 precursor (SDF-1) (CXCL12) (Pre-B cellDE growth stimulating factor) (PBSF) (hIRH) Contains: SDF-1-beta(3-72
17、);DE SDF-1-alpha(3-67).OS Homo sapiens (Human).The computation has been carried out on the complete sequence. Molecular weight: 10665.85 Theoretical pI: 9.92 IEP of FastaSequence from 1 to 67 Isoelectric Point = 10.3329 pH Bound Charge pH Bound Charge 1.00 25.99 14.99 8.00 17.87 6.87 1.50 25.98 14.9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 利用 生物 信息学 方法 基质 细胞 衍生 因子 SDF 进行 基因 序列 蛋白质 分析 毕业 372092
链接地址:https://www.31doc.com/p-2180957.html