书签分享收藏举报版权申诉 / 39

立即下载加入VIP免费专享

当前位置：首页 > 其他 > gromacs文件介绍and一些杂知识要点.pdf

gromacs文件介绍and一些杂知识要点.pdf

上传人：tbuqq

文档编号：5197062

上传时间：2020-02-19

格式：PDF

页数：39

大小：343.11KB

《gromacs文件介绍and一些杂知识要点.pdf》由会员分享，可在线阅读，更多相关《gromacs文件介绍and一些杂知识要点.pdf（39页珍藏版）》请在三一文库上搜索。

1、1 （1）gromacs(GMX) 各种文件格式详细，可以查阅GROMACS 手册第 5 章第 6小节，以下为简要介绍。 CPT 文件：该文件为模拟断点文件（check point，.cpt）。该文件为模拟过程固定时间间隔产生，保存模拟系统所有信息。该文件一部分可以在能量文件（ .edr）找到，一部分可以在双精度轨迹文件（.trr）中找到。如果模拟不幸因为外界条件中断（如断电，模拟人发脾气砸电脑等），可以使用该文件重新在断点处开始模拟，以节省模拟时间。同时也可以依靠该断点文件开始，并延长模拟计算（见tpbconv）。 EDR文件：系统能量文件（energy，.edr）。该

2、文件记录模拟输入文件中定义的能量组的各种相互作用能量等。 EPS 文件：封装文件格式（.eps），并不是 GROMACS 自身文件格式，可以当图片打开。 LINUX系统下一般已经有默认打开程序，WINDOWS 要安装其他打开程序（可以GOOGLE 以下）。GROMACS 的 DSSP 和罗麽占陀罗图等通过xpm2ps 处理后都是这个文件格式。习惯就好。 G87文件：分子坐标文件（.g87）。该文件记录并只记录原子坐标和速度，不含原子序号。并只记录常压强模拟系统的盒子信息。 G96文件：分子坐标文件（.g96）。GROMOS96 程序的分子坐标文件，模拟程序以 15.9的

3、 C 语言格式写入，精度较高，但是会比较大。包含有文件头，时间步，原子坐标，原子速度，以及盒子信息等。 GRO 文件：分子坐标文件（.gro）。GROMACS 的最主要分子坐标文件，明白这个文件，就基本明白使用GROMACS 了。该文件类型的各个文本列字数固定，C语言的写入格式为： “%5d%5s%5s%5d%8.3f%8.3f%8.3f%8.4f%8.4f%8.4f“。具体固定文本列有：残基序号， 5位数；残基名称，5字母；原子名称，5字母；原子序号，5 2 为数；原子坐标三列，X，Y ，Z 坐标各 8位数，含 3个小数位；速度同坐标，速度单位为nm/ps（km/s）

4、。 ITP文件：分子拓扑文件（.itp）。被主拓扑文件（.top）包含的分拓扑文件，一般包含某个特定分子的类型。于主拓扑文件区别有它不引用其他力场文件，同时包含system，molecule 等拓扑字节。 M2P 文件：xpm2ps 程序配置文件，定义输出eps 文件中颜色，字体种类及大小等。 MDP 文件：GROMACS 的模拟配置文件（ .mdp）。该文件所含定义较多，各关键字的含义可以查阅GROMACS 手册。（这是使用GROMACS 进行分子动力学模拟最最最最（10个最）重要的文件，no mdp 文件， no GROMACS 模拟。好好看书，以明白各个关键字的含义

5、。因为它太重要，所以不在此简要描述。 N2T 文件：原子名称及类型对照文件（.n2t）。x2top 程序可以按照原子名称得到该原子的原子类型力场参数，N2T 就是 x2top 程序扫描的数据库，文件很小。文件中文本行有原子名称，原子类型，原子电量，原子质量，该原子与其他原子成键距离等。 NDX 文件：原子索引文件（.ndx）。该文件含原子的序号，当使用 make_ndx 程序生成索引文件时，可以定义不同的原子组，每组名下即是该组所含各个原子的序号。 PDB 文件：分子坐标文件（.pdb）。这个就不用说了（说真的，如果真没有听过这个文件类型的话，看这篇文章有点浪费

6、时间。） RTP 文件：残基力场参数文件（.rtp）。该文件包含常见残基的力场信息，包括残基所含原子，成键种类等。使用pdb2gmx 处理 PDB 文件时，程序按照 PDB 文件信息，在RTP 文件中寻找对应的残基力场信息。 3 TOP 文件：模拟系统的拓扑文件（.top）。该文件就是所谓十分及其著名的系统拓扑文件啦，其包含各个关键字都十分易懂；一般其还包含引用其他力场文件（ #include）。TOP 文件一般由pdb2gmx 产生， grompp 程序生成模拟 TPR 文件时使用。 TPR 文件：模拟打包文件（.tpr）。该文件打包模拟需要各种信息，包括模拟系统

7、，模拟控制等。 TRJ 文件：全精度轨迹文件（.trj）。该文件包含模拟系统模拟各个时间下的原子坐标，速度和受力等。所含帧数频率由MDP 文件控制，文件较大。 TRR 文件：以上同，一般为默认格式。由于所含信息多，可以也EDR 文件一起使用，重新开始模拟程序。 XPM文件：数据矩阵文件（.xpm）。该文件矩阵中每个值即是矩阵点所表示的物理量大小（也可以是布尔值）。该文件其实就是二维图，可以失踪 xpm2ps 转换为图片。 XTC 文件：模拟轨迹单精度文件（.xtc）。单精度轨迹文件，文件较TRR 和 TRJ 小，为常用分析文件。包含模拟系统中原子坐标，模拟时间，和模

8、拟盒子信息。 XVG 文件：二维图标文件（.xvg）。二维画图工具xmgrace 的默认文件，可以使用 xmgrace 打开。（2）Gromacs 中几个特殊文件 aminoacids.dat 该文件保存GMX 默认的蛋白质和核算的默认残基名称。如果计算过程要建立一个新的蛋白质或者核算残基，可以将新的残基名称加到该文件中，并增加文件第一个的整数即可。有时候可以将该文件拷贝到当前工作文件夹进行编辑，以不影响其他计算的命名（GMX 的文件搜索总是从当前目 4 录开始的。） FF.dat GMX 默认力场列表，即 pdb2gmx 处理 PDB 文件时可以选择的立场列表。增加新的力场

9、，可以编辑该文件，并修改文件第一行的整数，使其与力场种类熟目一致。 specbond.dat GMX 处理特殊化学键的文件，特殊化学键包括二硫键，血红素铁原子于其他原子成键等。该文件第一行指明特殊键对的数目，第二行开始即为各个特殊键对的信息，其中第一列为键对第一个残基的名称，第二列为该残基成键原子的名称，第三列为该原子可以成键的数目，第四到第六列为成键另一个残基的信息，第七列为该化学键的平衡长度，此后两列为成键后残基的新名称。 vdwradii.dat 原子范德华半径数据库。使用 genbox 为系统添加水分子，或者使用 genion 为系统添加离子时，各个原子间的距

10、离要大于两个原子范德华半径之和，否则则为原子重叠（3）常见水分子模型进行分子动力学模拟，水分子十分重要，除非选择使用连续介质模型（implictit water model ）。水分子模型较多，选择这些模型要结合使用的力场，并参考别人已经的数据。一下简单介绍几种常见的水分子模型，希望对了解它们有点帮助。按照一般化学常识，水分子由三个原子构成，主要的参数应该有各个原子的质量，电量，氢氧键的长度以及H-O-H 的键角。没有错，最简单的水分子模型就是这些参数都固定的刚性水分子模型。如SPC 模型和 TIP3P 5 模型。这两种模型中，原子质量和电量都在同一个质点上。唯一不同的

11、是 TIP3P 的 H-O-H键角比理论值 109.47小，为 104.52度。这两种水模型只有氧原子具有范德华作用系数，氢原子的范德华系数为0。以上两种模型有对应的改进模型，SPC 的改进模型为SPC/E，起主要改进其实就是使溶液系统的总能量乘以5.22 kJ/mol。这样可以使SPC 溶液属性更加接近实验值。TIP3P 在 CHARMM力场中的改进是给氢原子一定的范德华系数，这样做的结果的计算根据复杂。。（很无奈，因为结果好，所以也没有办法。）由于真是情况下水分子的电量分布并不是完全在原子上的，如氧原子的一部分负电量就在H-O-H 的对角线上，还有两个电子对处在H-

12、O 化学键的延长线上。为了得到更加真实的水分子模型，四个粒子以上的模型就被应用到分子动力学模拟中。其中最著名的有TIP4P 模型。该模型在三个原子中间， H-O-H化学键的对角线上多了一个不含质量，只带电量的点。很多蛋白质模拟计算中，TIP4P 和 OPLS 力场结合使用都得到很好的效果。以上提到，水分子的氧原子在H-O 化学键延长线上有两个电子对，于是有的人就在这两处添加了两个只带电量的粒子。2000年报道的TIP5P 模型，计算结果也很好。还有一些牛人，结合 TIP4P 和 TIP5P ，要研制 TIP6P ，很好很强大。。不得不说，并不是模型的所含粒子越多

13、越好。粒子越多，就算付出越大，因为要计算的相互作用更多（4）力场 “ 力场 ” ，请不要被 “ 场” 这个听起来像是十分高深的物理名词给吓坏了。分子动力学模拟中使用的力场，包含两个重要的部分： 6 1）模拟粒子之间相互作用的方程（即经典力学的相互作用力方程如库仑定律，范德华作用方程等）。 2）方程的参数（即各个不同粒子，原子本身的参数，如带点量等等）。可以想想，模计算机模拟好多成键或者不成键的粒子的运动，总要让它们互相推推拉拉吧，于是力场就是定义它们推推拉拉的方式（按照物理定律）。力场类型，一般分类为三种： i）全原子力场：精确定义每一个原子的参数。 ii）联合原子力场：省

14、略非极性氢原子，同时把其参数整合到与他们成键的相邻原子上（比如甲基，只由一个碳原子表示）。 iii ）粗颗粒力场：进一步精简分子结构的力场参数，种类比较多，比如有讲蛋白侧链看作一个颗粒的力场，或者甚至将整个氨基酸残基看成一个颗粒的力场等等。一般来说力场的方程和参数是自成一个系统的，所以一般不能在一个系统中使用两个力场的参数。更具体的将，同一个原子在力场一中的带电量与起在第二个力场中是不一样的，化学键也一样。一般来讲，也不能特定修改力场中模一个原子的参数，因为原子之间是互相交叠依赖（比如未来保证整个氨基酸残基电量为0，各个原子电量加和必须为0）。但是，这并不是说一定不行

15、，相反的，为了模拟一些不常见的分子，经常需要根据已有的参数（力场里面的，其他论文等）来构建新的分子参数。具体方法可以参考 Mr. Google 等著名老师。目前比较流行的力场有： AMBER ：包含好几个版本的力场，为全原子力场； 7 CHARMM ：全原子力场，是软件CHARMM的一部分； GROMOS ：GROMOS软件使用的力场，版本较多，为联合原子力场； OPLS：包含全原子和联合原子力场两个版本；粗颗粒力场：种类较多，没有固定版本或者种类，一般根据研究需要开发。（5）Gromacs 重启模拟计算以前介绍过如果使用GMX 3.x 重新由于种种原因停止的模拟，以下为

16、 GMX 4.x 下重启模拟的方法。 GMX 4.x 的模拟程序mdrun 较以往版本有不少不同。在模拟过程中， mdrun 按照mdp 文件在一定时间间隔保存一个断点文件（checkpoint file, .cpt 文件），该文件保存了该时刻模拟系统的所有物理量信息。如果由于不可预见原因，模拟中断，则可以使用该文件重新在该时刻开始进行模拟。重启模拟的命令如下： - mdrun -s topol.tpr -cpi state.cpt -append - 以上 state.cpt 文件为最新生产的断点文件（ mdrun 会保存另外一个断点文件： state_prev.cpt，为上一

17、个时刻保存的断点文件，双保险。）使用 “ -append “ 的作用是将模拟输出添加到已有文件中，包括轨迹文件，记录文件，能量文件等，相同帧的信息将被后生产的信息覆盖。当然，也可以继续像GMX 3.x 一样使用tpbconv 生产新的tpr 文件继续模拟，详细请参见旧文或手册。（6）Gromacs 多链模拟进行模拟计算时，如果模拟分子由两条以上的链组成，一般都要明确告诉 8 模拟软件区分两条链。模拟软件一般没有那么聪明，除非明确定义，否则它会把两条以上的化学链（如肽链，DNA ，其他聚酰胺等）看成一条链。在建立模拟文件是，上一条链尾端会于下一条链头部加一个共价化学键（如肽

18、键）。由于该化学键一般很长，开始模拟时系统就“ 爆炸 ” 了。 AMBER 软件在处理这样的问题的，需要编辑原始的PDB 文件，在每一条链结尾处添加“ TER” 。在 GMX 中，这种做法行不通（其实开发人员应该考虑这个问题）。解决的办法要在原始PDB 文件中给每一条链添加链标识符，如 “A” ，“B” 等等。（如果 26 个字母不够用，那就使用数字1 到 9，然后还可以使用特殊字符，如“$“ ，” ￥“ 等等）。这样，使用pdb2gmx 处理 PDB 文件的时候，就会得到各个链的拓扑文件，如topol_A.itp， topol_B.itp 等等，并都被topol.top 包含

19、。以上所述使用一个字符标识PDB 文件中不同的链，是因为 PDB 文件只使用第 22 字符列作为链标识位，两个字符以上不认。（即 AA ，AB 标识的链都被认为是A 链。）那么如果拿到一个没有链标识符的PDB 坐标文件或GRO 文件，该怎么办呢？那么要先使用make_ndx 将不同链的残基选作不同的分子组（group），然后使用 editconf 将不同组输出成带链标识符的PDB 文件，命令如： editconf -f File.pdb(/File.gro) -n indenx.ndx -o chian_A.pdb -lable A （以上可以等等A 链，以此类推得到不同的

20、链的PDB 文件）。最后将这些PDB 文件组合成一个PDB 文件，再由pdb2gmx 处理即可。甚是麻烦。。（7）GMX.5 eneconv GMX 分子模拟，有一个非常重要的能量输出文件，即 edr 文件。eneconv 就是对GMX 能量输出文件进行处理的程序。 9 一个模拟可以分对次进行，于是得到很多edr 文件。使用eneconv 的 “ -f ” 参数，然后把这些能量文件罗列出来，那么就可以对这些能量文件进行合并，输出一个完整的能量文件。如果另个能量文件中有重复的模拟步骤，那么后一个读入的能量文件将覆盖前一个文件。也可以使用 “ -settime” 参数对每一个输入

21、文件的开始时间进行设置，以免互相覆盖。如下就是一个程序运行例子： + eneconv -o fixed.edr -f *.edr + 即对当前目录下所有edr 文件进行合并，然后输出为fixed.edr 文件。当用 “ -f ” 参数读入单一一个能量edr 文件时，也不是没有用，可以和其他参数配合，对能量文件进行编辑, 如 “ -dt ” 参数可以设定对原来能量文件进行规定时间间隔输出到新能量文件中；“ -offset ” 参数设定写出输入能量文件的时间帧（从哪一个模拟时间开始写入新的能量文件）等。这些参数，还有上面说到的“ -settime ” 参数，都可以一起使用，加上 “

22、 -b” 和 “ -e” 设定开始和结束读取模拟时间帧，就能得到新的称心如意的新能量文件。程序输入文件： - -f: 输入能量文件，即edr 文件。 -o: 输出文件，也是edr 文件。其他参数： 10 - -b: 设定从哪一个模拟时间帧对输入文件进行读取。 -e: 设定从哪一个模拟时间帧对输入文件结束读取。 -dt: 设定输出文件的模拟时间间隔，比如“ -dt 10 ” 表示每10ps 输出一次。 -offset: 设定从哪一个时间帧开始输出到新的能量文件中。 -settime: 交换式设定每一个输入文件在新输出文件中的开始时间。 -sort: 自动排序输入文件。 -scalefac:

23、该参数输入为一个实数，程序会将能量文件中的每一个能量项乘以这一个实数。 -error: 如果输入文件中有错误，程序自动退出。注意：新的输出文件中，只有能量项是正确的，用于统计的sigma 和 E2 并没有更新，所有需要使用其他工具，如g_analysis 进行新的统计（8）GMX.4 editconf editconf 是 GMX 最重要的程序之一。它的主要功能是对系统结构进行编辑，同时它也把系统结构文件保存或者转换到不同的文件格式中，如gro、g96、pdb 文件等。 11 在分子动力学模拟中，通常给模拟系统添加一个模拟盒子（周期性的盒子，原子从这边出去了，就从那边

24、进来，通俗吧）。 editconf 使用 “ -box ”、“ -d ” 和 “ -angle ” 等参数对模拟系统的盒子进行设定。在为系统设定盒子的时候， “ -box ” 和 “ -d ” 都把系统放置在盒子的中间，除非editconf 明确使用另外一个参数“ -noc ” 。 (也就是 not center 的意思啦。 ) 使用 “ -bt ” 参数， editconf 可以设定使用盒子的类型。editconf 支持以下几种盒子类型： triclinic（斜方体）、cubic（正方体）、dodecahedron (等边十二面体 )， octahedron (等边八面体，两头

25、被剪切的那种，即两个四面体放在一起，切去方向相反的尖尖的两头，同时保证所有的边长相等）。等边十二面体和等边八面体的体积分别是同“ 周期映像距离 ” 的正方体体积的0.71 和 0.77 倍，越接近球形，体积越小，计算代价越小。当使用立方体、等边十二面体或者等边八面体时，“ -box ” 的参数可以只为一个实数值，该数值即为边长。 “ -box ” 参数也可以是三个实数，结果为以这三个实数为边长的长方体（如不指定“ -angle ”，默认盒子矢量间夹角为90度）。参数 “ -angle ” 只同参数“ -box ” 和参数 “ -box ” 一起使用，以指定盒子矢量间的夹

26、角；不能和参数“ -d ” （用于指定系统原子到盒子边界的最小距离）一起使用。如果使用“ -n ” 或者 “ -ndef ” 参数为程序指定一个索引文件，则editconf 可以选择系统中某一个组计算盒子大小或者几何中心，否则整个系统都会被考虑在内。参数 “ -rotate ” 用来旋转系统，按照给定数值在该坐标系上进行旋转。如 “ -rotate 0 30 0 ”，则表示将系统绕Y 轴顺时间方向旋转30 度。参数 “ -princ ” 用来将系统（或者系统某一部分）固有坐标对齐到坐标轴上。这样做可以缩小盒子的体积，特别是当分子为一长条形状的时候。但是分子在模拟过程中会平移或者转

27、动，所以使用的时候要特别小心。扫描参数 “ -scale ” 在其他参数被读入前可以扫描系统中各个原子的坐标，与其他 12 参数配合使用可以对系统中原子坐标进行修改以得到不同的系统性质。如果 “ -density ” 一起使用，可以得到不同的系统密度（这样做会改变系统盒子大小，要特别小心！）。使用该参数时，如果输入为.gro 文件，可能结果会不精确。当 “ -scale ” 参数为单一“ -1 ” 时，输出的系统结果为该方向上的镜面映像，当三个方向上的输入全部为“ -1 ” （即 “ -scale -1 -1 -1” ）时，系统的结果机构为原来结构的坐标原点对称映像。在程序输出时

28、，可以只输出系统的某一个组，或者某一个部分。可以建立划分更为细致的索引文件，这样可以进行细致的选择。系统结构的周期性可以在程序中进行粗略去除，但是必须保证结构文件中周期性盒子的信息绝对正确，因为 editconf 去除周期性的算法十分简单，只是将原子坐标直接减去盒子边长。当程序输出文件为.pdb 文件时，可以使用“ -bf ” 参数为输出文件添加B-factor。 B-factor 要在一定的格式的文件中读取，这个格式要求文件第一行为文件中所含 B-factor 数值个数，文件第二行开始没行要有一个索引号，然后就是该索引后面的 B-factor 值。 B-factor 默认是一个

29、残基一个数值，如果每一个原子有一直B-factor 值，则要使用“ -atom ” 参数。如果使用“ -legend ” 参数，那么程序在结构文件中会生成一列CA 原子，这些原子带有B-factor 数字，并从最小B-factor 值排列到最高，便于可视化软件显示。如果使用“ -mead ” 参数，那么程序将输出一个被静电统计软件MEAD （玻松 -波尔兹曼方程求解软件）使用的pdb 文件（或者pqr 文件）。使用这个参数有一个前提条件，就是输入文件必须是模拟打包文件（如tpr 文件），因为这样的文件包含了力场参数。这个输出pdb (pqr) 文件中， B-factor 数值

30、列为该行原子的范德华半径，而 occupancy 列则为该原子的电量。“ -grasp ” 参数的作用很类似，但是 B-factor 列和 occupancy 列的数值互换。 13 另外一个十分的有用的参数就是“ -label ” 参数，它可以为pdb 文件加上一个链标记。如果一个文件里面不同残基属于不同肽链，那么这个参数可以帮这些残基指定肽链归属，这样不但可以帮助可视化，在建立模拟系统时也十分方便。 editconf 还可以修改结构文件的盒子类型，比如以下就是立方体盒子修改成一个等边八面体 : + + editconf -f -rotate 0 45 35.264 -bt octa

31、hedron -box -o + + 其中，的数值为正方形变成乘于根号三除以二: a*sqrt(3)/2 。程序输入文件： - -f: 输入结构文件，文件格式可以是gro、g96、pdb、tpr、tpb 或者 tpa。 -n: 索引文件。 -o: 输出文件，文件格式为gro、g96 或者 pdb 。 -mead: 输出文件， MEAD 程序的坐标文件，包含力场参数。 -bf: B-factor 数值文件，文件格式见上文。其他参数： 14 - -w: 程序结束自动打开输出文件。 -ndef: 在索引文件的默认组中选择输出范围。 -bt: 指定盒子类型，支持的盒子类型有triclinic（斜

32、方体）、cubic （正方体）、 dodecahedron （等边十二面体）或者octahedron （等边八面体）。 -box: 指定盒子三个矢径，（a，b，c）。 -angle: 盒子矢径间夹角，默认都是90 度（bc，ac，ab）。 -d: 溶质分子（蛋白，核酸等）到盒子边界的距离。 -c: 把溶质分子放在盒子中间，“ -box” 和 “ -d” 参数的默认参数。 -center: 为输出结构指定几何坐标中心，默认为（0，0，0）。 -translate: 平移分子机构，比如 “ -translate 0 0 2.5” 表示将分子结构向Z 轴正方向平移2.5 纳米。 -rota

33、te: 旋转分子结构，见上文。 15 -princ: 对齐分子结构，见上文。 -scale: 扫描分子结构， “ -scale 1 1 1” 表示在三个坐标方向上进行扫描。 -density: 指定输出结构文件的分子密度。 -pbc: 处理结构文件的周期性。 -grasp: 将原子的力场参数存储在输出文件中，见上文。 -rvdw: 给定默认原子的默认范德华半径。该参数可用于处理缺少力场参数的原子。 -sig56: 使用范德华能量最低点到原子中心距离的一半距离，而不使用简单使用范德华半径的一半。（特殊使用，多特殊？） -vdwread: 从默认 vdwradii.dat 文件中读取原子的范德

34、华半径，而不使用力场提供的范德华半径。 -atom: 为各个原子添加B-factor 数值。 -legend: 在结构文件中添加B-factor 参考值，见上文。 -label: 16 为各个残基指定肽链归属。注意：对于复杂的分子，最好使用trjconv 去除结构周期性。：） (9)朗格文动力学( Langevin Dynamics ) 2009-06-19 14:10 朗格文动力学( Langevin Dynamics ) 是控制模拟系统能量的一种常用算法，在多种分子模拟软件中都可以看到。分子模拟在一定的系综下进行，所以要保持系统状态不变，比如控制系统温度，压强等。由于计算机不是

35、百分百精准，微小的误差在长时间的模拟过程中可能被不停积累和放大，于是需要不同的方法对系统进行不停调整。这些调整的方法有很多，比如 Berendersen, Nose-hoover, Langevin。模拟系统中的原子受到起周围原子相互作用力，依据所受作用力根据牛顿第二定律运动。朗格文动力学的实现方法是给原子添加两个额外的作用力，即摩擦力和随机力。该摩擦力大小为原子速度乘于其质量再乘于一个摩擦因子（gamma)，其方向与原子速度相反。而随即力可以理解为来自溶液分子的随机相互作用等。这个两个力一起调节系统中各个原子的运动，以达到对整个系统能量的调控，即调控系统温度，压强等。 (10

36、)GMX.3 do_dssp 本程序调用第三发软件DSSP，从轨迹文件中读出蛋白质的二级结构信息。要使用该程序，必先安装好DSSP 软件（恩，用 google 或者 baidu 小搜一下）。安装 DSSP 完毕后(/home/user/soft/bin/dssp) ，在 shell 中定义 DSSP 变量： setenv DSSP /home/user/soft/bin/dssp 如果使用bash，则export DSSP=/home/user/soft/bin/dssp 。可以该变量直接加到 shell 的配置文件中。 17 程序输出文件为.xpm 文件，该文件其实是一个文本文件，可以

37、一般文本编辑器打开。文件中用不同字符表示蛋白质每一个残基属于什么二级结构，并随时间变化，同时定义每个字符的颜色。.xpm 文件可视化有一点麻烦，Gromacs 的另外一个程序 xpm2ps 可以将其转化为PostScript 文件，为.eps 文件后缀，可以直接打开或直接使用到Latex 文件中。 do_dssp可以统计属于某二级结构类型的残基数目，“ -sss” 参数用于选择二级结构类型，“ -sc“ 参数则把统计结果输出到scount.xvg 文件中（其实这个文件包含了所有不同二级结构氨基酸残基数目，可以用xmgrace 的 “ -nxy” 参数打开）。本程序还可以计算每一个

38、残基的溶液可及化面积(Solvent Accesible Surface, SAS) ，以绝对平方埃（A2)表示，或者最大SAS 面积的分数表示（最大SAS 定义为该一残基在甘氨酸链中的SAS 面积）。Gromacs 另外一个程序g_sas 也可以求取SAS，效率较高并且相对简单。程序同时可以使用输出一个ssdump.dat 文件。该文件包含了各个残基的二级结构信息，可以被另外一个程序g_chi 使用，以分析残基直接二面角性质与二级结构直接的关系。（其实这个文件就是一个文本文件，里面用字符代表残基的二级结构，如 H 表示螺旋， B 表示折叠等。）程序输入输出文件： - -

39、f: 轨迹文件， xtc、trr 等。 -s : 模拟系统tpr 文件。 -n: 索引文件。 18 -ssdump : 输出 ssdump.dat 文件。 -map: 程序输出xmp 文件的原色库文件，如无则默认输出。（让其默认挺好的啦） -o: 输出文件， xmp 文件。各个残基属于某二级结构信息并随模拟时间变化。 -sc: 统计某二级结构残基数目，输出文件scount.xvg。 -a: 各个残基的溶液可及化面积，xmp 文件。 -ta: 总可及化面积，包括疏水和亲水面积，xvg 文件。 -aa：平均可及化面积， xvg 文件。其他参数： - -b: 指定可是统计时间帧。 -e: 指定

40、结束统计时间帧。（“ -b” 和 “ -e” 可以用来读取轨迹中某一时间断的信息。）-dt: 指定读取帧的时间间隔。 -tu: 设定输出时间单位。 19 -w: 统计结束，自动打开输出文件。 -xvgr: 在输出 xvg 文件中添加其他信息，坐标标题等。 -sss : 设定统计二级结构类型。 (11)GMX.2 anadock anadock 是一个分析分子对接（ docking）软件 Autodock 计算结果的程序，其作用是根据距离或者RMSD 对分子对接结果的分子结构进行归簇，然后依据分子对接能量和自由能，并进行统计和输出。（本人没有用过AutoDock，只用过Dock，故不作

41、任何评论。）对分子结构进行归簇，Gromacs 也提供 g_cluster 程序，故可以使用该程序对结构进行提前归簇在计算能量，同样可以达到目的。程序输入输出文件： - -f: 输入文件， PDB 文件格式。 -ox: 归簇输出文件， PDB 文件格式。 -od: 能量输出文件，为xmgrace 的 xvg 文件格式。 -of: 自由能输出文件， xvg 文件格式。 -g: 20 程序记录文件。其他参数： - -xvgr: 在 xvg 输出文件中添加文字说明，坐标名称等。 -free: 使用 AutoDock 估算的自由能对结构进行结构排序。 -rms: 使用 RMS 进行归簇。 -c

42、utoff: 归簇尺度，偏离大于给出数值时认为不同簇，默认为0.2 nm。（13）Restraint Name Protein in water molecules ; Compound #mols Protein 1 SOL 2948 其中 SOL 后面的数字 2948就是 genbox 加入盒子的水分子的数目。 Editconf 程序的另一个用途是讲gro 文件转化回pdb 这时可以讲speptide_water.gro 转化回 pdb 观察 editconf f speptide_water.gro o speptide.pdb 拖回本机用 spbdv 或者 vmd 观察。 The n

43、ext step is to generate index file . in the tutor of gromacs , we are told that there are a set of index groups to select, unfortunately, I didi not find them ,so I have to use make_ndx to generate one . # make_ndx f b4em 3.perform an enery minimization of the peptide in solvent 27 Now the simulatio

44、n system is almost ready. Before we can start the dynamics, we must perform an energy minimization, to alleviate any bad contacts (atoms overlapping such that a significant repulsion would result, causing numerical problems in the simulation) that might be present in the system. # grompp v f em.mdp

45、c speptide_water.gro p speptide.top o speptide_em.tpr Or use this command for short: # grompp v f em c b4em p speptide o em After this command ,the bad contacs have been removed .so we can do enery minimization now. # mdrun v s speptide_em.tpr o speptide_em.trr c after_em.gro g emlog.log Or # mdrun

46、v s em o em c after_em g emlog From screen ,we can see these - Steepest Descents: Tolerance (Fmax) = 2.00000e+03 Number of steps = 100 Step= 0, Dmax= 1.0e-02 nm, Epot= -8.02562e+04 Fmax= 2.70468e+04, atom= 6792 Step= 1, Dmax= 1.0e-02 nm, Epot= -8.69641e+04 Fmax= 1.24531e+04, atom= 6657 Step= 2, Dmax

47、= 1.2e-02 nm, Epot= -9.48067e+04 Fmax= 5.54072e+03, atom= 9009 Step= 3, Dmax= 1.4e-02 nm, Epot= -1.02743e+05 Fmax= 2.86957e+03, atom= 8766 Step= 4, Dmax= 1.7e-02 nm, Epot= -1.08941e+05 Fmax= 1.53075e+04, atom= 150 Step= 5, Dmax= 2.1e-02 nm, Epot= -1.10083e+05 Fmax= 1.31653e+04, atom= 150 Step= 6, Dm

48、ax= 2.5e-02 nm, Epot= -1.10564e+05 Fmax= 2.16454e+04, atom= 150 Step= 7, Dmax= 3.0e-02 nm, Epot= -1.11528e+05 Fmax= 1.82398e+04, atom= 150 Step= 9, Dmax= 1.8e-02 nm, Epot= -1.12767e+05 Fmax= 3.87548e+03, atom= 120 Step= 11, Dmax= 1.1e-02 nm, Epot= -1.13598e+05 Fmax= 1.23013e+04, atom= 120 Step= 12, Dmax= 1.3e-02 nm, Epot= -1.14464e+05 Fmax= 5.37656e+03, atom= 120 Step= 13, Dmax= 1.5e-02 nm, Epot= -1.14787e+05 Fmax= 1.74494e+04, atom= 120 Step= 14, Dmax= 1.9e-02 nm, Epot= -1.15874e+05 Fmax= 8.35820e+03, atom= 120 Step= 16, Dmax= 1.1e-02 nm, Epot= -1.16420e+05

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

6 元

下载	加入VIP免费专享

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: gromacs 文件介绍 and 一些知识要点

三一文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：gromacs文件介绍and一些杂知识要点.pdf
链接地址：https://www.31doc.com/p-5197062.html