生物大分子模拟要点.pdf
《生物大分子模拟要点.pdf》由会员分享,可在线阅读,更多相关《生物大分子模拟要点.pdf(14页珍藏版)》请在三一文库上搜索。
1、第一 1、 computational biology 计算机生物学是利用计算的方法对复杂生命现象和过程进行研究和预测的科学。它是理论与 数据分析、 数学建模和计算机模拟在生物学、行为学、社会群体系统中的应用与研究。它是 数学、生物、 物理、化学和计算机科学等高度交叉的学科,并与人类的生活与健康紧密结合。 2、 the four choices, define a model for a computer simulation 自由度、力场、外部环境、运动方程 第二 分子模型的代表:量子力学、量子/分子力学、分子力学、联合原子模型、粗粒化模型 分子力学 ,又叫力场方法(force field
2、method),是基于经典牛顿力学方程的一种计算分 子的平衡结构和能量的方法。与量子力学不同,它求解的是Newton 方程,而不是薛定谔方 程。( 用量子力学处理分子,计算量特别大,因此量子力学方法适用于处理小分子体系。分 子力学计算量较小,更适合于大分子体系,可考虑额外效应) 简单分子力场:分子力场是分子力学的核心;简单作用模型;力场的可移植性 成键 / 非键相互作用:键长、键角、二面角、范德华作用、静电作用、交叉相互作用(五种 类型,老师说一定会考) 3、 Potential energy functions 由于分子力学是经验的计算方法,不同的分子力学方法会采用不同的势能函数(Poten
3、tial Energy Function, PEF)表达式,而且力场参数值也会不同。一般将分子的PEF 分解成五 部分: 4、 polarizability effect 将电介质放入电场,表面出现电荷。 这种在外电场作用下电介质表面出现电荷的现象叫做电 介质的极化。带电的配基会是蛋白质部分受到极化。 5、 force field,two most popular force field 分子力场并不计算电子相互作用,它是对分子结构的一种简化模型。一个分子的能量可以近 似看作构成分子的各个原子的空间坐标的函数,简单地讲就是分子的能量随分子构型的变化 而变化,而描述这种分子能量和分子结构之间关系
4、的就是分子力场函数。 传统力场、第二代力场、通用力场 比较不同程序计算得到的能量值无意义 AMBER 力场:由 Kollman 课题组开发的力场,是目前使用比较广泛的一种力场,适合处理 生物大分子。 AMBER 力场的势能函数形势较为简单,所需参数不多,计算量也比较小,这 是这个力场的一大特色,但也在一定程度上限制了这个力场的扩展性。本力场用谐振子模型 计 算 键 长 伸 缩 能 和 键 角 弯 转 能 , 用 傅 立 叶 级 数 的 形 式 来 描 述 二 面 角 扭 转 能 , 选 用 Lennard-Jones势来模拟范德华力;用库仑公式来描述静电相互作用。 CHARMM力场:由Karp
5、lus 课题组开发,对小分子体系到溶剂化的大分子体系都有很好的 拟合。 第三 6、 local minimum 能量优化, 寻找研究体系能量极小的状态,从数学角度看是处理多维函数的优化问题。优化 的方法, 降低体系能量到最靠近的一个最小。窄而深的最小值的统计学大小可能比高能下宽 的最小值要少。 7、 global minimum 全局优化研究的是多变量非线性函数在某个约束区域上的全局最优解的特性和构造寻求全 局最优解的计算方法。由于很可能在一个全局优化问题里存在多个局部最优解,且它们不同 于问题的全局最优解,因此人们无法借助于经典的局部优化方法求解这些问题。 8、 steepest desce
6、nts 最速下降法又称为梯度法,是1847 年由著名数学家Cauchy 给出的。其优点是工作量少, 存储变量较少,初始点要求不高;缺点是收敛慢,效率不高,有时达不到最优解。最速下降 法从目标函数的负梯度方向一直前进,直到到达目标函数的最低点。梯度下降法的计算过程 就是沿梯度下降的方向求解极小值。 9、 conjugate gradients methods, compare 共轭梯度法是求解特定线性系统的数值解的方法,其中那些矩阵为对称和正定。共轭梯度法 是一个迭代方法, 所以它适用于稀疏矩阵系统,因为这些系统对于像乔莱斯基分解这样的直 接方法太大了。这种系统在数值求解偏微分方程时相当常见。
7、共轭梯度法是介于最速下降法与牛顿法之间的一个方法,它仅需利用一阶导数信息,但克服 了最速下降法收敛慢的缺点,又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点,共 轭梯度法不仅是解决大型线性方程组最有用的方法之一,也是解大型非线性最优化最有效的 算法之一。 共轭梯度法是一个典型的共轭方向法,它的每一个搜索方向是互相共轭的,而这些搜索方向 d 仅仅是负梯度方向与上一次迭代的搜索方向的组合,因此,存储量少,计算方便。 10、 two methods for global energy minimization 模拟退火是受金属热加工技术的启迪而发展起来的一种随机搜索算法。 将一个优化问题比拟成
8、一个金属物体,将优化问题的目标函数比拟成物体的能量,问题的 解比拟成物体的状态,问题的最优解比拟成能量最低的状态,然后模拟金属物体的退火过 程, 从一个足够高的温度开始,逐渐降低温度,使物体分子从高能量状态缓慢的过渡到低 能量状态,直至获得能量最小的理想状态为止,从而得到优化问题的全局最优解。 新状态接受概率仅依赖于新状态和当前状态,并由温度加以控制。 质量高;简单、通用、易实现。由于要求较高的初始温度、较慢的降温速率、较低的终止 温度,以及各温度下足够多次的抽样,因此优化过程较长。 遗传算法是一种以自然选择和遗传理论为基础,将生物进化过程中适者生存规则与种群内 部染色体的随机交换机制相结合的
9、随机化搜索算法。 第四 相空间,时间平均,系统平均 11、 Ergodic Hypothesis 遍历性假设是一个分子系统的足够长时间的演化(保持能量守恒)可遍历(或无限接近)任 何微观状态。(绝大多数情况下不成立) 不是真实的,因为采样时间非常短。但在一些特殊性情况是真实的。 12、 Metropolis approach metropolis 是一种采样方法,一般用于获取某些拥有某些比较复杂的概率分布的样本。采样 最基本的是随机数的生成,一般是生成具有均匀分布的随机数。 13、 General steps of a Monte Carlo simulation 蒙特卡洛方法(Monte C
10、arlo method ) , 也称统计模拟方法,是 20 世纪 40 年代中期由 于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非 常重要的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问 题的方法。 MC 方法的起源于布丰投针实验。 针对待求问题,根据物理现象本身的统计规律,或人为构造一合适的依赖随机变量的概率 模型,使某些随机变量的统计量为待求问题的解,进行大统计量(N)的统计实验 方法或计算机随机模拟方法。(大数定理,中心极限定理) (1)选取所要研究的系统并建立适当的模拟模型。 (2)设定模拟区域的边界条件,选取粒子间作用势模型。 (3
11、)设定系统所有粒子的初始位置和初始速度。 (4)计算粒子间的相互作用力和势能,以及各个粒子的位置和速度。 (5)待体系达到平衡,统计获得体系的宏观特性。 大数定理与中心极限定理 与模拟退火的区别: 模拟退火:先升温,再降温,不关心过程 MC 模拟:温度不变,关心过程,温度等于生理温度 随机数,各种随机数 随机数必备的两个特点:独立性和均匀性 伪随机数的统计检验:均匀性,在【0,1】内等长度子区间中随机数的数量是一样的 第五 14、 the typical time step in a MD simulation 时间步长是根据分子振动或转动频率来确定的,太长的时间步长会造成分子间的激烈碰撞,
12、体系数据溢出; 太短的时间步长会降低模拟过程搜索相空间的能力,因此一般选取的时间步 长为体系各个自由度中最短运动周期的十分之一。设为分子中最小伸缩振动周期的十分之 一,一般碳氢的伸缩振动周期最短,是10fs。所以速度限制在1fs。 15、 why , choosing such a time step 16、 The Leap-frog method 蛙跳算法是一种全新的启发式群体进化算法,具有高效的计算性能和优良的全局搜索能力。 作为一种新型的仿生物学智能优化算法,结合了基于模因进化的模因演算法和基于群体行为 的粒子群算法。该算法具有概念简单,调整的参数少,计算速度快,全局搜索寻优能力强,
13、易于实现的特点。 蛙跳算法的思想是:在一片湿地中生活着一群青蛙。湿地内离散的分布着许多石头,青蛙通 过寻找不同的石头进行跳跃去找到食物较多的地方。每只青蛙个体之间通过文化的交流实现 信息的交换。 每只青蛙都具有自己的文化。每只青蛙的文化被定义为问题的一个解。湿地的 整个青蛙群体被分为不同的子群体,每个子群体有着自己的文化,执行局部搜索策略。在子 群体中的每个个体有着自己的文化,并且影响着其他个体,也受其他个体的影响,并随着子 群体的进化而进化。当子群体进化到一定阶段以后,各个子群体之间再进行思想的交流(全 局信息交换)实现子群体间的混合运算,一直到所设置的条件满足为止。 边界条件,真空边界条件
14、,周期边界条件,截断半径的边界条件 17、 Box types in PBC 立方体、十二面体、六方柱、截断正八面体,格子的选取必须足够大,考虑分子的旋转。 正十二面体和截断正八面体用得比较多 18、 why ,electrostatic interactions are problematic in MD 长程力:随距离的增加而缓慢减少。如静电力。这种静电想回作用会消退的。 19、 the most efficient algorithm to compute electrostatic interactions so far Ewald 求和在k 空间求和那一部分的级数会发散。通常为了避免
15、这种问题,分子模拟的程 序在处理非电中性系统的Ewald 求和是都会给系统加上一个均匀分布的背景电荷密度来中 和这部分电荷。如果你的体系净电荷不大(比如说只有-2 e),那么这个背景电荷的影响是 比较小的,反之,如果你的体系净电荷很大,那么Ewald 求和带来的误差就会很大。(使 用快速傅里叶变换) 20、 microcanonical, canonical, and isothermal-isobaric ensembles 微正则系综(microcanonical ensemble):系综里的每个体系具有相同的能量(通常每个体 系的粒子数和体积也是相同的)。 正则系综( canonical
16、 ensemble):系综里的每个体系都可以和其他体系交换能量(每个体 系的粒子数和体积仍然是固定且相同的),但是系综里所有体系的能量总和是固定的。系综 内各体系有相同的温度 等温等压系综 (isothermal-isobaric ensemble ):正则系综的推广,体系间可交换能量和体积, 但能量总和以及体积总和都是固定的。(系综内各体系有相同的粒子数。)正如它的名字, 系综内各个体系有相同的温度和压强。 21、 how, couple the system at constant temperature and pressure in MD 一个明显的方式来改变系统的温度是调节速度比例。
17、简单的速度扩展方法是通过因子 控 制。 NVT系综就是通过控制体积(密度)来控制体系的压力。压力可以保持在一个常数值通过 简单地伸缩体积,即改变模拟细胞的体积。模拟盒子的体积被因子缩放。 22、 Particle decomposition PD 是一种简单的并行算法类型。PD 算法比较容易实现,但是由于它需要各处理器不停交 换粒子的位置信息,通信开销相当大,难以实现大规模MD 模拟。同时它对硬件尤其是 网络性能要求高,否则并行效率会大打折扣。 在开始模拟 ,粒子被分配到处理器。粒子之间的力需要分配给处理器,这样力负载均衡。这种 分解要求每个处理器知道系统中至少一半的粒子坐标,从而达到高N 的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 大分子 模拟 要点
链接地址:https://www.31doc.com/p-5219239.html