1. 福建师范大学化学与化工学院 福建福州 350007;;
2. 福建省理论与计算化学重点实验室 福建厦门 361005
基金项目:国家自然科学基金(21103021);福建省高校杰出青年科学人才培育计划(JA13063);福建师范大学大学生创新创业项目(201510394056)
Visualization of Microcosm: Application of VMD Software in Education of Protein Structure
1. College of Chemistry and Chemical Engineering,Fujian Normal University,Fuzhou 350007,China;;
2. Fujian Provincial Key Laboratory of Theoretical and Computational Chemistry,Xiamen 361005,China
Abstract:
This paper discussed the application of VMD software in the teaching of three dimensional structure of protein. VMD can help students to understand folding patterns and the secondary structure feature of protein in an interactive,more direct and visual way. VMD also can summarize the structure data from instantaneous structures of molecules in thermal dynamic situation,and the statistic results are helpful for a better understanding about the tendency of forming specific secondary structure of protein.
Key Words:
VMD software
secondary structure
protein
visualization
蛋白质是生命活动的基础,生命体依赖蛋白质的正常运作而存在。要发挥正常的物理、化学以及生物学功能,蛋白质需要通过大量氢键、范德华力和疏水作用等非共价相互作用来正确折叠形成一个特定构型。因此,通过“生物化学”课程的学习,认识蛋白质序列和结构的特性具有十分重要的现实意义。众所周知,蛋白质的一级结构即氨基酸序列决定了其空间三维结构与所具有的功能。然而蛋白质结构数据库(Protein Data Bank,简称PDB)中的数据量与序列库相比差了2~3个数量级,对于蛋白质空间结构的认知尚有巨大的开发空间[1]。
在现代的生物化学教学过程中,学生能够认识到蛋白质结构从简单到复杂可以依次分为一级结构、二级结构、三级结构和四级结构。其中,作为一级结构和三维空间结构之间的重要桥梁,蛋白质二级结构是认识蛋白质结构与功能特性的主要内容之一,对该部分内容的学习对认识蛋白质空间构型、折叠机制以及蛋白质功能具有重要的意义[2]。
由于蛋白质、多肽分子体系的空间结构十分复杂,高校教师为了避免照本宣科、平铺直叙给学生造成枯燥无味的感觉,在多媒体教学中引入了大量精美的幻灯片以及flash动画,致力于激发学生的学习兴趣[3]。然而学生在课堂上能够吸收的毕竟只是部分,在课后单纯依靠想象力学习课本上多肽链的结构特性知识或多或少存在困难。
值得庆幸的是,奋斗在一线的科研工作者一直在不断解析各种蛋白质的序列及其空间结构,并将其结果与我们分享。这时候需要一个分子可视化工具来充当我们的超级显微镜,将研究工作者提交到数据库中的蛋白质的序列和三维空间结构实实在在地展现在面前。伊利诺伊大学Klaus Schulten课题组等人所研发的VMD(Visual Molecular Dynamics)软件[4],是一个功能强大的分子可视化及分子模拟软件。借助VMD软件包能够将数据库中所收录的蛋白质的结构文件读取出来,将其空间结构在电脑屏幕上进行实时展现,并按照教师和学生的个人意愿,用不同的可视化模式实现对分子全局和局部的观测、平移、旋转、缩放以及其他各种操作。
介绍了VMD软件在蛋白质三维结构方面学习与认知的具体应用。它弥补了人们空间想象能力的不足,使得教师在课堂上的教学更加生动具体,而且软件的可操作性使得教学过程便于互动;而学生在学习过程也更加的得心应手,在课堂外也能够自主、自如地与各种生物分子进行亲密接触。
1 蛋白质二级结构
为了以稳定的存在形式发挥相应的功能作用,蛋白质分子通过折叠形成各种规则有序的二级结构。常见的二级结构有α螺旋(图 1A)、β折叠(图 1B)以及无规则弯曲等。正是由于这些二级结构单元使得整个蛋白质或多肽分子的结构和能量趋于稳定,并使其以特定构象态存在于自然界中。
在课堂幻灯片或是教科书中,学生能够看到上述类似的图片或动画,对蛋白质二级结构乃至高级结构能够有个初步的感性认识。可这些过程常常是一闪而过,而且局限于制作者所提供的示例,在展示过程中,图片与动画基本不具备可编辑性,更不用说在其他分子体系中得以应用。要对课程内容进行较为感观的复习,升华认识,就必须对能够实现该目标的相关软件有所了解,能够动手操作,面对面地与原子分子交流做朋友。而VMD软件正好填补了教师和学生的这些需要,它能够有效地帮助使用者自行构建较为形象直观的分子三维空间结构示意图,增强蛋白质结构特性学习的趣味性。
2 蛋白质结构的显示方式
VMD是一款分子模拟可视化软件,它使用简便,容易上手,能够以多种绘图模式展示出蛋白质、糖类、核酸等生物分子体系的结构特性。VMD软件还可与AMBER,NAMD,GROMACS等软件连用,对原子分子的动态结构变化及其运动轨迹进行实时监测和统计。
运行VMD软件有时会显示3个窗口界面(图 2)。其中,图 2A为主窗口,可以通过工具栏中的按钮方便地实现分子结构文件的导入以及图形显示方式的选择等。图 2B为命令行窗口,使用者的每一步操作都会以命令文字的形式在窗口中显示。图 2C为图形显示窗口,可以通过鼠标和键盘的操作随意放大或缩小、平移、旋转分子,并可以对分子的结构信息进行标记和读取。
在蛋白质数据库中含有数以万计的蛋白质结构文件,学生可以根据自己的需要,搜索并下载数据库中相关的分子结构文件,在VMD软件中进行可视化操作。以淀粉样前体蛋白(Amyloid Precursor Protein,APP; PDB ID: 1OWT)为例,在VMD主窗口(图 2A)打开下载的pdb文件,能够看到文件名为1OWT.pdb的分子有着1039个原子,以及21帧不同的结构。而在图 2C中,pdb文件中文本形式的坐标信息转化为三维图像的形式,以系统默认的方式显示出每一帧中分子的构象。
对于分子量较大的体系,单纯地观察原子以化学键形式的组合并不能帮助学生有效认识蛋白质分子的高级结构。VMD主窗口的Graphics→Graphical Representations模块提供了多种绘图方式,可以方便地选择不同的着色方法对蛋白质所呈现出的不同二级结构进行区别显示(图 3A)。
当选择绘图方式为Newcartoon时,淀粉样前体蛋白的可视化方式发生了巨大的变化(图 3B)。从显示窗口可以清晰地看出淀粉样前体蛋白整条肽链所呈现出的二级结构特性,其中,α螺旋以卷曲的条带状表示,β 折叠以扁平的箭头表示,其他所有的结构如无规则卷曲等则以细管状表示。选择着色方法为Secondary structure时,可以为蛋白质分子中的不同二级结构采用不同的着色方式,如 α 螺旋设置为紫色、 β 折叠设置为黄色等(图 3),从而提高不同二级结构的辨识率。
对于较大的蛋白质体系来说,其结构繁琐,相互作用复杂,不同部位链段所具有的功能作用也不尽相同,有必要更有选择性和针对性地进行特定位点的作用机理探究。VMD软件能够设置独立地显示分子的特定部分。在Graphical representation窗口中Selected atoms命令输入框中输入alpha_helix,或者在下方的Selections中的Singleword下拉选项中选择alpha_helix,则在显示屏中选择性地显示 α 螺旋等结构(图 3C)。除了可以选择性显示部分结构,还可以选择性隐藏部分结构,在选择结构前单击选择not,如not alpha_helix,那么图像中便会显示除了 α 螺旋结构以外的所有结构(图 3D)。此外还有许多其他的显示模型,如课堂教学中常用的CPK球棍模型等可供选择。
3 蛋白质动态结构统计信息
在生理环境中,蛋白质一直处于不停的微观热 运动中,其三维空间结构不停地发生动态波动,并呈现出各种可能的二级结构。通过生物化学的学习,我们知道蛋白质的一级结构即氨基酸序列决定了其三维空间结构的倾向性,即多肽链倾向于折叠成特定的二级结构。为了精确描述多肽链所呈现的二级结构,科学工作者们将绕Cα-N键旋转的二面角称为$\phi $,绕Cα-C键旋转的二面角称为ψ,这样多肽链主链的各种可能构象都可以通过这2个成对的骨架二面角($\phi $,ψ)来描述。这样一来,2个相邻肽形成的构象就能够在横坐标为$\phi $、纵坐标为ψ的图中标记出来,即教科书中所描述的拉式构象图。[2, 5]
图 4中列出了本课题组将VMD与NAMD联用,进行淀粉样蛋白片段A β 37-42在水溶液中运动轨迹模拟的瞬态结构图。不同时刻,由于蛋白质分子在溶液中不停地进行热运动,其构象特征随着时间的推移而不断变化。以第37和38号氨基酸残基所形成的分子骨架二面角为例,在初始时刻,分子骨架二面角($\phi $=71.5°,ψ =41.4°);到2 ns时,分子骨架二面角发生一定的波动($\phi $=79.7°,ψ =8.5°);到10 ns时,分子构象由于长时间热运动,发生了较大改变($\phi $= -176.4°,ψ =-15.2°),分子的构象态一直处于不停的动态涨落之中(图 5)。
为了对蛋白质分子在超快时间尺度下的热运动有个系统的认识,需要借助统计的手段,进一步深化对溶液中蛋白质所倾向于形成的二级结构的认识。借助VMD软件中Graphics菜单下Labels工具栏,使用者可以轻松地实现成百上千万个蛋白质瞬态结构二面角数据的获取,并进一步通过统计分析,可以从中得知分子倾向形成的构象。
以本课题组所做的重水中的A β 37-42片段的100万个瞬态结构为例,进行统计分析后发现其第一对骨架二面角在($\phi $=-65°,ψ =177°)、($\phi $=80°,ψ =6°)与($\phi $=-80°,ψ=- 8 °)处所出现的次数最多,倾向于形成这些构象。研究结果有助于学生对生理环境下蛋白质倾向于形成的二级结构,以及分子内分子间可能存在的非键相互作用有更为深入的了解。
4 结论
将可视化软件VMD引入高校生物化学及蛋白质组学等课程的教学中,能够更好地为教学服务,让学生通过三维立体图像更直观地认知蛋白质构象特征。同时,软件的应用提升了课堂多媒体演示的可操作性,也方便学生课后根据需要,自行选取相关的蛋白质结构文件进行复习,从而大大激发学生探究微观世界的兴趣与积极性。