3.Conservation Analysis
1) Pipeline
2) Data Structure
- 程序下载与安装:进入 MEGA官方网站 ,分别下载并安装与计算机操作系统(McOS、Windows、Linux等)相应的软件版本。目前推出了MEGA7.0版本,本节主要介绍这种软件最新版本构建系统进化树的方法。
- 准备材料:下载已经准备好的拟南芥SWEET家族Protein序列的fasta格式文件,“clustal.fa”。
2a) Inputs
Format | Description | Notes |
---|---|---|
fasta | 多个蛋白序列或核酸序列的集合 | 用于进行序列比对分析 |
mega | MEGA软件进行序列分析结果 | 用于MEGA软件系统发育树构建 |
2b) Outputs
Format | Description | Notes |
---|---|---|
mega | MEGA软件进行序列分析的结果 | 用于MEGA软件系统发育树构建 |
EMF | 发育树导出格式之一 | 独立的格式,可以保持图形精度 |
PNG | 发育树导出格式之一 | 位图文件格式,图片存在压缩,可用多种浏览或编辑软件打开 |
TIFF | 发育树导出格式之一 | 文图文件格式,印刷常用的图像文件格式 |
发育树导出格式之一 | 常用的文档格式 |
3) Running Steps
MEGA7.0分析流程
Step1. 打开软件 :双击MEGA程序图标,打开程序,如图3-1所示。
图3-1 MEGA程序主界面
Step2. 打开序列文件:点击“File”菜单,选择“open a file/session···“,在对话框中找到准备好的 clustal.fa
文件,打开,出现对话框(如图3-2所示),选择“align”进行比对,打开序列比对窗口(如图3-3所示)。
图3-2 程序设置对话框
图3-3 多序列分析窗口
Step3. 进行多序列比对分析:选中所有序列,选择 Alignment
菜单中 Align by ClustalW
选项(如图3-4 所示),用ClustalW程序进行多序列比对,弹出参数设置对话框(如图3-5 所示),使用默认参数,按“OK”键开始比对。比对结束后,选择 Data
菜单中 Export Alignment
-> MEGA format
选项(如图3-6 所示),将多序列比对结果导出为MEGA格式保存,保存为 clustal.meg
备用,关闭序列比对窗口。
图3-4 多序列比对分析窗口
图3-5 多序列比对参数设置对话框
图3-6 多序列比对结果保存窗口
Step4. 对序列进行发育树分析:回到MEGA主窗口,选择“Plylogeny”按钮,从中选择构建系统发育树的方法,这里以最邻近法为例,进行介绍(如图3-7 所示)。打开前一阶段生成的clustal.meg打开,弹出“Anaylsis Preferences”对话框(如图3-8 所示),可以对发育树分析的一些参数进行设置。通常情况下,我们修改“Test of Phylogeny”选项,改为“Bootstrap method”方法,然后修改“No. of Bootstrap Replication”为1000,即重抽样的重复数为1000.其他设置均为默认。
图3-7 序列比对结果分析窗口
图3-8 发育树构建对话框
Step5. 个性化视图设置和结果导出:程序运行结束后,弹出“TreeExplorer”窗口(如图3-9 所示),窗口内显示构建的发育树。可以通过“View”菜单下的子菜单,对发育树进行修改。例如“view>option”菜单(图3-10)所示,可以设置不同类型的发育树的枝长,间距,标签的类型和颜色等。最后,将设置完成的发育树,通过“Image”菜单,可以导出EMF、TIFF、PNG或PDF格式(如图3-11所示)。
图3-9 “TreeExplorer”窗口
图3-10 发育树视图效果参数设置窗口
图3-11 PDF格式保存效果
4) Tips/Utilities
目前构建系统进化树的软件和算法有很多,在维基百科中的列举List of phylogenetics software就多达60种以上。下表3-1是列举了现在几种常用软件,其中MEGA是最主流的进化分析软件。
表3-1 分子进化与系统发育主要分析软件
软件名称 | 网址 | 说明 |
---|---|---|
MEGA | http://www.megasoftware.net/ | 美国宾夕法尼亚州立大学Masatoshi Nei开发的分子进化遗传学分析软件 |
PHYLIP | http://evolution.genetics.washington.edu/phylip.html | 美国华盛顿大学Felsenstein开发的一套集成的进化分析工具 |
PAML | http://abacus.gene.ucl.ac.uk/software/paml.html | 英国University College London开发,采用最大似然法构树和分子进化模型 |
PAUP | http://paup.csit.fsu.edu/ | 国际上最通用的系统树构建软件之一,美国Smithsonion Insitute 开发 |
RAxML | http://sco.h-its.org/exelixis/web/software/raxml/index.html | 大量数据的最大似然法建树常用方法(软件获取地址:https://github.com/stamatak/standard-RAxML) |
MrBayes | http://mrbayes.sourceforge.net/ | 基于贝叶斯方法的建树工具 |
分析流程动画版
另外,我们为上文的分析流程制作了动画,由于 GitBook的局限性,请参见 https://dongzhuoer.gitlab.io/lulab-teaching_book/conservation.html#conservation-gif
- 导入fasta文件
- 多序列比对
- 发育树构建
- 个性化设置与结果导出
5) Homework and more
下载准备好的作业文件,几种代表性作物的NPF家族部分gene的CDs序列集合NPF.fa,根据操作流程的指示,采用多种算法(距离法、最大简约法和最大似然法等)进行系统发育树的构建,并进行比较。