基于生物进化距离(NJ)、统计特征(ML)和离散特征(MP)构建进化树的方法

摘 要:

现代生物学用生物进化树来描述生物之间的进化关系。生物进化树的构建方法包括基于进化距离的邻接法(Neighbor Joining,NJ)、UPGMA法和最小进化法(Minimum Evolution,ME)等,基于统计特征的最大似然法(Maximum Likelihood,ML)和基于生物离散特征的最大简约法(Maximum Parsimony,MP)。

关键词:

基于生物进化距离(NJ)、统计特征(ML)和离散特征(MP)构建进化树的方法

由于生物进化历史是没有文字记载的,后人只能通过史前生物的化石等片面信息来尽可能准确的模拟生物进化的顺序,这就可能会形成错误的生物进化推断历史。随着20世纪中期生物遗传信息研究取得突破进展,人类通过生物的遗传物质来研究其进化历史成为可能。

现代生物学用生物进化树来描述生物之间进化关系,两种(或者多种)生物如果在同一层节点,则表明该组生物进化距离较近(即从同一祖先进化而来的可能性较大);反之,表明这些生物之间的生物差异性较大。

生物进化树可以根据其是否按照进化距离构建来分类,这样就有基于进化距离构建的方法和基于统计特征或者生物离散特征构建的方法。基于进化距离的构建方法主要有邻接法(Neighbor Joining,NJ)、UPGMA法和最小进化法(Minimum Evolution,ME)等,基于统计方法的构建主要有最大似然法(Maximum Likelihood,ML),基于生物离散特征的构建方法主要是最大简约法(Maximum Parsimony,MP)。

UPGMA方法是基于距离的进化树构建方法,该方法思想是:将两个进化距离最近的物种合成到一个复合物种组中,然后将新的距离矩阵中距离最小的两个物种再次合成一个复合物种组,如此反复,直到所有的物种都被聚为一棵进化树。UPGMA方法的使用有一个前提,即假设一棵进化树中所有物种的进化速率是相同的。

邻接法(Neighbor Joining,NJ)是距离法建树中比较有实用价值的方法。与UPGMA相比,NJ方法不用假设进化树中所有物种的进化速率相同,因此在大多数情况下比较令人信服。该方法思想是:通过确定距离最近的成对分类物种组来使进化树的进化距离之和达到最小。在进行序列合并时,不仅要满足待合并序列进化距离的相近,同时也要求待合并的序列与其它序列的近似距离较远。

最大似然法(Maximum likelihood,ML)于1981年被提出,该方法构建思想基于统计学。在预先选择的进化模型下计算每一种进化树生成的可能性,选择最大可能性的进化树即为最大似然树。最大似然法在构建进化树的准确度方面很高,但是在处理大数据量时效率比较低,并且对模型的依赖比较严重。

最大简约法(Maximum parsimony,MP)依据各个位置上由一条生物序列突变成另一条生物序列所需最小数量突变来进行比较分析和聚类树生成,最终的进化树是基于整条序列所需的突变总数的。

    A+

除注明外,本站内容由 细菌之家 原创或整理,转载请注明出处及链接。

本文永久链接: http://www.bacteria.cn/html/2014/909.html

  • 请您留言:专业水平所限,谬误之处在所难免。如您发现不正之处,请在下面留言,谢谢!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

图片 表情