\r\n\r\n
UPGMAと隣接結合木の主な違いは、それぞれの手法が生成する系統樹の種類である。uPGMAは根付き系統樹を構築する手法であり、隣接結合木は根付きでない系統樹を構築する手法である。
系統樹とは、生物間の進化的関係を示す樹形図である。系統樹は、構築する手法によって異なるトポロジーを持つことがある。系統樹の構築には、uPGMAと隣接結合木の2つの手法が主に用いられる。
1. 概要と主な相違点 2. UPGMAとは 3. 近隣結合木とは 4. UPGMAと近隣結合木の類似点 5. 横並びの比較 - 表形式でのUPGMAと近隣結合木 6. まとめ
バイオインフォマティクスには様々なクラスタリング手法がある。upgmaはunweighted pair grouping methodとarithmetic meanの略である。階層的なグループ化手法である。この方法は、SokalとMichenerによって紹介されました。系統樹を作成する上で最も高速な手法である。その結果、共通の祖先を持つ根付きの系統樹ができあがります。
UPGMA法で系統樹を描く場合、すべての系統で進化速度が同じであると仮定する。したがって、UPGMAは重要な仮定である。しかし、この手法の最大の欠点は、木を構築する際に突然変異率が考慮されないことである。その代わり、突然変異率は一定であると仮定している。さらに、この仮説は「分子時計仮説」とも呼ばれている。そのため、実際の現場では、UPGMA法で構築された系統樹は正確で信頼性の高いものとは言えないかもしれない。
図01:UPGMAで描いた系統樹
UPGMA法では、ペアワイズ距離を考慮して系統樹を作成する。最初はそれぞれの種がクラスタとなり、進化的な距離が最も小さい2つのクラスタがペアを形成する。そのため、距離行列に依存する。アルゴリズム表現は、UPGMA法で描かれた系統樹のデータを解釈する上で重要な役割を担っている。
Neighbour-joining treeも系統樹の生成に用いられるクラスタリング手法の一つで、斉藤成也や根井正敏がこの手法を導入した先駆者である。UPGMAとは異なり、この手法では根のない木を生成することができる。また、本手法のクラスタリングは超距離に依存しない。しかし、系統樹を構築する際には、進化速度の変化が考慮される。そのため、この手法で描かれた樹木はばらつきがある。そのため、この方法では特殊な数学的アルゴリズムを用いて、これらの変化を評価する。
図02: 近隣結合法から作成した系統樹
この方法では、ツリーを構築する際に、各血統間の距離を個別に考慮する。各血統は、ツリー内で新たに構築されたノードを接続する。これらのノードはすべて、中央のノードに接続されています。そのため、新しいノードが出現した場合、中心ノードから新しいノードまでの距離が重要となり、アルゴリズムを用いて計算される。これらのアルゴリズムデータにより、新しいノードの位置が決定される。
UPGMAと隣接結合木の主な違いは、構築される木の種類である。つまり、UPGMAは根付き木を生成し、近接結合木は根付きでない木を生成する。さらに、UPGMAは信頼性の低い手法であるのに対し、近接結合木はUPGMAよりも信頼性の高い手法である。ここもUPGMAと近接結合木の違いですね。
以下のインフォグラフィックは、UPGMAとネイバーコネクションツリーの違いをまとめたものです。
系統樹を構成する手法として、UPGMA法と近隣結合樹法がある。UPGMA法は進化率を考慮しないが、近隣結合樹法は進化率を考慮して樹を構成する。その結果、NJ-tree法で得られる系統樹は、高い複雑性と信頼性を持っている。しかし、UPGMA法ほど高速ではありません。さらに、UPGMAとneighbor-joining treeの重要な違いは、それぞれの手法で生成される木の種類に依存する。uPGMAは根付きの系統樹を生成し、neighbor-joining tree法は根のない系統樹を生成する。
1. Pavlopoulos, Georgios A et al."A reference guide to tree analysis and visualization", BioData Mining, BioMed Central, 2010年2月22日, こちらからご覧いただけます。