January 24,2007 14:40

Likelihood Ratio Test

Likelihood Ratio Test,簡稱LRT,是一種用來比較兩種模型的統計方法。它的原理是將一個複雜的模型拿來和另一個簡單的模型比較比較,判斷這個複雜的模型在詮釋一組特定的統計資料時是否比另一個模型更合適。
這種方法只適用於比較hierarchically nested models,也就是複雜的模型和簡單的模型比較,它們的差異僅止於參數的多寡。以PAML中所建議的一個site-model LRT pairs為例:

M1a (NearlyNeutral)-M2a (PositiveSelection)
Parameters of M1a: p0 (p1 = 1 – p0), ω0 < 1, ω1 = 1
Parameters of M2a: p0, p1 (p2 = 1 – p0 – p1), ω0 < 1, ω1 = 1, ω2 > 1

M2a多出了p1和ω2兩個參數。因為M1a的p1和M2a的p2並不是自由的參數,所以不算在參數的差異內。

在理論上增加更多參數可以得到和真實情況更高的近似度,但是如果一個複雜的模型與簡單模型相比,相似度沒有顯著提高,這時候我們只要使用簡單的模型來詮釋研究資料就可以了。LRT的功能便是幫助我們找到最能代表資料的簡單模型。

LRT的方法是比較兩個模型的likelihood scores,它的簡單公式如下:

LR = 2*(lnL1-lnL2)

以PAML的codeml程式為例,在它的main output file (mlc)內即有lnL的數值。

LRT的統計分部和chi-square分布大致相同,因此只要知道自由度,便能藉由查表的方式知道LRT結果是否顯著。LRT的自由度為較複雜的模型所增加的參數數量。以M1a-M2a的LRT為例,自由度便是2。

——

http://www.molecularevolution.org/resources/lrt.php

這是在練習PAML時去查的資料,事實上有些解釋會用到更複雜的數學公式,而這個版本的內容比較簡單易懂,而且也能直接套用在PAML的運算結果上。

  • praimetiz 發表於樂多回應(0)引用(0)邪魔學徒的私人研究參考書編輯本文
    樂多分類:學術/學習切換閱讀版型 │昨日人次:9 │累計人次:10448
     

    引用URL

    http://cgi.blog.roodo.com/trackback/2666723