2009年11月11日水曜日

A Genealogical Interpretation of Principal Components Analysis

PLoS Geneticsの記事

最近,ゲノムワイドのSNPデータについて主成分分析(PCA)を行う解析方法が流行っておりますが(過去の記事),そもそもそれが何を意味するのかは明らかになっていませんでした.方法としては,サンプルのハプロタイプとSNPの有る無しのマトリクスを作ってそれについて主成分分析をするという単純なものです.

広く使われているにも関わらず,何となく気持ち悪い方法だったのですが,この論文では,Genotypeデータを用いたPCAは二つのアリルの平均coalescent timeをもとに成り立っているという理論的根拠が与えられました.当たり前のように感じる結果ですが,きちんと証明されることは良いことだと思います.