2011年12月28日水曜日

2011年仕事納め

最近の忙しさにかまけて更新をさぼっているうちに気が付けば今年も終わりになりました.

向こうも忙しいのは重々承知ですが,論文をサブミットしてすっきりして今年の仕事を終わろうと思っています.クリスマスシーズンは避けたので何とか許してほしいところです.

来年は,どんな年になるでしょうか.みなさんぼちぼち頑張りましょう.

2011年12月11日日曜日

タイワンザル

一週間の台湾滞在を終えて本日帰国します.台南にて集中講義とシンポジウム出席を果たしてきました.

少しだけあった自由時間を利用して高雄市にいる野生のタイワンザルコロニーを見てきました.タイワンザルは系統的にも少し謎なところがあり,興味深い動物です.

2011年11月30日水曜日

12月

あっという間に11月も終わりです.もうすぐ遺伝研に移って二年が経つところです.

来週は台湾成功大学で数日間集中講義を行ってくる予定なので暇を見てレポートいたします.

そのあとは毎年恒例,分子生物学祭りに参加予定です.

2011年11月2日水曜日

転写後のエキソンシャフリング


最近はシークエンサーの性能が上がったおかげで色々なことがわかってきます.

Post-transcriptional exon shuffling events in humans can be evolutionarily conserved and abundant

エキソンの位置が進化の過程で再配列されることをエキソンシャフリングと呼びます.多くはゲノム配列上での再配列が原因であると考えられていますが,mRNAに転写された後にエキソンの順番が入れ替わるようなスプライシングが起こるものが結構あるようです.このような転写産物が逆転写されてゲノムに組み込まれれば,ゲノムの進化にも寄与するのではないかと思われます.

2011年10月9日日曜日

マカクの薬剤代謝遺伝子CYP1A2は何故多様性が高いのか?

自分の論文の宣伝ばかりで申し訳ないですが,もう一本.

Yasuhiro Uno, Naoki Osada*. CpG site degeneration triggered by the loss of functional constraint created a highly polymorphic macaque drug-metabolizing gene, CYP1A2. BMC Evol. Biol. 11:283 (2011) [Link].

新日本科学の宇野先生との共同研究です.この研究ではCYP1A2という薬剤代謝に関係する遺伝子の多様性が何故旧世界ザルのマカク属で高くなっているかということの理由を探っています.

CYP(シトクロームP450)遺伝子は一般には薬剤代謝遺伝子としてよく研究されている遺伝子群で,ヒトでは約60種類ほどの遺伝子がゲノムの中に存在します.その中でもCYP1A2は肝臓での薬剤代謝の多くを担う遺伝子です.

マカク属のサルは薬の全臨床試験でよく用いられるサルです.これまでの先行研究ではマカク属のサルであるカニクイザル(ニホンザルとも近縁です)のCYP1A2遺伝子は他の遺伝子と比べて有意に高い多様性を持つことが報告されていました.CYP遺伝子は薬学分野では薬剤を代謝する酵素として知られていますが,自然界に薬が存在するわけではありません.どうして自然に生きる生物が薬剤代謝酵素を持っているかというのは難しい質問ですが,おそらく植物などの二次代謝物を解毒化する作用があるのではないかと考えられています.植物は自分から動いて捕食者から身を守ることができないので,代わりに多くの二次代謝物を産生することによって自分を守っています.麻薬などにもなるアルカロイド化合物はその良い例でしょう.

したがって,多様なCYP遺伝子を持つことは解毒できる化合物のレパートリーを増やすことになり, ある条件下では遺伝子の多様性が有利に働くことが想像できます.こういった自然選択は平衡淘汰と呼ばれ,免疫に関わるMHC遺伝子の進化の例などが知られています.

それでは本当に自然選択でマカク属のCYP1A2遺伝子の多様性が説明できるのか?他の説明も可能ではないのか?

論文では色々な解析を行い幾つかの仮定を排除しているのですが,ここでは要点だけ述べます.私たちが発見したのは,当初の予想と異なり,多くのサル個体がかなりの高頻度で遺伝子の機能がおかしくなった不完全なCYP1A2配列を持っていたことでした.また,遺伝子発現を調べた最近の先行研究では,マカクではCYP1A2の重複遺伝子であるCYP1A1が主に発現しており,CYP1A2の発現は非常に弱くなっていることがわかってきました.

遺伝子発現が弱く,機能していない配列が頻繁にみられるということはマカクのCYP1A2はほとんど機能していないと予想できます.しかし,機能がなくなったという説明は高い多様性がみられたということと矛盾してしまいます.遺伝子が機能を失い中立的に進化すると,その進化パターンは他の機能を持たない領域の進化と同じようになってしまうと予想されるからです.それではどうやってこの矛盾は解消できるのでしょうか.

この問題はしばらく僕の頭を悩ましていたのですが,実は答えはとても単純でした.CYP1A2の変異の有ったところをよく見てみると,その多くはCpGサイト(Cの後にGが続く二塩基)に起こったものでした.哺乳類のCpGサイトの多くはメチル化されており,メチル化されたCは通常の10倍以上の確率でTに変わりやすくなります.

10倍以上変異率が高いということはCpGは哺乳類では急速に失われていくことが予想されます.実際にゲノム全体でCpGの頻度を数えてみると,多くの領域ではCpGはランダムな組み合わせより低くなっています.ところが,遺伝子の近傍や遺伝子内の領域ではCpGはある程度の数に保たれていることがわかっています.何故遺伝子領域でCpGが高くなっているかについてのはっきりとした答えはまだわかっていませんが,アルギニン(CGN)などのタンパク質をコードするものや遺伝子の発現に関わっているものなどがあると考えられています.

さて,霊長類のCYP1A2遺伝子のタンパク質コード領域にあるCpGを見てみると,およそ8%ほどのサイトがCpGサイトであることがわかっています.これは全遺伝子のうちトップ10%に入るので,CYP1A2遺伝子はもともとCpGが多い遺伝子であるということができます.

これらのことを考えると一つのシナリオが提案できるでしょう.つまり,遺伝子がちゃんとした機能を持っている時はCpGの数は負の自然選択により一定に保たれていますが,遺伝子が死ぬとそこに含まれていたCpGサイトが急速に崩壊を始めます.マカクのCYP1A2はまさに遺伝子が死にかけているところを私たちが観察しているのだということができるでしょう.

今回の研究では薬剤代謝遺伝子という特殊な例を挙げましたが,上のCpG崩壊のシステムは恐らくもともとCpG含有率の高い多くの遺伝子に当てはまる可能性があります.今度は逆に,CpGの崩壊率を調べることにより,死にかけている遺伝子を効率よく発見できるようになるかもしれません.

2011年10月6日木曜日

新学術領域 ゲノム・遺伝子相関

日帰りで忙しかったですが,京都で行われた新学術領域 ゲノム・遺伝子相関のキックオフシンポジウムに参加してきました.

発表全体は非常にクオリティが高かったと思います.現在,公募研究の募集が行われています.ゲノム相関といってもピンとこないかもしれませんが,生殖隔離,エピスタシス,性のコンフリクトなど生物学としてとても面白い現象がこれらに含まれると思います.今回の研究計画とは関係ありませんが,僕の核-ミトコンドリアの相互作用に関する研究も内容的には含まれるでしょう.また,別の科研費をもらっている異質倍数体の解析も含まれると思います.

5年間という比較的長い期間が与えられていますので,できるだけ良い結果を残せるように頑張りたいと思います.

霊長類の核由来ミトコンドリア遺伝子はなぜ早く進化したのか?

MBEにアクセプトされていた論文が最終的な形で出版されました.

Naoki Osada*, Hiroshi Akashi. Mitochondrial-nuclear interactions and accelerated compensatory evolution: Evidence from the primate cytochrome c oxidase complex. Mol. Biol. Evol. (2011) [Link]. 

哺乳類の中で霊長類にだけみられる現象として,ミトコンドリアで働いている遺伝子の進化が早いことがあります.特に,核にコードされているミトコンドリア遺伝子ではアミノ酸置換が突然変異率(正確には同義置換率)よりも高くなっているサイトがいくつか発見されており,いわゆる正の淘汰が働いたのだろうと言われていました.

ミトコンドリアではミトコンドリアにコードされた遺伝子と核にコードされた遺伝子が協力して一つのタンパク質複合体を作っていることが知られています.僕がまだ進化の理論について詳しくなかった大学院生のころ,サルとヒトの遺伝子を比べてこのような進化が早くなった遺伝子を見つけようとしたのですが(ほぼ独学で書いた初めての分子進化に関する論文です),その研究でも核にコードされるミトコンドリア遺伝子がいくつか候補として挙がってきました.

実はそれより少し早くにアメリカのグループが同じようなことをしており,彼らは何故このような進化の加速が起こるかについて,巨大になった霊長類の脳が効率よく酸素をエネルギーとして使えるように共進化が起こったという仮説(脳エネルギー仮説)というものを唱えていました.当時の僕はそれほど深く考えることはできなかったので,まあそうかなというくらいの意見でしたが,最近になって別の仮説で説明できるのではないかと考えて行った研究が今回の研究です.

鍵となるのはミトコンドリアゲノムの特異性です.集団遺伝学の立場から見てみると,ミトコンドリアゲノムは主に三つの点で核ゲノムと異なります.一つ目は組み換えが起きないこと,二つ目は(哺乳類では)突然変異率が高いこと,三つ目は集団サイズ(集団の中にあるコピー数)が少ないこと,が挙げられます.

この三つの要素はすべて 自然選択にとって良くない方向に働きます.組み換えが起きないということはいったん固定した有害な変異がなかなか取り除かれないことを意味します.また,突然変異のほとんどは有害ですから,変異が多いということは有害な変異もたくさん起こることを意味します.集団サイズが小さくなるとやや有害な変異が遺伝的浮動によって集団中に固定してしまう確率が高くなります.

霊長類では特にミトコンドリアでの突然変異率が高いということが知られています.また,集団サイズの減少によるやや有害な変異の固定が多く起こっていることも知られています.

以上のことを考えると次のような仮説(Compensatory Weak Selection (CWS) モデル)が立てられます.

1) 霊長類では集団サイズが小さく,ミトコンドリアの突然変異率が高い.したがってやや有害な変異の固定が速いスピードで起きている.

2) 核の遺伝子でミトコンドリアに起こった有害な変異を補完するような置換が起こったときは,それは適応的な変異として認識される.ミトコンドリア遺伝子の進化の速度は速いので,最終的な適応度が全く変わらなくても,核の方から見ると進化速度の加速が起こる.例えるなら,早く進むミトコンドリアに核が一生懸命追いついているイメージです.

以上の仮説では,特に霊長類に特異的な表現型を持ち出さなくても,突然変異率と集団サイズの違いだけで観察されるパターンを説明できます.もちろん脳エネルギー仮説は面白い仮説ですし,それを否定することはできません.が,どちらが好きかといわれると,例外的な規則ではなく,一般的なメカニズムで説明できる方が僕は好みではあります.

この理論は更にもう一つ重要な予測をすることができます.それは,核遺伝子の補完的な変異はミトコンドリア遺伝子の有害な変異が起こった後に起こるということです.今回研究の題材にしたCOX遺伝子はタンパク質複合体の立体構造が解明されていますから,変異を起こしたアミノ酸が相互作用を起こしそうかどうかは実際の立体構造に照らし合わせることにより判断できます.実際にタンパク質の進化を見てみると,ミトコンドリア遺伝子のあるサイトで変異が起こった時にその近くの核遺伝子のサイトでは,より高い確率で,後に核遺伝子に変異が起こったことがわかります(逆の方向はない).

集団遺伝学の基礎知識,理論的予測とコンピュータシミュレーション,分子進化学的手法による加速進化の証明,タンパク質の立体構造,変異の順番を確かめる統計的手法と盛りだくさんで,これまで自分が書いた論文の中でもかなりギッシリと詰め込んだ内容になっています.

2011年9月30日金曜日

久しぶりの単著

随分前に書いた後,しばらくお蔵入りになっていた論文がパブリッシュされました.

Naoki Osada. Phylogenetic inconsistency caused by ancient sex-biased migration. PLoS ONE 6: e25549.

ほんとにちょっとした話です.系統樹を書いたときにミトコンドリアや常染色体で系統関係が違うことはよくありますが,それが性による移住割合の偏りなどのせいであると結論付けることができるのか,という内容です.

現在の集団から多型を調べた場合は移住率の推定ができるので割とうまくいくのですが,現在いる集団の共通祖先より前に起こった過去の移住は移住率が推定できないので,結局大したことは言えないという,当たり前と言えば当たり前の結論です.

非常に簡単な計算をしただけの論文ですが,今まで誰もちゃんとやっていなかったので,簡単なガイドラインになると良いと思っています.

2011年9月12日月曜日

誤植

論文を書いている限りは誤植の恐怖は常に付きまといます.今日はこんなのを見てしまいました.

P < 5 x 105

明らかに-5の誤植とわかるのでそれほど気にはならないのですが,著者は少しヒヤリとしているでしょう.

2011年9月6日火曜日

ダッシュ,添え字

先日受け取った論文の校正でハイフン関係があらかた直されていました.ダッシュとハイフンの違いについては以前のエントリーでおさらいしましたが,まだまだ勉強不足だったようです.

Wikipediaを見てみると,人の名前をつなげるようなときは,ハイフンではなくen dashを使うようです(例:Mann—Whitney U test).ただし,名前がペアとして慣用的に使われている場合はハイフンでいいというようなことも書いてあります.複雑ですが,基本的にはen dashということで問題ないと思います.

他の論文も調べてみましたが,両方が混在していて実はかなり適当なのではないかと思います.とりあえず今回の編集者は細かいところまで見てくれたようです.

もう一点は,記号の斜体です.量や変数を表すアルファベットは普通斜体になりますが,それに添え字がつくときがあります.こちらのサイトを見たところ,添え字が量や変数を表す場合はイタリックなのですが,そうでない(例えば変数に説明を加える添え字)場合は,添え字は普通の字体になるようです.

集団生物学では有効な集団の大きさをNeで表しますが,このeはイタリックでない方が正解だと思います.論文や教科書を見てもeがイタリックなものは結構あるので,それほど気にする必要はないのかもしれませんが.

さらに,上記のNISTの文書では

"Because the comma is widely used as the decimal marker outside the United States, it should not be used to separate digits into groups of three. Instead, digits should be separated into groups of three, counting from the decimal marker towards the left and right, by the use of a thin, fixed space. However, this practice is not usually followed for numbers having only four digits on either side of the decimal marker except when uniformity in a table is desired."

と書かれています.数字4桁の場合はカンマは要らないのは知っていましたが,スペースを空ける書き方が推奨されているのは知りませんでした.

2011年9月5日月曜日

8語に32ドルを払う

つい最近,Molecular Biology and Evolution(MBE)であったリトラクション(論文取り下げ)が海外のサイトで取り上げられていました.MBEはよくお世話になる雑誌なので気になるところです.

取り下げの理由自体は,不正というよりは大きな解析ミスに著者のグループが気付いたのが理由とのことです.僕も何度か自分の論文のデータが間違っていた夢を見たことがあるので,これには同情します.しかし,その後の出版社の対応がお粗末でした.

まず,雑誌にはリトラクションされたという一言があるだけで,どのような理由なのか,もともとどのような論文だったのかというのを読者が知る機会がないこと.これは一般のポリシーに反するようです.確かにPumMedにタイトルその他が載ってしまうことを考えると,少なくともアブストラクトやどのような理由で取り下げられたのかくらいは知りたいところです.

もう一点は,"This article has been permanently retracted from publication by the authors."というリトラクションの文章を見るのに,雑誌を購読していない人は32ドルを払わなければいけない仕様になっていたことです.購読していない人には,”This article has...",だけが表示されるということですから,実質8語に32ドルを払うことになります.よっぽどのもの好きでなければ払う人はいないでしょう.さすがにこれは編集のミスで,その後に修正されているようです.

論文の不正によるリトラクションでは写真の使いまわしや二重投稿が中心になっていると思います.MBEはそのようなデータはほとんど扱っていないので,リトラクションになる論文は少ないはずです(といってもデータの性質上見つかりにくいだけで,不正がないとは言い切れないでしょう).

敢えて好意的に解釈すると,今回のお粗末な対応は編集者がリトラクションになれていなかったからであると思います.

2011年8月31日水曜日

サイエンスとパブリケーション

サイエンスとパブリケーションは,生物学の分野では(他の分野と比べても)かなり大きな問題になっていると思います.インパクトファクター至上主義はまずいとみんなが何となく思いつつも,他に代替案が見つからないのでどんどん袋小路に向かって進みつつあるのではと思います.

また,最近はオープンアクセスジャーナルが乱立されて,読むのが大変になってきました.やはりオープンアクセスは質の確保が一番難しいのではないかと思います.確かに中には光るものもありますが,よくわからない論文もたくさんあります.

ジャーナルタイトルもきわどいのがあったりします.さすがにCellsは紛らわしいのではないでしょうか.

2011年8月24日水曜日

クリップボードのDNA配列を相補鎖にする

ここしばらく手作業でDNA配列を扱っていかったのですが,ちょっと用事があって昔に(10年くらい前?)書いたスクリプトを使いました.今でも結構便利だと思ったのでダウンロード可能にしておきます.

WindowsのクリップボードのDNA配列を相補鎖にして,中身を書き換えるPerlスクリプトです.WindowsにPerlは標準装備されていないので少し微妙な組み合わせですが...

revcomp_clip.pl

2011年8月23日火曜日

Theory of adaptation

進化遺伝研究部門では月一度の割合で,遺伝研の色々な研究グループが集まって進化に関するディスカッションを行う集まりを主催しています.論文紹介というよりは一つのテーマに沿って,論文をもとに1時間か2時間くらいディスカッションをするものです.

本日あったジャーナルクラブの話題はadaptation(適応)だったのですが,昔読んだ論文をよく思い出せなかったので,再びA. Orrの二本の論文を読み返してみました.一つは1998年のEvolution,もう一つは2005年のNat. Rev. Genet.に載ったものです.

生物がどのように環境に適応していくかというのは進化学の中心となる話題の一つですが,理論的な研究で最も有名なものはR. Fisherのgeometric modelと呼ばれるものです.よく例えられる例としては,生物の適応進化は顕微鏡の視野の中心にある点(進化の最適値)を合わせるようなもので,ちょっとずつ視野を動かしていけば徐々に良い方向に向かっていけるが,大きく動かすと全然違う場所に視野が移る確率が高くなってしまうので,適応は小さい変化が中心となっておこるというものです.

この理論はのちの研究者にも引き継がれ,もともとの理論はかなり修正もされています.A. Orrはこの理論の発展に大きく貢献していますが,彼の現在の研究はショウジョウバエの実験が中心なので,最初この論文を読んだときはものすごい幅広い才能のある人だと驚いたことを覚えています.

内容を簡単にまとめると.

1. Fisherのモデルでは,有利な変異が集団に固定する確率が高いということが考慮されていなかった.これを考えたのが木村先生のモデルで,大きな効果のものはそれだけ集団中に広まりやすいので,最適値からの距離の効果とは打ち消しあう.その結果中間的な大きさの効果を持った変異が一番たくさん固定する.

2. ところが,これらのモデルを考えるときに問題となるのは,変異の効果の大きさ(表現型に対して大きな効果を与える変異・小さな効果を与える変異)の単位である.Fisherのモデルでは最適値から現在の値への距離ですべてが基準化されている(逆にいうと,現在の値がどのような値でも成り立つ法則である).

3. したがって,現在の値が最適値に近づくにしたがって,集団に広まる変異の大きさも小さくなってくる.つまり,進化は最初大きなステップ(一回ごとの変化の大きさ)で起こり,徐々に小さなステップによって刻まれることになる.そして,この時の最適値に近づくステップの距離の期待値はべき乗にしたがって短くなっていく.更に,適応過程全体を見ると,ステップの分布は指数関数分布に近くなる.

で,昔読んだときにはあまり理解できていなかった内容ですが(忘れてしまっていたのでたぶん理解が浅かったのだと思います),改めて読んでみるととても明快で面白い内容でした.直感的に考えると当たり前のことのようにも感じますが,数学的な形で示されることは大事なことであると思います.

Fisherの理論はかなり古臭いイメージもあり,現在は語られることも少ないものです.教科書にもあまり載っていませんが,重要なので知っておいて損はない理論であると思います.

2011年8月15日月曜日

Nature e-alerts!

この娘はNatureに自分の論文が載ったのでしょうか?

ただ雑誌の目次が送られてきただけにしては喜び過ぎです.



さて、お盆ですが普通に仕事をしています.投稿していた論文の雑誌の編集者から正式なアクセプトの通知が着ました.

まだまだ色々と片付いていません.

2011年8月4日木曜日

SMBE2011

SMBEが終了しました.その後に遺伝研を訪問する人もあり,今日になってやっと落ち着いた感じです.

で,最近になってまたグラントが一つ通りました.お金があるのは良いことなのですが,科研費3割お預け状態の話もあり,中々思い切った計画が立てられません.プロジェクトものなので,他の方の足を引っ張らないように頑張りたいところです.

遺伝研は研究に使える時間は多いのですが,如何せんやらなければいけない研究の量が多すぎるので, これまでやってきた細々とした事項にケリをつけて本格的に次に進まなければいけません.徐々に片付きつつはありますが,幾つかはまだ消化不良の状態で残っています.

2011年7月21日木曜日

クロジョウジョウバエ(黒猩猩蠅)

先日遺伝研の五條堀研に根井先生が訪れてましたので,少し雑談をする機会をいただきました.

その時にふと話の流れで出てきたのですが,昔の遺伝学雑誌なんかを見ると日本でもクロショウジョウバエ(Drosophila virilis)を使った研究が非常に多いことに気づきます.

今ではショウジョウバエといっただけでキイロショウジョウバエ(D. melanogaster)を指すくらい,melanogasterがメジャーになっていますが,実験に使う材料にも色々と流行り廃りの時代の流れがあるのでしょうか.virilisは大きいので飼いやすいのは容易に想像できますが,僕はハエは専門ではないので,詳しいいきさつは良くわかりません.昔の系統は今も生き残っているのでしょうか.

2011年7月20日水曜日

不均衡進化理論

進化に関する説は諸説ありすぎてすべてはフォローしきれていないのですが,不均衡進化理論という言葉をたまたまネットの検索で発見しました.

を読まずに批判するのもなんですが,ラギング鎖とリーディング鎖の突然変異率の違いが理論の基本となっているようです.ただ,不均一な突然変異率自体は新しい考えではなく,1987年のWu & MaedaのNatureの論文でこれは既に発見されていますし,複製起点を発見するために用いられるGC skew plotなんかもこれをもとにしています.

それから,突然変異がランダムに起こるというのと均一に起こるというのは意味がまったく違うと思います.ゲノムのどの場所にも同じ確率で突然変異が起こると考えている遺伝学者は今は皆無でしょう.

ランダム性というのは量子力学や熱力学で使われているのと同じ意味で使っているわけです.巨視的にみると必然的に動いているが,個々の要素を取り出してみるとその挙動は予測不能であるということを指してランダムと呼んでいるのではないでしょうか.いくら変異率が上がってもやはり突然変異自体はランダムであると思います.

2011年7月13日水曜日

短い雑誌の名前

略語を除くと,

AGE
EYE
FLY
GUT

医学系が多いですね,その中でもハエは頑張っております.

2011年6月30日木曜日

SI接頭辞

以前も同じことを調べたのですが,忘れてもう一度調べてしまったので忘備録.

塩基配列の距離(に限らないわけですが)を表す時に,何故キロベースはkbでメガベースがMbなのか.つまり何故Mは大文字でkは小文字なのか.

基本的には1より小さい値を表す接頭辞(ナノとかピコとか)は小文字,大きい方(103以降)は大文字ですが,キロだけは7つの基本単位の一つであるケルビン(K)とかぶるために小文字のkが使われていると思われます.

2011年6月25日土曜日

スカシユリ

人に頼まれて,スカシユリ(Lilium maculatum)のサンプリングに西伊豆方面に行ってきました.

植物の多様性は混とんとしすぎているのであまり深入りはしていませんが,たまには実験室を離れて実際の生物に触れ合うのも精神衛生上良いことだと思います.

2011年6月20日月曜日

集団構造の解析

Marko P, Hart M (2011) Retrospective coalescent methods and the reconstruction of metapopulation histories in the sea. Evolutionary Ecology: 1-25.

以前からの記事のトピック(集団構造とcoalescent)に関連した論文です.海洋生物が専門の著者の方々のようですが,最初の三つのセクションはとても良いサマリーになっています.後半はじっくりと読んでいないので評価できませんが,前半だけでも頭の中を整理するために読む価値はあります.

2011年6月13日月曜日

単座位多サンプルの解析

Maruvka YE, Shnerb NM, Bar-Yam Y, Wakeley J (2011) Recovering population parameters from a single gene genealogy: An unbiased estimator of the growth rate. Mol Biol Evol 28: 1617-1631.

先日の続きです.座位数が少ない場合に,塩基多様度などの所謂summary statisticsの分散はサンプル数が多かったとしてもとても大きくなることはわかっていますが,サンプル数を増やすことで別の情報が得られないかというのがこの論文です.

もちろんアイデア自体は昔からあるのですが,この論文ではnumber of lineages as a function of time (NLFT)というsummary statistics(のようなもの)を提案しています.これはある時間における系統の数を表しています.

実際の内容は論文を読んでもらえばわかるとして(細かい計算はともかく,イントロはうまくまとまっています),直感的には単位時間当たりのcoalescent rateは集団サイズと負の相関を示すので,サンプルが多ければ多いほど単位時間あたりに存在する系統が多くなり,coalescent simulationを用いずにわりと正確にその時の集団サイズが推定できるはずです.

2011年6月11日土曜日

モデルに基づいた検証の重要性

Beaumont MA, Nielsen R, Robert C, Hey J, Gaggiotti O, et al. (2010) In defence of model-based inference in phylogeography. Mol Ecol 19: 436-446.

少し前の論文ですが取り上げます.これは,名だたる統計生物学者のオールスターズが連名である人のある方法をフルボッコにする論文です.

生物の集団内の構造と歴史,近縁種との関係などを現在の地理的分布などと絡めて研究する分野をphylogeographyと呼びます.有名なところではJ.C.Avise(c.f., 生物系統地理学―種の進化を探る)の一連の研究があります.こういった研究が生物の歴史を知るのにとても重要なことであることは確かでしょう.

ただし,こういった研究の多くはその簡便さから一座位(多くはミトコンドリア座位)のデータを使うことが多く,Genetic Driftの効果が大きいということは指摘されていますし,僕も以前のエントリーや学会の発表などで指摘させてもらっています.

で,こういった研究の多くは,数学的に厳密なモデルにしたがって歴史を推定するのではありません.例えば,距離的に生息域の近い種がより近いクラスターを系統樹で形成すれば,Isolation by Distance(距離による隔離)であると推定し,ある一つの集団が他と比べて少ない多様性を持っているようであれば,Bottleneckがあったと推定する,といったように観測者の主観が入り,人によって得られる結論が違ってくる可能性があります.

恐らくそこを克服するために考えられたのが,A.TempletonのNCA(Nested Clade Analysis)と呼ばれる方法とその派生法です.僕は実際には使ったことがないので,細かいところは間違っているかもしれませんが,サンプルの系統樹と地理的条件(サンプル場所)を組み合わせてチャート式に解析していくと,Templetonが考えたパターンを導くことができ,「地理的隔離があり,生息域が広がった集団がボトルネックを経験した」のような結論が得られるものです.確かに主観的な要素は少ないような気がします(といってもTempletonの主観に基づくわけですが).

この方法はしばしば批判の的にされています.一つの大きな理由は,Templetonはシミュレーションをほとんど行わないということです.系統樹の一座位のあるパターンは様々なdemographyのモデルのもとに起こりえます.それに反してモデルベースの考え方では,まずdemographyのモデルを考え,その中でどのような系統樹がどのような確率で起こりうるかということを考えます.したがって,推定したパラメータ(移住率や集団サイズ)がどれくらい確からしいかということに対しての検証ができます.

Templetonは自分の方法によほど自信があるのか(確かにNCAはものすごく良く使われてきた方法です),モデルベースの研究への批判,特にABC(Approximate Bayesian Computation)をしばしば論文で批判してきました.その内容は特にABCに限定せず,モデルベースの方法全般を批判しているものが多いのです.

Templetonの主張はわからないわけでもありません.モデルを用いた方法はあくまでもモデルがある程度正しいときにのみ意味があり,まったく的外れなモデルから得られる結果は何の意味もありません.扱っているモデルに妥当性があるかは議論の余地が残るところでしょう.しかし,だからと言ってモデルベースの研究すべてがおかしいという主張にはなりません.また,現在の方法の限界として,パラメータ数の増加による複雑なモデルの検証が不可能ということがありますが,今後計算速度が飛躍的に伸びれば,異なった複雑なモデル間をジャンプするような方法も実用的になってくると思いますので,原理的に間違っているわけではありません.

実際の論文では,NCA(ここではNCPA(改良版なのか名前が変わったのかは僕はチェックしていません))に対してあらゆる角度から批判を行っています.NCPAのカイ二乗検定は統計的に間違っているといった細かいものから,前述のシミュレーションに対する問題など様々です.最終的にはデータをどう捉えるかという統計哲学的な議論になってしまうので答えが出るような形のものではないのかもしれませんが,現在のところモデルベースな考え方の方が色々な点で有効な方法であるというという点は明らかでしょう.

個人的な意見では,ミトコンドリアを用いた集団構造の研究なんかは,データが限られていた時にやむなく使われていた方法であって,これから非モデル生物で多座位(もしくはゲノム全体)の多様性のデータが得られれば,わざわざミトコンドリアのみを用いる理由はなくなってくるはずです.

ただ,前述のように,モデルが自分が現在調べている集団にとって妥当かどうかというのは常に気を付けなければいけません.モデルベースの研究のために多くの既存のソフトウェアがあります.その中身はベイジアンやCoalesenceやマルコフ過程などについての知識がないと理解できない高度なものです.ソフトを使う人すべてがそれを理解することは期待できないでしょう.ただ,少なくともどのような仮定でそのソフトは動いているのか,それを知らないととんでもない結果をつかまされるかもしれないことは意識しておくべきです.

ところで,単座位の解析の信頼性について僕は割と批判的なのですが(もちろん研究自体を否定するわけではありません),別の点から見て単座位でも信頼性のある結果が得られるという面白い論文が最近ありましたのでそれはまたの機会に紹介したいと思います.

2011年6月10日金曜日

共著論文のありがたみ

共著論文が立て続けにアクセプトされました.僕は自分の研究は「役に立たない研究」と自虐的に表現していますが,集団遺伝・分子進化の研究手法自体はは色々なところで社会の役に立っています.そういった意味では自分がサポートした研究が社会に還元される,少なくともその可能性がある,のは大事なことではないかと.

とりあえず,持つべきものは共同研究者です.感謝.

Koei Sato, Akiko Iwata-Takamura, Naoki Osada, Yoshikawa Akira, Yuji Hoshi, Keiko Miyakawa, Yuko Gotanda, Masahiro Satake*, Kenji Tadokoro, Hideaki Mizoguchi. Novel DNA sequence isolated from blood donors with high transaminase levels. Hepatol. Res. accepted (2011).

肝臓でのALT(トランスアミナーゼ,肝炎の指標の一つ)が高い検体から得られた,ウィルス由来の可能性がある二重鎖環状DNAの解析.今後の研究が期待されます.

Alice Aarnink, Pol-André Apoil, Ichiro Takahashi, Naoki Osada, Antoine Blancher*.
Characterization of MHC class I transcripts of a Malaysian cynomolgus macaque by high throughput pyrosequencing and EST libraries. Immunogenetics accepted (2011).

カニクイザル主要組織適合遺伝子(MHC)の,ESTとNGSを用いたタイピング.実験用サルの遺伝子タイピングは製薬企業にとっても重要な問題です.

Renchao Zhou, Shaoping Ling, Wenming Zhao, Naoki Osada, Sufang Chen, Meng Zhang, Hua Bao, Cairong Zhong, Bing Zhang, Xuemei Lu, David Turissini, Norman C. Duke, Jian Lu*, Suhua Shi*, Chung-I Wu*. Population genetics in non-model organisms: II. Natural selection in marginal habitats revealed by deep sequencing on dual platforms. Mol. Biol. Evol. (2011).

マングローブ集団のNGSを用いた集団遺伝学的解析.NGSでマングローブのDNAを読んでみたら集団がほとんどクローンでしたというお話.更に一部の遺伝子のみが淘汰がないと説明できないくらい変異していました.こういった知見は生態保全に役立つでしょう.

2011年6月3日金曜日

NO initial

ちょっとした論文を投稿したんですが,しばらく待たされた後に,サブミッションに問題があるとのことで戻ってきました.

著者のイニシャルを入れるところに「No」としか書いてない,と編集者のメールにあったのですが,NOは僕のイニシャルです.細かいところまでチェックしている割に,肝心なところが抜けているようです.

と,入力をし直してみましたが,確認のためにイニシャルを入れる欄と,「この論文は他に投稿していますか?」みたいな質問に答える欄が入り混じっているので,No,NO,NO,Noとかになっていて確かに紛らわしいです.

2011年5月27日金曜日

SMBEへのお誘い

7月26日から30日まで京都で国際分子進化学会(SMBE 2011 Kyoto)が行われます.僕も発表とシンポジウムのオーガナイズをさせていただく予定です.

http://smbe2011.com/

地震の影響で海外からの参加者が少し減っていますが,それでも一流どころがたくさんいらっしゃいます.今月末までが早期割引なので,皆様お誘いあわせの上ご参加ください.

2011年5月23日月曜日

ベイズファクター

今まであまり深く考えていなかったのですが,ベイズファクター,というよりベイズ的考え方についての記事です.

とある研究者グループがすでにパブリッシュした超能力(ESP,ここでは予知能力のようなもの)の存在を肯定する論文データの再解析をしたというものです(PubMed).一つの実験結果だけでなく,他の実験結果も考えてベイズファクターを計算したというもので,元の結果ほどESPの存在を支持しなかったのですが,ここでのベイズファクターの解釈が面白いです.

ベイズファクターとは周辺尤度の比くらいにしか考えていなかったのですが,ベイズ的な考えだと,その比の解釈も解釈する人によって変化するということ(と僕は解釈していますが)ということがポイントのようです.この再解析ではベイズファクター=40という結構高い値が出ています.どちらのモデルも同じくらい起こりやすい(事前情報がない)とすると, 40という値は,確率が高い方のモデル,ここでは予知能力の存在,を支持します.

じゃあ,ESPは存在するのかという話になります.細かい話がSpringerのNewsに載っていますが,ベイズファクター40というのはESPがあるというのを40倍高く信じさせるという意味でとらえられるべきだということです.そもそもメカニズムが現在全くわかっていない力なのですから,もともとESPを信じている人にとっては確信をますます高める結果でありますが,完全に疑ってかかっている人,例えばそんな確率は100万分の1(ESPなしの方を100万倍信じている)だと思っている人にとっては100万分の1が2万5千分の1になるだけの効果だろうということです.

何度考えてもベイジアンの考えは僕にとってモヤモヤしているところがありますが,何となく言っていることはあっているのではないかと思います.少なくとも数学的には正しいでしょう.

と,ここで思ったのですが,進化研究のような「推測するしかない」分野では,ベイズ的な考え方はもっと大きな意味を持つのでしょうか.例えばわれわれの分野では,遺伝子に正の自然選択がかかったかどうかというような検定を行いますが,これに対する見方は研究者の間でも意見が分かれています.その時の事前の知識はどうやって評価するのでしょうか.

更に,もしある確率が0%であるという超頑固者がいたらどうなるのでしょうか.数学の世界でなく,自然科学の世界で確率0%というのはあり得ないので無視できるのかもしれませんが, いくらベイズファクターが高くてもそういった人が信頼側に傾くのは不可能なのでしょう.

本棚:生命とは何か (2)

先日に続き同じタイトルの本ですが,こちらは東大の金子先生の本です.物理をバックグラウンドに持つ研究者はこのような問いを常に持っているのでしょう(もちろん僕も持っていますが,研究対象にはしていません).

複雑系から生命現象を理解するというのが目的で,主に著者らのグループが行ってきた研究の紹介と,今後それを発展させるための実験の提案から成りますが,ものすごくクリエイティブな内容であると思います.集団遺伝学はある程度下敷きとなるものが豊富にある分野ですが,この本の内容は熱力学や統計力学を土台にした新しいアプローチで生命現象に迫っています.

表現型のノイズやロバストネスについては最近色々と考える機会があったのですが,色々と勉強していくうちになんとなく自分の考えが固まりつつあります.

ロバストネス(攪乱に対するシステムの頑強性),つまり無用の用がどうやって進化したかというのはなかなか難しい問題です.環境や突然変異に対するロバストネスが重要という単純な意見は良く議論されるのですが,ロバストネスが確立される過程と,あとになって役に立つ時との時間的な差が進化性を考える場合のネックとなります.結局,すべてパラメータ次第という話になって,実際にそうだったかどうなのかというのは僕には判断がつきかねていました.

ただ,この本のテーマの一つでもありますが,物理法則に由来する表現型が個体単位でそもそも揺らいでいるものならば,そういったものに対するロバストネスは,即時に個体の利益になるはずであり,進化によって確立される可能性は十分にあると考えられます.こちらの考えの方が僕にはすっきりと受け入れることができました*.

非常に興味深い本でしたが敢えて物足りなかった点を挙げると,僕のような門外漢がこのような分野をざっと眺めるには,著者及び日本人の研究内容の紹介にかなり偏っていた印象があります.もしかすると日本が圧倒的に突っ走っている分野なのかもしれませんが.





2011/5/30追記

*内在的な要因に対するロバストネスが先で,環境に対するロバストネスはバイプロダクト(副産物)だということ.ただしこれも時間的なスケールの程度に依りますが.

2011年5月20日金曜日

本棚:生命とは何か

今や古典と呼ばれる,シュレディンガー先生の生物に対する物理学的考察です.シュレディンガーというと,大学に入ってすぐの量子力学の授業で,先生が大した前触れもなしにいきなりシュレディンガー方程式を黒板に書き出してぶっ飛んだのを覚えています.

シュレディンガーのこの本はベストセラーとなり,この本を読んでたくさんの優秀な物理学者が生物の研究を始めたということです.分子機械として生命を理解する大きな流れというのはここから始まったのだと言えるでしょうか.分量もそれほど多くないので,ある程度の基本知識さえあれば簡単に読み流せると思います.

さて,いわゆる分子生物学がこの本から始まったとすると,それから60年以上たってわれわれは生命とは何かを理解することができたのでしょうか.生命を理解するためには部品ごとの機能を解析するだけではなく,全体を考えなければならない,というのは昔から言われていることで,最近はゲノム研究,システムズバイオロジー研究などが盛んになっています.しかし,それに答えるには,理解するとは何かという定義から始めないといけません.理解という言葉自体が哲学的である限り,この質問が答えられることはありません.

僕が思うに,生物の研究というのは,医学・薬学から入った人,遺伝学・進化学から入った人,生態学から入った人,物理学から入った人,コンピュータから入った人など様々なバックグラウンドがあり, アイデアや方法論の行き来は多いのですが,興味という観点からはそれぞれのすみわけが行われているのだと思います.Interdisciplinaryという言葉が使われますが,別に科学に共通の興味があるわけではなく,それぞれの人(分野)にはそれぞれの興味(理解したい答え)があり,そのために異分野のアイデアや方法論を取り入れるというのが限界ではなかろうかと思っています.当たり前のことですが,分野の数だけ,或いは人の数だけ理解の仕方が存在するのでしょう.

2011年5月14日土曜日

Nature

知らないうちにNature Publishing Group(NPG)がScientific Reportsというオープンアクセスの雑誌を作っていました.今年の6月から始まるようです.Nature系の雑誌は最近色々増えすぎてわからなくなってきたので簡単にまとめてみました.

詳しいことは,http://www.nature.com/authors/author_resources/about_npg.htmlに書いてありますが,

Nature: 言わずと知れたフラッグシップ誌.

Nature research journals: Nature Geneticsなどのいわゆる姉妹誌.

Nature Communications: 位置づけがいまいちわかりませんが,まずは姉妹紙に投稿せよというようなことが書いてありますので,上記雑誌に落ちたものの受け皿だと思われます.分野不問.オープンアクセス選択可.

Nature Protocol: パブリッシュされたデータを出すのに用いたプロトコル集.

Nature Reviews journals: 分野ごとのレビューをまとめた雑誌.

Scientific Reports: PLoS ONEのように,オープンアクセスかつ方法の妥当性のみを評価,査読有.

Nature Proceedings: 査読なし,フォーマット自由.数学・物理分野でのarXivのように投稿前のデータのアーカイブ的な存在.なので,これらの分野以外の論文のみを受け付ける.

あと,NPGは色々な学会誌なども傘下に収めて活動を広げているようです.僕が初めて論文を載せてもらった日本人類遺伝学会のJournal of Human Geneticsも現在はNPGに入っています.最初の論文はあまり指導のないラボでいきなり論文を書かされたので,手紙の書き方,海外への論文投稿の仕方(当時はまだ郵送でした),作図の仕方,論文体裁のお約束など一人で一から苦労して勉強したのを覚えています.

2011/6/30追記

"Nature Precedings"でした.

2011年4月26日火曜日

本棚:確率論と私

確率微分方程式で有名な伊藤清先生のエッセイ及び講演集です.正直,数学の説明は難解でほとんど理解できませんでしたが,その他の部分は平易で含蓄もあり,気軽に読み進めることができます.

確率論というと僕らが道具として日常的に使っているもので,ウィーナー過程とか伊藤の公式というのはしばしば目にすることがあります.やはり日本人の名前がついた定理などは親近感がわきます.面白いのはやはり数学者としての視点で,実用から数学が生まれ,それが数学の世界を発展させるということに伊藤先生がことさらこだわっていたことです.

確かに,数学が如何に純粋な抽象的・論理的な学問であっても,最初に数学的に取り扱う題材は現実の現象から着想を得ているわけです.+の記号もリンゴの数を数えるといった現実世界の加算というものがあって初めて人々の意識に上り,そこから抽象化されていくわけです.この視点はあまり考えたことがなかったので勉強になりました.

恐らく,多くの生物学者は大学の数学をもっと真面目にやっておけばよかったと思っているのではないでしょうか.僕も幾度か高等数学を一から勉強しようと思ったことがあるのですが,何度も中途半端なところでやめてしまっています.相当根気が必要な学問であることは間違いないので,やはり寝食を忘れてのめりこめる若いうちにやっておくべきだったと後悔しています.さらっとした顔で「バナッハ空間」とか言ってみたいものです.

2011年4月15日金曜日

DNAの遺伝様式

先日TVで体細胞キメラだった母親が,子供のDNA型と一致しないので親権を取り上げられそうになったという話を見ました.どんな技術にも弱点はありますので,仕組みを理解して正しく使うことが重要でしょう.

さておき,その映像の中で,親から子にDNAが受け継がれるアニメーションがあったのですが,DNAの二重らせんがパカッと割れて半分が子供に伝わるようになっていました.これまで何度か専門外の方がこう勘いう違いしているのを見てきたのですが,親から子供に伝わるのは二重らせんの半分ではなく,二つある二重らせんの遺伝子のうち片方です.

また,一瞬だったので定かではないですが,DNAが左巻きだったように見えました.昔のエントリーでも書きましたが,DNAは右巻きということになっています.

安全を決めるのは

放射線のリスクの話が出るたびに,安全に対する基準というものに対する人間の認識の難しさを感じます.

100%死ぬとか100%安全とかいう極端な場合を除き,危険の度合いは確率的になるからです.確率論ほど人生に密着した理論はないのですが,これほど人間の直感に反している理論もないのです.生命保険やギャンブルは確実に胴元が儲かるような仕組みになっていますが,人間に安心を求める欲望や射幸心があるおかげで多くの人が参加しています.保険は人生のランダム性を下げることになるし,ギャンブルは逆にあげることになります.われわれは確率の振れ幅を変えるためににお金を払っているということになるでしょう.

放射線の話に戻ると,科学者であればどれくらい安全かということを決めることができると考えている方がいるかもしれませんが,科学的な立場から言えるのは,例えば数年後に癌で死ぬ確率がこれだけ上がるとかいうような客観的な数値のみです.それが安全かどうかを決めるのは科学ではなく政治の仕事です(もちろんその過程には科学者が深くかかわっています).

2011年4月4日月曜日

新年度

正式には先週金曜日からですが,新しい学期が始まりました.移動される方がいたり,新しい顔が増えたりと色々と新鮮な気持ちになります.

仕事の方では最近色々と手を広げすぎて収拾がつかなくなりつつありますが,マルチスレッドになろうが,一つのスレッドの中で一つ一つできることをやっていく過程は変わりません.一歩一歩進んでいくのみです.

2011年3月25日金曜日

メールサーバー

地震の影響により遺伝研のメールサーバーが頻繁に止まっています.

GMAILのアドレス(nosada17@)までメールを送っていただければすぐに見ることができます.

2011年3月21日月曜日

リスクと確率

原発の事故に対応して,多くのニュースが放射線の生物に与える影響について解説しています.ちなみに僕は放射線取扱主任者の第一種免許を持っていますが,原発についての知識はあまりなかったので(随分前に,結局は蒸気で発電していると聞いて随分原始的だなと思った記憶はありますが),今回の事故で改めて原発というものについて考える機会を持つことができました.

この問題で難しいのは,放射線の影響の多くは確率的影響だということです.臨界事故などで 一度に大量の放射線を浴びれば,放射線を浴びた人にはほぼ確実に健康被害が出ます.それに比べて確率的影響というのは発癌のリスクが浴びた量にしたがって上がるというものです.また,ある人が後々に癌になった時に,それが放射線の影響だったのか,それともそうでなかったかの区別は本質的につきません.ヘビースモーカーが肺癌にならなからかったといって,タバコが体に悪くないという証明にはならないのも癌という病気がそもそも確率的に起こるものであるからです.

もちろん,リスク上昇がかなり高い場合は迷わず避難・防御行動をとった方が良いでしょう.しかし,リスクが比較的低い場合はそれぞれの人に判断が求められます.また,個人のリスクは少なくても公衆全体でみてみると無視できないリスクがある場合もあります.

例えば,隕石が降ってくるかもしれないので外を歩かないとか,交通事故が怖いので一生自動車に乗らないという人がいたら周りから笑われるかもしれませんが,肺がんになりたくないのでたばこを吸わないとか,肥満を防ぐために高カロリーの食事を控えるというのは社会では一般的な考えです.どこかにこういったリスクの一覧表があると便利なのかもしれませんが,われわれは普段からこういったすべての数値についての知識はないわけですから,個人の経験と感覚で判断します.実験動物のデータでは,あまりカロリーを取らずおとなしく生きることが寿命を延ばすことが証明されていますが,じゃあそういう生き方がいいかどうかというのはまた別の話です.

ある程度の量の放射線が体に与える影響については,完全ではないにしろ統計がとられているので,どれくらいの被ばくによりどれくらいの確率でわれわれの寿命が縮むかということがわかっています.現在報告されているレベルの放射線量は,それよりも相当低いレベルですから,東京に住んでいる人が放射線を恐れて家の中でカップラーメンばかり食べていたら,そちらの方が寿命を縮めているという皮肉なことになるかもしれません.

僕自身はリスクにはあまり頓着しないおおざっぱなタイプです.程度の差こそあれ,人間は誰でも寿命を縮めながら生きているからです.何もしなくて寝ているだけでも,寿命は一秒ずつ少なくなっていきます.ただ,まったく頓着しないというのではなく,常にある程度のリスクのイメージを持っていることは,間違いなく将来のリスクを減らす行動であると思います.

2011年3月19日土曜日

帰国します

当初東京経由で帰国する予定でしたが,交通事情も考えて関空経由で帰国することにしました.来週から岡崎でシンポジウムに参加する予定でしたが,残念ながら延期となってしまいました.シカゴ時代のボスのChung-I Wu教授が来週台湾に寄った後に日本に来る予定だったのですが,残念ながらすれ違いになります.

一週間の台湾出張も本日で無事終了です.最終日の台湾大学(NTU)医学部でのセミナーは,急な告知なのと進化の話ということで参加者はあまり期待していませんでしたが,予想に反して30人ほどの人が来てくれました.Academia SinicaのWen-Hsiung Li教授のラボからも数名話を聞きに来てくれました.

写真はNTU医学部のキャンパスです.台北駅の目の前で目の前に公園と博物館があり,なかなか良い立地条件です.

2011年3月14日月曜日

台湾にて

木曜日の巨大地震.最初はこれほど被害が大きくなるとは思っていませんでしたのでただただ驚くばかりですが,一人でも多くの方が助かることを祈っています.

さて,一時は中止も考えましたが,日曜日から台湾に来ています.月曜日からの停電に引っかからなかったので,割とスムーズにこちらに来ることができました.おもに台南の成功大学に滞在する予定です.

こちらの大学に顔を見せるようになってからかれこれ4年ほど経ちます.共同研究も行っていますが,一番時間を割いているのはこちらの学生さんに集団遺伝学とバイオインフォマティクスを教えることです.集団遺伝学は日本でもなかなか学ぶ機会が少ないと思いますが,台湾では尚更です.成功大学は南部の名門大学で,学生さんは暖かい地域に特有のいい加減さを持っていますが,割と熱心に話を聞いてくれます.ホスピタリティが高いので,いつも楽しく滞在させてもらって恐縮の限りです.

2011年3月5日土曜日

Shifting Balance Theory

遺伝研で行われている集団遺伝学の輪読会,今回はMatthew HamiltonのPopulation Geneticsを読んだのですが,先日無事に終了しました.初版だったので色々と(中には酷い)間違いもあり,もう少しこなれた教科書のほうが勉強になるのかもしれませんが,トピックの選び方といい内容の構成といいなかなか独特の教科書で,読んでいて結構楽しめました.

 特に,最後の章ではWrightのshifting balance theory(平衡遷移説)について数ページを使って解説しています.普通の教科書では数行で終わってしまうこの理論の解説を丁寧にしているところは興味深いでしょう.

生物進化が複雑な適応度地形をどのように局所解にとらわれずに大局解に近づくかという問題は常に進化学者の頭を刺激し続けています.環境が変われば最適値も変わるということは明らかですが,果たしてそれだけで説明ができるのか.先日のカウフマンのモデルもそのようなものを意識しているわけですが,数ある理論の中で,集団遺伝学を勉強した僕としては,やはりshifting balance theory自体には疑問符はつくものの,遺伝的浮動と自然選択のバランスを考慮するWrightのモデルに一番ひかれるわけです.

2011年3月2日水曜日

褒めるということ

先日五條堀さんがブログで褒めるということについて述べていたので一言.

科学者にとって批判的なものの見方が大事なことが言うまでもないことですが,肯定的なものの見方はさらに高度な能力を必要とすると思います.褒めることは叱ることよりも難しいのです.

たぶん,一番難しいのは「具体的に褒めること」ではないでしょうか.人の仕事を見て,この仕事はこういう意義があるということを評価するのはとても難しいことです.「具体的に批判すること」は科学者の基本的な行為というか日常的な業務ですが,褒めることに比べると簡単です.特に方法論について具体的な批判を行うことは,ちょっとした知識と論理があれば簡単です.

一番いけないのは,漠然とした批判,何も考えずに肯定,これは誰でもできます.無条件の肯定は最悪の部類に入るでしょう.

褒めることと批判することのバランスが大事なことは言うまでもありませんが,褒めることのほうが重要であることの理由の一つは,われわれ科学者は評論家でもありますが,基本的にはクリエイターを目指さなければいけないということに尽きると思います.否定ではなく肯定のほうが新しいものを生み出す確率は高いでしょう.

僕自身はついつい評論家に陥りそうな性格をしているので,年を取って左団扇になるまでは創造的な仕事にかかわっていきたいと意識しています.

2011年2月18日金曜日

年度末へ向けて

毎年年度末は色々と忙しい日が続きます.日本では予算の関係でさらに忙しくなるのではないでしょうか.

3月には人類学教室の学部生,北里大学の太田先生,それから台湾の共同研究先から学生さんが2名ラボを訪れる予定です.それから台湾に一週間滞在し,帰ってきたら岡崎で行われるOBCに参加予定です.そのワークショップにはシカゴ大学での恩師であるChung-I Wuが参加予定なので,そのあとそのまま遺伝研に寄って貰うことになっています.

自分で手を動かせる時間はほとんどなくなってしまいそうですが,ソーシャルタイムと割り切ってしっかりとインスピレーションを養いたいところです.

2011年2月8日火曜日

本棚:統計学を拓いた異才たち:経験則から科学へ進展した一世紀

随分昔に読んだ本ですが,最近読み直してみても結構面白い本でした(現在は文庫本も出ているようです).統計というのは方法に人の名前がついていることが多いので,知らず知らずのうちに色々な統計学者の名前が頭の中に入っています.

彼らが実際にどのような人となりをしていたのかというような小話的な面白さもさることながら,学問的にどのような貢献をなしたのかというところまで丁寧に掘り下げている(著者も統計を専攻しています)ので統計の勉強にもなります.それぞれの人物に焦点を当てながら,全体を読むとラプラスの誤差関数からコンピュータを使った統計方法の発展までの歴史の流れも感じることができます.

2011年1月31日月曜日

Genetic history of an archaic hominin group from Denisova Cave in Siberia

少し前の論文ですが,今週に遺伝研内で行っている論文読みで担当することになりましたので,ついでにその紹介をさらりと.

以前のエントリーで少しふれましたが,Denisovaというところで見つかった4万年前の化石,ミトコンドリアを調べた限りではかなり古い分岐を示したということですが,核ゲノムを見たところ恐らくネアンデルタール人との姉妹群であろうということです.更に,この集団からメラネシアの人類集団への遺伝子の流入のパターンが見られたそうです.

この論文の良いところ(逆に弱点かもしれませんが)は,複雑になりがちな集団遺伝学的解析を簡単な統計量を用いて結論だけを示しているところです.われわれはつい複雑なモデルを立ててパラメータの推定なんてことをやってしまいがちですが,証明したいことを単純にかつストレートに示す,ということは重要なのかもしれません.とはいえ,大事な要素を単純化しすぎるあまりに結果に思わぬ偏りが出てくることも否定はできませんが.

なんにせよ,これらの研究でわかってきたのは,人類の進化は一度の出アフリカで簡単に説明できるほど単純ではなかったということでしょうか.とはいえ,全体としては遺伝子流入があった量としてはかなり少ないので,かつて提唱された極端な多地域進化説(現生人類は地球上のそれぞれの地域で変化を遂げた)が復活するようなことはないと思います.

2011年1月28日金曜日

再びゲスト

先日からPAMLの作者で著名なZiheng Yang先生が当研究室に滞在しています.

2週間ほどの滞在予定なので,その間に色々教えてもらうことができればと思っております.

2011年1月4日火曜日

2011年仕事始め

新しい年が始まりました.今年は年男なので何かいいことがあることを期待しています.

昨年は色々な方々にお世話になりましたが,本年もよろしくお願いいたします.

今年は京都でSMBEの大会が開かれます.遺伝研にも多くの著名な研究者が訪れてくれるでしょう.今から楽しみです.