2011年12月28日水曜日

2011年仕事納め

最近の忙しさにかまけて更新をさぼっているうちに気が付けば今年も終わりになりました.

向こうも忙しいのは重々承知ですが,論文をサブミットしてすっきりして今年の仕事を終わろうと思っています.クリスマスシーズンは避けたので何とか許してほしいところです.

来年は,どんな年になるでしょうか.みなさんぼちぼち頑張りましょう.

2011年12月11日日曜日

タイワンザル

一週間の台湾滞在を終えて本日帰国します.台南にて集中講義とシンポジウム出席を果たしてきました.

少しだけあった自由時間を利用して高雄市にいる野生のタイワンザルコロニーを見てきました.タイワンザルは系統的にも少し謎なところがあり,興味深い動物です.

2011年11月30日水曜日

12月

あっという間に11月も終わりです.もうすぐ遺伝研に移って二年が経つところです.

来週は台湾成功大学で数日間集中講義を行ってくる予定なので暇を見てレポートいたします.

そのあとは毎年恒例,分子生物学祭りに参加予定です.

2011年11月2日水曜日

転写後のエキソンシャフリング


最近はシークエンサーの性能が上がったおかげで色々なことがわかってきます.

Post-transcriptional exon shuffling events in humans can be evolutionarily conserved and abundant

エキソンの位置が進化の過程で再配列されることをエキソンシャフリングと呼びます.多くはゲノム配列上での再配列が原因であると考えられていますが,mRNAに転写された後にエキソンの順番が入れ替わるようなスプライシングが起こるものが結構あるようです.このような転写産物が逆転写されてゲノムに組み込まれれば,ゲノムの進化にも寄与するのではないかと思われます.

2011年10月9日日曜日

マカクの薬剤代謝遺伝子CYP1A2は何故多様性が高いのか?

自分の論文の宣伝ばかりで申し訳ないですが,もう一本.

Yasuhiro Uno, Naoki Osada*. CpG site degeneration triggered by the loss of functional constraint created a highly polymorphic macaque drug-metabolizing gene, CYP1A2. BMC Evol. Biol. 11:283 (2011) [Link].

新日本科学の宇野先生との共同研究です.この研究ではCYP1A2という薬剤代謝に関係する遺伝子の多様性が何故旧世界ザルのマカク属で高くなっているかということの理由を探っています.

CYP(シトクロームP450)遺伝子は一般には薬剤代謝遺伝子としてよく研究されている遺伝子群で,ヒトでは約60種類ほどの遺伝子がゲノムの中に存在します.その中でもCYP1A2は肝臓での薬剤代謝の多くを担う遺伝子です.

マカク属のサルは薬の全臨床試験でよく用いられるサルです.これまでの先行研究ではマカク属のサルであるカニクイザル(ニホンザルとも近縁です)のCYP1A2遺伝子は他の遺伝子と比べて有意に高い多様性を持つことが報告されていました.CYP遺伝子は薬学分野では薬剤を代謝する酵素として知られていますが,自然界に薬が存在するわけではありません.どうして自然に生きる生物が薬剤代謝酵素を持っているかというのは難しい質問ですが,おそらく植物などの二次代謝物を解毒化する作用があるのではないかと考えられています.植物は自分から動いて捕食者から身を守ることができないので,代わりに多くの二次代謝物を産生することによって自分を守っています.麻薬などにもなるアルカロイド化合物はその良い例でしょう.

したがって,多様なCYP遺伝子を持つことは解毒できる化合物のレパートリーを増やすことになり, ある条件下では遺伝子の多様性が有利に働くことが想像できます.こういった自然選択は平衡淘汰と呼ばれ,免疫に関わるMHC遺伝子の進化の例などが知られています.

それでは本当に自然選択でマカク属のCYP1A2遺伝子の多様性が説明できるのか?他の説明も可能ではないのか?

論文では色々な解析を行い幾つかの仮定を排除しているのですが,ここでは要点だけ述べます.私たちが発見したのは,当初の予想と異なり,多くのサル個体がかなりの高頻度で遺伝子の機能がおかしくなった不完全なCYP1A2配列を持っていたことでした.また,遺伝子発現を調べた最近の先行研究では,マカクではCYP1A2の重複遺伝子であるCYP1A1が主に発現しており,CYP1A2の発現は非常に弱くなっていることがわかってきました.

遺伝子発現が弱く,機能していない配列が頻繁にみられるということはマカクのCYP1A2はほとんど機能していないと予想できます.しかし,機能がなくなったという説明は高い多様性がみられたということと矛盾してしまいます.遺伝子が機能を失い中立的に進化すると,その進化パターンは他の機能を持たない領域の進化と同じようになってしまうと予想されるからです.それではどうやってこの矛盾は解消できるのでしょうか.

この問題はしばらく僕の頭を悩ましていたのですが,実は答えはとても単純でした.CYP1A2の変異の有ったところをよく見てみると,その多くはCpGサイト(Cの後にGが続く二塩基)に起こったものでした.哺乳類のCpGサイトの多くはメチル化されており,メチル化されたCは通常の10倍以上の確率でTに変わりやすくなります.

10倍以上変異率が高いということはCpGは哺乳類では急速に失われていくことが予想されます.実際にゲノム全体でCpGの頻度を数えてみると,多くの領域ではCpGはランダムな組み合わせより低くなっています.ところが,遺伝子の近傍や遺伝子内の領域ではCpGはある程度の数に保たれていることがわかっています.何故遺伝子領域でCpGが高くなっているかについてのはっきりとした答えはまだわかっていませんが,アルギニン(CGN)などのタンパク質をコードするものや遺伝子の発現に関わっているものなどがあると考えられています.

さて,霊長類のCYP1A2遺伝子のタンパク質コード領域にあるCpGを見てみると,およそ8%ほどのサイトがCpGサイトであることがわかっています.これは全遺伝子のうちトップ10%に入るので,CYP1A2遺伝子はもともとCpGが多い遺伝子であるということができます.

これらのことを考えると一つのシナリオが提案できるでしょう.つまり,遺伝子がちゃんとした機能を持っている時はCpGの数は負の自然選択により一定に保たれていますが,遺伝子が死ぬとそこに含まれていたCpGサイトが急速に崩壊を始めます.マカクのCYP1A2はまさに遺伝子が死にかけているところを私たちが観察しているのだということができるでしょう.

今回の研究では薬剤代謝遺伝子という特殊な例を挙げましたが,上のCpG崩壊のシステムは恐らくもともとCpG含有率の高い多くの遺伝子に当てはまる可能性があります.今度は逆に,CpGの崩壊率を調べることにより,死にかけている遺伝子を効率よく発見できるようになるかもしれません.

2011年10月6日木曜日

新学術領域 ゲノム・遺伝子相関

日帰りで忙しかったですが,京都で行われた新学術領域 ゲノム・遺伝子相関のキックオフシンポジウムに参加してきました.

発表全体は非常にクオリティが高かったと思います.現在,公募研究の募集が行われています.ゲノム相関といってもピンとこないかもしれませんが,生殖隔離,エピスタシス,性のコンフリクトなど生物学としてとても面白い現象がこれらに含まれると思います.今回の研究計画とは関係ありませんが,僕の核-ミトコンドリアの相互作用に関する研究も内容的には含まれるでしょう.また,別の科研費をもらっている異質倍数体の解析も含まれると思います.

5年間という比較的長い期間が与えられていますので,できるだけ良い結果を残せるように頑張りたいと思います.

霊長類の核由来ミトコンドリア遺伝子はなぜ早く進化したのか?

MBEにアクセプトされていた論文が最終的な形で出版されました.

Naoki Osada*, Hiroshi Akashi. Mitochondrial-nuclear interactions and accelerated compensatory evolution: Evidence from the primate cytochrome c oxidase complex. Mol. Biol. Evol. (2011) [Link]. 

哺乳類の中で霊長類にだけみられる現象として,ミトコンドリアで働いている遺伝子の進化が早いことがあります.特に,核にコードされているミトコンドリア遺伝子ではアミノ酸置換が突然変異率(正確には同義置換率)よりも高くなっているサイトがいくつか発見されており,いわゆる正の淘汰が働いたのだろうと言われていました.

ミトコンドリアではミトコンドリアにコードされた遺伝子と核にコードされた遺伝子が協力して一つのタンパク質複合体を作っていることが知られています.僕がまだ進化の理論について詳しくなかった大学院生のころ,サルとヒトの遺伝子を比べてこのような進化が早くなった遺伝子を見つけようとしたのですが(ほぼ独学で書いた初めての分子進化に関する論文です),その研究でも核にコードされるミトコンドリア遺伝子がいくつか候補として挙がってきました.

実はそれより少し早くにアメリカのグループが同じようなことをしており,彼らは何故このような進化の加速が起こるかについて,巨大になった霊長類の脳が効率よく酸素をエネルギーとして使えるように共進化が起こったという仮説(脳エネルギー仮説)というものを唱えていました.当時の僕はそれほど深く考えることはできなかったので,まあそうかなというくらいの意見でしたが,最近になって別の仮説で説明できるのではないかと考えて行った研究が今回の研究です.

鍵となるのはミトコンドリアゲノムの特異性です.集団遺伝学の立場から見てみると,ミトコンドリアゲノムは主に三つの点で核ゲノムと異なります.一つ目は組み換えが起きないこと,二つ目は(哺乳類では)突然変異率が高いこと,三つ目は集団サイズ(集団の中にあるコピー数)が少ないこと,が挙げられます.

この三つの要素はすべて 自然選択にとって良くない方向に働きます.組み換えが起きないということはいったん固定した有害な変異がなかなか取り除かれないことを意味します.また,突然変異のほとんどは有害ですから,変異が多いということは有害な変異もたくさん起こることを意味します.集団サイズが小さくなるとやや有害な変異が遺伝的浮動によって集団中に固定してしまう確率が高くなります.

霊長類では特にミトコンドリアでの突然変異率が高いということが知られています.また,集団サイズの減少によるやや有害な変異の固定が多く起こっていることも知られています.

以上のことを考えると次のような仮説(Compensatory Weak Selection (CWS) モデル)が立てられます.

1) 霊長類では集団サイズが小さく,ミトコンドリアの突然変異率が高い.したがってやや有害な変異の固定が速いスピードで起きている.

2) 核の遺伝子でミトコンドリアに起こった有害な変異を補完するような置換が起こったときは,それは適応的な変異として認識される.ミトコンドリア遺伝子の進化の速度は速いので,最終的な適応度が全く変わらなくても,核の方から見ると進化速度の加速が起こる.例えるなら,早く進むミトコンドリアに核が一生懸命追いついているイメージです.

以上の仮説では,特に霊長類に特異的な表現型を持ち出さなくても,突然変異率と集団サイズの違いだけで観察されるパターンを説明できます.もちろん脳エネルギー仮説は面白い仮説ですし,それを否定することはできません.が,どちらが好きかといわれると,例外的な規則ではなく,一般的なメカニズムで説明できる方が僕は好みではあります.

この理論は更にもう一つ重要な予測をすることができます.それは,核遺伝子の補完的な変異はミトコンドリア遺伝子の有害な変異が起こった後に起こるということです.今回研究の題材にしたCOX遺伝子はタンパク質複合体の立体構造が解明されていますから,変異を起こしたアミノ酸が相互作用を起こしそうかどうかは実際の立体構造に照らし合わせることにより判断できます.実際にタンパク質の進化を見てみると,ミトコンドリア遺伝子のあるサイトで変異が起こった時にその近くの核遺伝子のサイトでは,より高い確率で,後に核遺伝子に変異が起こったことがわかります(逆の方向はない).

集団遺伝学の基礎知識,理論的予測とコンピュータシミュレーション,分子進化学的手法による加速進化の証明,タンパク質の立体構造,変異の順番を確かめる統計的手法と盛りだくさんで,これまで自分が書いた論文の中でもかなりギッシリと詰め込んだ内容になっています.

2011年9月30日金曜日

久しぶりの単著

随分前に書いた後,しばらくお蔵入りになっていた論文がパブリッシュされました.

Naoki Osada. Phylogenetic inconsistency caused by ancient sex-biased migration. PLoS ONE 6: e25549.

ほんとにちょっとした話です.系統樹を書いたときにミトコンドリアや常染色体で系統関係が違うことはよくありますが,それが性による移住割合の偏りなどのせいであると結論付けることができるのか,という内容です.

現在の集団から多型を調べた場合は移住率の推定ができるので割とうまくいくのですが,現在いる集団の共通祖先より前に起こった過去の移住は移住率が推定できないので,結局大したことは言えないという,当たり前と言えば当たり前の結論です.

非常に簡単な計算をしただけの論文ですが,今まで誰もちゃんとやっていなかったので,簡単なガイドラインになると良いと思っています.

2011年9月12日月曜日

誤植

論文を書いている限りは誤植の恐怖は常に付きまといます.今日はこんなのを見てしまいました.

P < 5 x 105

明らかに-5の誤植とわかるのでそれほど気にはならないのですが,著者は少しヒヤリとしているでしょう.

2011年9月6日火曜日

ダッシュ,添え字

先日受け取った論文の校正でハイフン関係があらかた直されていました.ダッシュとハイフンの違いについては以前のエントリーでおさらいしましたが,まだまだ勉強不足だったようです.

Wikipediaを見てみると,人の名前をつなげるようなときは,ハイフンではなくen dashを使うようです(例:Mann—Whitney U test).ただし,名前がペアとして慣用的に使われている場合はハイフンでいいというようなことも書いてあります.複雑ですが,基本的にはen dashということで問題ないと思います.

他の論文も調べてみましたが,両方が混在していて実はかなり適当なのではないかと思います.とりあえず今回の編集者は細かいところまで見てくれたようです.

もう一点は,記号の斜体です.量や変数を表すアルファベットは普通斜体になりますが,それに添え字がつくときがあります.こちらのサイトを見たところ,添え字が量や変数を表す場合はイタリックなのですが,そうでない(例えば変数に説明を加える添え字)場合は,添え字は普通の字体になるようです.

集団生物学では有効な集団の大きさをNeで表しますが,このeはイタリックでない方が正解だと思います.論文や教科書を見てもeがイタリックなものは結構あるので,それほど気にする必要はないのかもしれませんが.

さらに,上記のNISTの文書では

"Because the comma is widely used as the decimal marker outside the United States, it should not be used to separate digits into groups of three. Instead, digits should be separated into groups of three, counting from the decimal marker towards the left and right, by the use of a thin, fixed space. However, this practice is not usually followed for numbers having only four digits on either side of the decimal marker except when uniformity in a table is desired."

と書かれています.数字4桁の場合はカンマは要らないのは知っていましたが,スペースを空ける書き方が推奨されているのは知りませんでした.