ビッグデータの解析から天の川の質量を計算できる

先日、科学系ニュースサイトPhys.orgで次のような記事がありました。
Scientists close in on the true mass of the Milky Way

(科学者たちが天の川の真の質量に迫る)

この記事の内容を簡単にまとめると、次のようになります。

  • 銀河系は惑星や衛星、ガスなどの複雑な集合体で、その正確な質量は宇宙の大規模な構造の理解に重要でありながら、よくわかっていなかった
  • McMaster大学などの研究グループが、天体の移動速度に関する膨大な量のデータを新しく開発した手法で解析して、従来よりもかなり高い精度で天の川銀河の質量の計算に成功した
  • 手法は、球状星団の運動速度を階層的ベイズ推定を用いて解析するというビッグデータ的アプローチで、計算によると天の川銀河の総質量は太陽4000億個分から5800億個分となった

ここでは、記事中に登場するキーワードについて、いくつか説明してみたいと思います。

銀河の構成要素

銀河とは、恒星や惑星、ガスや暗黒物質などが重力によってひとまとまりになった、巨大な宇宙における構造物を指します。単純な星々の集まりというわけではなく、惑星と比べればはるかに軽いガス状物質も含まれています。また、我々の目には直接は見えない暗黒物質と呼ばれる正体不明の物質がかなりの量含まれていることが、間接的にわかっています。ポイントは、それらの様々な構成要素が重力の力によって互いに引き付け合うことによって、ひとまとまりの集団になっているということです。

暗黒物質とは

暗黒物質とは、質量を持つ一方で目には見えない仮説状の物質の総称で、質量にして宇宙全体の22%程度を占めると言われています。目に見えないという性質は、電磁相互作用という光と物質の間で起こる現象からの影響を受けないという言い方でも表されます。つまり、望遠鏡で宇宙空間を眺めるような手法では観測することのできない物質ということです。

望遠鏡の観測では見えない、未知の物質が宇宙空間に存在するという予測は1970年代からあり、銀河の回転速度に関する観測結果と理論的予測の不一致や、遠くの天体の光が重力によって歪む重力レンズと呼ばれる現象によって間接的に存在が示唆されてきました。現在も、暗黒物質の直接観測を目指す様々な実験が進行中です。

球状星団とは

球状星団とは、恒星たちが互いに重力で引き付けあってひとまとまりとなったものです。多くは太陽よりも軽い星々が数万から数百万も集まったもので、銀河系の周りでおよそ150個が発見されています。これらは銀河系の外側を周回しており、その軌道は宇宙空間にある物質との間に働く重力の影響を受けています。記事で紹介されている研究では、この球状星団が銀河系の周辺で動く速さと軌道の位置を観測したデータを詳細に調べることで、星団に働く重力の発生源を解析し、銀河の質量を求めています。

ベイズ推定とは

まず、ベイズ推定とは、観測された事実に基づいて、その観測結果の原因となった事象の発生確率を推定する手法のことです。これは一見するとわかりにくいのですが、一般的な確率の概念とは少し異なるものです。通常、表裏のあるコインを投げて表が出る確率は1/2となりますが、コインに細工があってどちらかの面がやや出やすくなっていた場合のことを考えてみます。

一般的な、もしくは従来からある確率論では、コインを何回も繰り返し投げることによって、表もしくは裏がどれくらい出やすいのか調べることを考えます。結果として、表が出る確率は1/2とはなりません。一方、ベイズ推定では、1回だけコインを投げて、その結果が表であったという観測事実があったときに、それに基づいてコインの偏り具合を推定します。最初にコインを投げる前は、何の情報もないため表が出る確率を仮に1/2としておき、コインを振ってから予測値を修正します。ベイズ推定は、統計的手法が有効な対象について考えるときに、限られた情報や少ない回数の試行から、比較的精度の高い結論を導き出すことができることがあります。

階層的ベイズ推定とは

始めに仮定する分布を事前確率分布、観測結果がわかった段階で、仮定した分布が正しいと言える確率を事後確率と呼びます。従来のベイズ推定は、事前確率分布を主観的に定めたり、過去の経験に従って定めたりします(情報が何もないから表が出る確率は1/2とする、など)。一方、階層的ベイズ推定では、観測データを使って事前確率分布を設定し、設定した分布に従って計算した結果と観測結果を突き合わせてより正しそうな分布を推定していきます。

階層的ベイズ推定が威力を発揮する局面

コインの例でもう少し考えてみます。例えば、表裏の偏りがあるが、どの程度偏っているかわからないコインが多数あり、さらにそれぞれのコインの偏り具体も一様でない(個体差がある)という場合に階層的ベイズ推定は威力を発揮します。コインの偏り具合がどのような分布になっているのかを、あるコインを選んで投げてみたときの観測結果を元に推測することができます。コイントスの結果という事実に基づいた情報を使って、コインの個体差分布を推定するわけです。

階層的ベイズ推定の流れ

まず、コインの個体差分布の形状に関する仮説を立てます。例えば、完全にランダムであるとか、正規分布になっているとかです。その仮説を適応して、何回かコインを投げた後に表が出る回数が計算できます。この計算結果と、実際にコインを投げてみた結果を見比べてみます。結果が食い違っている場合は立てた仮説が不十分であるとして、より観測結果を再現できるような分布を再考します。これを繰り返して、予測を真の個体差分布に近づけていきます。

階層的ベイズ推定の銀河質量予測への応用

前置きが長くなりましたが、今回の研究では、多数ある球状星団の軌道と移動速度のデータがコインを振ってみた結果に相当し、その情報を使って推測される、銀河の質量がコインの個体差分布に相当します。刻々と動き続ける無数の星々の観測データは、いわゆるビッグデータの一種です。大規模なデータ解析における多変量の解析手法は近年様々な分野(経済の動向予測、ソーシャルネットワークの形成発展、商品の在庫管理などなど)で応用されていますが、この研究は、それらと同じ流れにある、文字通り天文学的なビッグデータの解析に関する成果であると言えます。

 

参考文献

[1]: 宇宙情報センター, “球状星団”, http://spaceinfo.jaxa.jp/ja/globular_cluster.html

[2]: 岡村 寛, “ベイズ統計の基礎”, http://cse.fra.affrc.go.jp/okamura/bayes/bayesintro.pdf, 水産資源学におけるベイズ統計の 応用ワークショップ (2007).

[3]: 久保拓弥, “階層的ベイズ推定”, http://hosho.ees.hokudai.ac.jp/~kubo/stat/2010/Qdai/c/kuboQ2010c.pdf, 九州大学・GCOE 統計・データ解析セミナー –  WinBUGS・ベイズ統計モデリング勉強会 (2010).