地球シミュレータ

地球シミュレータの見学会に行ってきた。とりあえず、聴いたこと見たこと感じたことをつらつらと並べてみる。

場所 map:x139.6263y35.3807


性能に関して

先日のTop500の更新で2年半続いた1位の座から3位に落ちたわけだが、現場レベルではLinpackで世界3位となったショックは特にないらしい。「行列計算で一位じゃなくなったかたら何?」という雰囲気。実際の計算で使われる大気大循環コードはES上では26.58TFLOPS(65%)の実効性能が出るが、他のスカラスパコンじゃ5%も出ない。まだまだESのほうが上。「あと2,3年は実質首位だろう」と。運用開始当初から「表向きでは2年半、実用上では5年はトップでいられる」と言われたとおりの状況。

まあ、BlueGeneはその名の通り、遺伝子計算目的。プログラムやデータそのものは大きくなく、個々のノードに違うパラメータを与えてまとめて一気に計算を行うようなものなので、そこそこ速いプロセッサでそこそこ大きいメモリとそこそこ速いネットワークがあればできちゃうけど、計算規模がくそでかいうえ、個々のノードの計算結果が密に作用し合うESでやるような計算にはまったくダメということ。

今後の後継機の開発方針は2つで、ひとつはピーク性がより高い、地で高速な計算機の開発。もうひとつが、地球計算でより高い性能を発揮する計算機の開発。地球環境の計算では、計算対象のスケールが10^{10}くらいの幅を持つ*1ので、ミクロの世界とマクロの世界の相互作用を取り入れた計算が必要で、しかも3次元空間を扱うので計算機のFLOPS値が5倍や10倍になったところでどうにでもなるものではない。ミクロとマクロの階層を連結する*2、連結階層シミュレータの計画が進行中。

ちなみにESの開発は国際入札で行われたが、入札に応じたのはNECだけ。アメリカにはベクトル機を作れるところはすでに無かったし、日立はベクトルから撤退、富士通も撤退を検討してた時期だったので。一方でNECはこういうのを手掛けるのを義務と考えているみたい。

行われている研究

全球計算を行うに当たって、球面座標系を使うと極地に近づくほどグリッドが密になり計算に無駄が生じるので、野球のボールが2枚の革でできているのヒントに2つ座標系で球を覆う陰陽格子(Yin-Yang Grid)というのを独自に開発して、計算量を1/10に削減することに成功している。この発想はすごいと思った。

昨年の台風10号の動きについて、全球計算で境界条件を与えながら、日本周辺のより詳細な計算を72時間分を14ノード使って3時間で計算した結果、気圧変化に関しては実際の観測データと最大0.5%未満の誤差で一致。気象庁の人間と共に内閣府に呼び出されて「なんで台風の進路予測にESを使わないんだ」と言われたらしいが、ESは事後計算だし研究目的の計算だし、計算には全球のデータが必要で、それをリアルタイムに回収する手段は現状無いと言ってやったとか。

東海地震、南海地震のシミュレーション結果、どちらも地震波は内陸の長野あたりでは消えるが、日本海側の富山あたりでは再び現れることが分かり、防災会議に報告したらかなりの反響があったらしい。

温暖化シミュレーションは研究というより政治。各国の思惑がかなり影響を与える。

今後は、自動車設計、都市設計、経済シミュレーションなどにも利用を広げていく方針。ただ、海洋研の設備なので、経済シミュレーションは人間の経済活動が地球環境に与える影響という点でフィードバックがなければならない。自動車設計に関しては、車全体をまとめて計算するようにしたいとのこと。トヨタあたりは、効果が認められれば300億円くらい部長決裁で可能らしい。*3

阪神大震災からの復興費用、銀行の不良債権処理費用の比較として持ち出された、「ESが300台あれば世界征服可能」というのが実感としてわいてきた。

運用

ES上で実際に行っている計算の平均実効性能は30%ほど。ESを使うには、最低10ノード程度を必要とする規模の計算でないといけない。プログラムの並列化努力は常に行われ、640ノードのうち、16ノードをプログラムのデバッグオプティマイズ用に提供し、うち2ノードはインタラクティブに使えるとのこと。

計算結果の可視化ツールはESセンターでも提供するし、利用者側で用意しても良い。ESでの計算結果としてよく目にする絵に使われるツールは、ES関係者でも知らないものが多いという。

いま目下の問題になっているのが、計算済みデータの対策。ESの大口利用者である気象屋さん、地学屋さんというのはどんな些細なデータでも残しておきたいというESセンター側としては嬉しくないクセがあるらしく、蓄積されているデータのうち90%は計算されたまま放置状態らしい。

故障確率は1万時間で5/1000。PEの数が5120台だから、だいたい一週間に1つ故障が発生する。これは設計通りだが、ESで行う計算規模からすると、これが許容限度。アメリカの技術者が聞いたら驚いたとか。向こうは毎日どこかで故障が発生しているらしく、システムの大規模化はこのあたりもネックになるんじゃないか?

保守要員は常時2人が待機。非常時にはNECから地球防衛軍が駆けつける。ちょうど明日から電気設備の保守作業が入って計算が停止するので、併せて本体の保守作業も行おうということで、その準備も行われていた。

設備

外界からアイソレートされた構造。筐体とも言える建物本体は免震構造で運用棟との間の桟橋もよく見るとESの筐体とは連結していない。二重の電磁波防止シールドで覆われていて、中にはいると携帯電話は不通になる。まるで宙に浮いているような構造。

照明はノイズ源排除と保守性確保のために、光拡散気体を詰めたチューブを使った間接照明で、大規模なものとしては初めてで照明学会から賞を受賞している。現在同様の物が成田空港と関空のターミナルビルに設置が進められている。

ケーブルを通すフリーアクセスは本当は2.0mの高さが欲しかったが、2.0mにすると3階建て扱いになって建築基準法上、面倒なことになるので、1.6mに抑えたらしい。

空調の音がすごい・・・

周辺環境

海洋研横浜は何気に遠いです。しかも周辺は普通の住宅地。海沿いのもっと広々とした場所かと思ったら、全然違うでやんの。

*1:水分子のふるまいと対流圏の気象、電子のふるまいと電離層の現象とか

*2:たいてい、離散スペクトルのように、10^{3?sim4}スケール程度の間隔で狭い範囲に重要なパラメータが集まっていることが多く、スケールを連続的でなく離散的に扱って中間スケールを省いた階層にしてもかなり正確なシミュレーションが可能らしい。うーん、確かにそうかもしれない。

*3:自動車の開発費だってそのくらいかかるもんね