演 題 |
第一原理分子軌道計算DVXα専用計算機の開発
|
発表者 (所属) |
佐々木 徹・長嶋 雲兵・塚田 捷
(アプリオリマイクロシステムズ・融合研・東大)
|
連絡先 |
〒305-8562 茨城県つくば市東1-1-4 産業技術融合領域研究所
TEL:0298-61-3044, FAX:0298-61-3046
E-mail: |
キーワード |
専用計算機、DVXα、第一原理分子軌道計算
|
開発意図 適用分野 期待効果 特徴など |
|
環 境 |
適応機種名 |
|
O S 名 |
|
ソース言語 |
|
周辺機器 |
|
流通形態 |
- 化学ソフトウェア学会の無償利用ソフトとする
- 独自に配布する
- ソフトハウス,出版社等から市販
- ソフトの頒布は行わない
- その他:未定
| 具体的方法
|
1.はじめに
非経験的分子軌道法は、さまざまな機能性分子の設計や開発に対して最も基本的でかつ重要な手法である。しかし、その計算量はハートリーフォック計算の場合でも、用いる基底関数の4乗に比例するため、生体内や固体表面での化学反応解析等の大規模系の電子状態計算には膨大な計算コストが必要になる。現実的には、非経験的分子軌道法は、設計したい大きさの大規模分子系ではなく、それを簡素化した小規模モデル分子への適用がせいぜいである。1990年代前半までは数百基底(数十原子)の分子軌道計算でさえ、その当時のスーパーコンピュータシステムを必要としていた。そのため、現在でも分子設計に必要な情報を十分な制度で得ることができないでいる。
そこで、本研究では第一原理分子軌道計算法の一つであるDVXα法を用いて計算量を軽減し、さらに専用分散並列計算機を開発して計算速度の向上をはかることで、「現実を反映した大規模分子系」の分子軌道計算を「低コスト=パーソナルユース」で実現するシステムの開発を行ったので報告する。
2.DVXα専用分散並列計算機
新たに作成した専用計算機のハードウェア構成は、ネットワーク接続やI/Oその他の仕事をするホストボードSparc Station10(75MHz)と16枚のアクセラレータボードがVME-busで結合されたものであり、それぞれのアクセラレータボード上では16MBから64MBのローカルメモリを持つDSPのTI320C40プロセッサが4つ実装されている。計64プロセッサの並列専用計算機である。ボード間のネットワークトポロジはハイパーリンクである。
3.ベンチマークテスト
ベンチマークテストとしてP型半導体の表面にH原子が吸着したものをモデル化した135原子からなるSi78 B6 H53クラスタを用いて計算時間を測定した。
ホストコンピュータとして使用しているSparc Station10(75MHz)だけで計算した場合と64プロセッサからなる分散並列専用計算機を使用した場合のSCF反復1回の計算時間をTable 1.に示す。32,768点の計算をSparc Station単体で実行した場合には、処理時間の97%以上がhij、Sijの生成に費やされている。それに対し、分散並列専用計算機を使用すると、並列化効率が高いため、hij、Sij生成の処理時間が著しく減少し、対角化のコストが相対的に大きくなってきている。
行列要素算出のステップだけみると分散並列専用計算機により100倍以上の高速化が図られており、理論性能限界の64倍を超えたスーパーリニアスピードアップが観測されている。これは、並列化によってプロセッサ一台あたりの問題サイズが小さくなり、キャッシュミスなどのメモリアーキテクチャに起因するボトルネックが解消されたためである。
演算時間の内訳(単位:秒)
| ポイント数 |
SPARC単体 | 2,048 | 4,096 | 8,192 | 16,382 | 32,762 |
球対称ポテンシャル生成 | 4 | 4 | 4 | 5 | 4 |
行列要素算出 | 509 | 1,019 | 2,067 | 4,104 | 8,196 |
行列固有値計算 | 178 | 173 | 174 | 175 | 176 |
電子再配分・収束判定 | 36 | 35 | 34 | 35 | 34 |
合 計 | 727 | 1,231 | 2,279 | 4,319 | 8,410 |
| ポイント数 |
SPARC+アクセレータ | 2,048 | 4,096 | 8,192 | 16,382 | 32,762 |
球対称ポテンシャル生成 | 5 | 4 | 4 | 5 | 6 |
行列要素算出 | 8 | 13 | 23 | 42 | 81 |
行列固有値計算 | 175 | 175 | 174 | 177 | 174 |
電子再配分・収束判定 | 34 | 39 | 34 | 35 | 35 |
合 計 | 222 | 231 | 235 | 259 | 296 |
色付部分は,アクセレータにより加速している.
BACK