はじめての材料シミュレーションを、最短で “動く” ところまで(Runbook付き)¶
QE/LAMMPS を触ったことがなくても大丈夫です。
「何をしたいか(目的)」だけ決めれば、こちらで実行環境・再現パック・手順(Runbook)まで揃えます。
- まずは 1GPU 構成でスタート(導入しやすい)
- 需要が出たら 4GPU/8GPU にスケール(同じRunbookの延長で運用)
- PoC は NDA/閉域OK(日本国内のみ)
こんな人向け¶
- シミュレーションをやりたいが QE/LAMMPSの導入と運用が重い
- 社内に専門家がいないので、「実行コマンドからトラブル対応まで」必要
- 研究テーマはあるが、まずは 小さく始めて段階的に伸ばしたい
提供するもの(入口パックのイメージ)¶
- GPUサーバ(まずは 1GPU構成を中心に提案)
- CUDA / LAMMPS / QE / Allegro(NequIP) など一式
- Runbook(手順書):実行コマンド、ジョブ投入、ログの見方、再現方法、トラブルシュート
- ベンチ / 再現パック(“同じ条件で再測定できる” 形で納品)
Proof(Bench1):再現できる実測を公開¶
下の Proof は A100 80GB で再現できる「推論スループットの基準値」です。
H200 側も同じベンチパックで測って比較できます。
Proof(Bench1):Allegro + LAMMPS 推論スループット(LLZO bulk / 51,840 atoms / dt=1fs)
目的:「Allegro推論を毎step回すコスト」を、爆発しない条件で確実に測り、A100→H200の比較や4GPU/8GPU選定の土台にする。
| 項目 | 値 |
|---|---|
| 系 | LLZO bulk(base 2,592 atoms を 2×2×5 replicate → 51,840 atoms) |
| ポテンシャル | Allegro(NequIP/Allegro deployed model) |
| 実行 | LAMMPS + pair_style allegro |
| dt | 1 fs |
| 測定方法 | Throughput mode(座標固定 + setforce 0。物理MDではなく“推論コスト測定”) |
| Warmup | 2,000 steps |
| Measure | 20,000 steps |
| 実行 | ns/day | timesteps/s | katom-step/s | 備考 |
|---|---|---|---|---|
| A100 80GB ×1 | 0.175 | 2.024 | 104.930 | 1GPU |
| A100 80GB ×4(4レプリカ並列・平均/1GPU) | 0.174 | 2.010 | 104.222 | 4ジョブ同時実行の「1GPUあたり」 |
| A100 80GB ×4(4レプリカ並列・合計) | 0.695 | 8.041 | 416.886 | 合計スループット(3.97×) |
- 注:ここは「物理的に意味のあるNVT運動」を見ていません。推論スループットの下限(再現可能な基準値)として使います。
- 物理MD(NVT/安定条件)でのns/dayは、別ベンチ(Bench1-phys)として追加します。
- 詳細ページ:→ /benchmarks/lammps-allegro-llzo-bulk-50k/
- H200 NVL実測:同一ベンチパックを PoCで実行して提示(NDA/閉域OK、日本国内のみ)
相談・見積(目的を聞いて、最短ルートを提案します)¶
- 目的(何を知りたいか)
- 対象(材料・系・サイズ感)
- 期間(いつまでに、どれくらい回したいか)
この3点がわかれば、最短で動く構成とRunbookを出せます。
相談・見積(最短1分)
この条件、4GPUで足りるか / 8GPUが必要かだけでも整理できます(NDA/閉域/学内規程もOK)。
相談・見積へ(最短1分)
※ 研究記事の文脈を崩さない“要件整理”の相談として扱います