Allegro + LAMMPS ベンチ(LLZO+Li / 50k atoms / dt=1fs)¶
Proof:Allegro + LAMMPS ベンチ(LLZO+Li / 50k atoms / 300K / dt=1fs)
- 測定環境(baseline):NVIDIA A100 80GB ×4(※販売機種はH200 NVL。ベンチ手順の再現性を先に固めます)
- 1GPU(1ジョブ):TBD steps/s(TBD ns/day)
- 4GPU(4レプリカ並列・同条件):合計 TBD ns/day(= 4条件/同時実行)
- 4GPU(強スケール・空間分割):1→2→4GPU:TBD×(参考)
- 詳細:→ /benchmarks/lammps-allegro-llzo-li-50k/
- H200 NVL実測:同一ベンチを PoCで実行して提示(NDA/閉域OK)
条件(固定)¶
- 系:LLZO + Li(固定)
- 原子数:50k atoms(固定)
- 温度:300K
- タイムステップ:dt = 1fs
- ポテンシャル:Allegro(QE由来データで学習した固定モデル)
- 実装:LAMMPS + Allegro interface
ベンチ1:4GPUは「4条件(4レプリカ)並列」が主役¶
- 1GPU = 1ジョブ
- 4GPU = 同一条件のレプリカを4本同時(seedだけ変える)
- 目的:探索/統計を4倍にする(4GPU 30Mの価値説明に直結)
(ここに結果テーブルを追記していきます)
ベンチ2:強スケール(空間分割)1→2→4GPU(参考)¶
- 同じ50kで、1ジョブを1→2→4GPUで速くする
- 目的:FAQ「1本は速くなる?」への回答
(ここに結果テーブルを追記)
注意(誤認防止)¶
- 公開値はA100 baselineです(販売機種はH200 NVL)。
- ただし「同一ベンチパックでH200測定可能」な状態にします。
相談・見積(最短1分)
この条件、4GPUで足りるか / 8GPUが必要かだけでも整理できます(NDA/閉域/学内規程もOK)。
相談・見積へ(最短1分)
※ 研究記事の文脈を崩さない“要件整理”の相談として扱います