Allegro + LAMMPS ベンチ(LLZO bulk / 約50k atoms / dt=1fs)¶
Proof(Bench1):Allegro + LAMMPS 推論スループット(LLZO bulk / 51,840 atoms / dt=1fs)
目的:「Allegro推論を毎step回すコスト」を、爆発しない条件で確実に測り、A100→H200の比較や4GPU/8GPU選定の土台にする。
| 項目 | 値 |
|---|---|
| 系 | LLZO bulk(base 2,592 atoms を 2×2×5 replicate → 51,840 atoms) |
| ポテンシャル | Allegro(NequIP/Allegro deployed model) |
| 実行 | LAMMPS + pair_style allegro |
| dt | 1 fs |
| 測定方法 | Throughput mode(座標固定 + setforce 0。物理MDではなく“推論コスト測定”) |
| Warmup | 2,000 steps |
| Measure | 20,000 steps |
| 結果(A100 80GB ×1) | 0.176 ns/day / 2.032 timesteps/s / 105.339 katom-step/s |
- 注:ここは「物理的に意味のあるNVT運動」を見ていません。推論スループットの下限(再現可能な基準値)として使います。
- 物理MD(NVT/安定条件)でのns/dayは、別ベンチ(Bench1-phys)として追加します。
- 詳細ページ:→ /benchmarks/lammps-allegro-llzo-bulk-50k/
- H200 NVL実測:同一ベンチパックを PoCで実行して提示(NDA/閉域OK、日本国内のみ)
条件(固定)¶
- 系:LLZO bulk(元素:Li/La/Zr/O)
- 原子数:51,840 atoms(base 2,592 atoms を
replicate 2 2 5) - dt:1 fs(LAMMPS
units metal→timestep 0.001) - ポテンシャル:Allegro(
pair_style allegro/pair_coeff * * model.nequip.pth Li La Zr O) - 測定モード:推論スループット測定(座標固定 / setforce 0)
- 目的:「Allegro推論コスト」を安定に測って、GPU選定に使う
- 注:物理MD(温度制御・緩和・発散回避)を詰めた “物理MD版ベンチ” は別途公開予定
結果(A100 80GB baseline)¶
| GPU構成 | 目的 | 指標 | 結果 |
|---|---|---|---|
| 1GPU(1ジョブ) | 1本あたりの速さ | timesteps/s | 2.032 |
| ns/day | 0.176 | ||
| hours/ns | 136.7 | ||
| katom-step/s | 105.339 | ||
| 4GPU(4レプリカ並列) | 4条件を同時に回す | 合計 ns/day | 0.704 相当(0.176×4) |
どう使うか(4GPUの売り方に直結)¶
- 1GPU = 1条件(1温度/1初期配置/1seed)
- 4GPU = 同条件4本を同時実行(レプリカ)
- 統計を4倍にする / 温度や欠陥条件を4本同時に回す、が現場の価値に直結
再現メモ(ログから抜き出す場所)¶
log.lammpsの最後付近に出るPerformance:行(MEASURE区間)を採用します。
相談・見積(最短1分)
この条件、4GPUで足りるか / 8GPUが必要かだけでも整理できます(NDA/閉域/学内規程もOK)。
相談・見積へ(最短1分)
※ 研究記事の文脈を崩さない“要件整理”の相談として扱います