コンテンツにスキップ

Allegro + LAMMPS ベンチ(LLZO bulk / 約50k atoms / dt=1fs)

Proof(Bench1):Allegro + LAMMPS 推論スループット(LLZO bulk / 51,840 atoms / dt=1fs)

目的:「Allegro推論を毎step回すコスト」を、爆発しない条件で確実に測り、A100→H200の比較や4GPU/8GPU選定の土台にする。

項目
LLZO bulk(base 2,592 atoms を 2×2×5 replicate → 51,840 atoms
ポテンシャル Allegro(NequIP/Allegro deployed model)
実行 LAMMPS + pair_style allegro
dt 1 fs
測定方法 Throughput mode(座標固定 + setforce 0。物理MDではなく“推論コスト測定”)
Warmup 2,000 steps
Measure 20,000 steps
結果(A100 80GB ×1) 0.176 ns/day / 2.032 timesteps/s / 105.339 katom-step/s
  • 注:ここは「物理的に意味のあるNVT運動」を見ていません。推論スループットの下限(再現可能な基準値)として使います。
  • 物理MD(NVT/安定条件)でのns/dayは、別ベンチ(Bench1-phys)として追加します。
  • 詳細ページ:→ /benchmarks/lammps-allegro-llzo-bulk-50k/
  • H200 NVL実測:同一ベンチパックを PoCで実行して提示(NDA/閉域OK、日本国内のみ)

条件(固定)

  • 系:LLZO bulk(元素:Li/La/Zr/O)
  • 原子数:51,840 atoms(base 2,592 atoms を replicate 2 2 5
  • dt:1 fs(LAMMPS units metaltimestep 0.001
  • ポテンシャル:Allegro(pair_style allegro / pair_coeff * * model.nequip.pth Li La Zr O
  • 測定モード:推論スループット測定(座標固定 / setforce 0)
  • 目的:「Allegro推論コスト」を安定に測って、GPU選定に使う
  • 注:物理MD(温度制御・緩和・発散回避)を詰めた “物理MD版ベンチ” は別途公開予定

結果(A100 80GB baseline)

GPU構成 目的 指標 結果
1GPU(1ジョブ) 1本あたりの速さ timesteps/s 2.032
ns/day 0.176
hours/ns 136.7
katom-step/s 105.339
4GPU(4レプリカ並列) 4条件を同時に回す 合計 ns/day 0.704 相当(0.176×4)

どう使うか(4GPUの売り方に直結)

  • 1GPU = 1条件(1温度/1初期配置/1seed)
  • 4GPU = 同条件4本を同時実行(レプリカ)
  • 統計を4倍にする / 温度や欠陥条件を4本同時に回す、が現場の価値に直結

再現メモ(ログから抜き出す場所)

  • log.lammps の最後付近に出る Performance: 行(MEASURE区間)を採用します。

相談・見積(最短1分)
この条件、4GPUで足りるか / 8GPUが必要かだけでも整理できます(NDA/閉域/学内規程もOK)。
相談・見積へ(最短1分)
※ 研究記事の文脈を崩さない“要件整理”の相談として扱います