コンテンツにスキップ

Bench1:Allegro + LAMMPS(LLZO bulk / 51,840 atoms)

このページは、LPのProof(Bench1)の詳細(条件・結果・再現方法)です。

目的

Allegro推論を毎step回すコストを「爆発しない条件」で再現よく測り、A100→H200 / 4GPU/8GPU選定の土台にする。

条件(再現に必要な最小セット)

項目
LLZO bulk(base 2,592 atoms を 2×2×5 replicate → 51,840 atoms
ポテンシャル Allegro(NequIP/Allegro deployed model)
実行 LAMMPS(pair_style allegro
dt 1 fs
測定方法 Throughput mode(座標固定 + setforce 0:物理MDではなく推論コスト測定)
Warmup 2,000 steps
Measure 20,000 steps

結果(比較)

構成 ns/day(ns/日) timesteps/s(step/s) katom-step/s(k-atom·step/s) 備考
A100 80GB ×1 0.175 2.024 104.930 1GPU
A100 80GB ×4(4レプリカ並列 / 平均/1GPU) 0.174 2.010 104.222 4ジョブ同時実行(1GPUあたり)
A100 80GB ×4(4レプリカ並列 / 合計) 0.695 8.041 416.886 合計スループット(3.97×)

注意(読み違い防止)

  • ここは 物理的に意味のあるNVT運動を見ていません(推論スループットの下限=再現可能な基準値)。
  • 物理MD(NVT/安定条件)での ns/day は 別ベンチ(Bench1-phys)として追加予定。

再現のしかた(最低限)

  • Warmup 2,000 steps → Measure 20,000 steps の平均を取ります
  • 出力ログから timesteps/s 相当の値を抽出して比較します
  • 同一条件でH200 NVLでもPoC実行し、A100との比較結果を提案書(構成・納期・概算)に反映して提示します(NDA/閉域OK、日本国内のみ)

次のリンク

  • スケール表:/benchmarks/scale/
  • まず1GPU(Runbook付き):/lp/h200-nvl-1gpu-runbook/

次のアクション(迷ったらここ)