コンテンツにスキップ

Allegro + LAMMPS ベンチ(LLZO+Li / 50k atoms / dt=1fs)

Proof:Allegro + LAMMPS ベンチ(LLZO+Li / 50k atoms / 300K / dt=1fs)

  • 測定環境(baseline):NVIDIA A100 80GB ×4(※販売機種はH200 NVL。ベンチ手順の再現性を先に固めます)
  • 1GPU(1ジョブ):TBD steps/s(TBD ns/day)
  • 4GPU(4レプリカ並列・同条件):合計 TBD ns/day(= 4条件/同時実行)
  • 4GPU(強スケール・空間分割):1→2→4GPU:TBD×(参考)
  • 詳細:→ /benchmarks/lammps-allegro-llzo-li-50k/
  • H200 NVL実測:同一ベンチを PoCで実行して提示(NDA/閉域OK)

条件(固定)

  • 系:LLZO + Li(固定)
  • 原子数:50k atoms(固定)
  • 温度:300K
  • タイムステップ:dt = 1fs
  • ポテンシャル:Allegro(QE由来データで学習した固定モデル)
  • 実装:LAMMPS + Allegro interface

ベンチ1:4GPUは「4条件(4レプリカ)並列」が主役

  • 1GPU = 1ジョブ
  • 4GPU = 同一条件のレプリカを4本同時(seedだけ変える)
  • 目的:探索/統計を4倍にする(4GPU 30Mの価値説明に直結)

(ここに結果テーブルを追記していきます)

ベンチ2:強スケール(空間分割)1→2→4GPU(参考)

  • 同じ50kで、1ジョブを1→2→4GPUで速くする
  • 目的:FAQ「1本は速くなる?」への回答

(ここに結果テーブルを追記)

注意(誤認防止)

  • 公開値はA100 baselineです(販売機種はH200 NVL)。
  • ただし「同一ベンチパックでH200測定可能」な状態にします。
相談・見積(最短1分)
この条件、4GPUで足りるか / 8GPUが必要かだけでも整理できます(NDA/閉域/学内規程もOK)。
相談・見積へ(最短1分)
※ 研究記事の文脈を崩さない“要件整理”の相談として扱います