Bench1:Allegro + LAMMPS(LLZO bulk / 51,840 atoms)¶
このページは、LPのProof(Bench1)の詳細(条件・結果・再現方法)です。
目的¶
Allegro推論を毎step回すコストを「爆発しない条件」で再現よく測り、A100→H200 / 4GPU/8GPU選定の土台にする。
条件(再現に必要な最小セット)¶
| 項目 | 値 |
|---|---|
| 系 | LLZO bulk(base 2,592 atoms を 2×2×5 replicate → 51,840 atoms) |
| ポテンシャル | Allegro(NequIP/Allegro deployed model) |
| 実行 | LAMMPS(pair_style allegro) |
| dt | 1 fs |
| 測定方法 | Throughput mode(座標固定 + setforce 0:物理MDではなく推論コスト測定) |
| Warmup | 2,000 steps |
| Measure | 20,000 steps |
結果(比較)¶
| 構成 | ns/day(ns/日) | timesteps/s(step/s) | katom-step/s(k-atom·step/s) | 備考 |
|---|---|---|---|---|
| A100 80GB ×1 | 0.175 | 2.024 | 104.930 | 1GPU |
| A100 80GB ×4(4レプリカ並列 / 平均/1GPU) | 0.174 | 2.010 | 104.222 | 4ジョブ同時実行(1GPUあたり) |
| A100 80GB ×4(4レプリカ並列 / 合計) | 0.695 | 8.041 | 416.886 | 合計スループット(3.97×) |
注意(読み違い防止)¶
- ここは 物理的に意味のあるNVT運動を見ていません(推論スループットの下限=再現可能な基準値)。
- 物理MD(NVT/安定条件)での ns/day は 別ベンチ(Bench1-phys)として追加予定。
再現のしかた(最低限)¶
- Warmup 2,000 steps → Measure 20,000 steps の平均を取ります
- 出力ログから
timesteps/s相当の値を抽出して比較します - 同一条件でH200 NVLでもPoC実行し、A100との比較結果を提案書(構成・納期・概算)に反映して提示します(NDA/閉域OK、日本国内のみ)
次のリンク¶
- スケール表:/benchmarks/scale/
- まず1GPU(Runbook付き):/lp/h200-nvl-1gpu-runbook/
次のアクション(迷ったらここ)¶
- 今すぐ「1台で回る状態」を作りたい → /lp/h200-nvl-1gpu-runbook/
- いきなり購入が不安/要件がまだ曖昧 → /solutions/founding5/
- 稟議・調達の流れを確認したい → /procurement/
- まず相談(最短1分)→ /contact/