コンテンツにスキップ

スケール表(1→4→8GPUの考え方)

このページは、「まず1GPUで回る状態を作り、必要なら4GPU/8GPUへ」を判断するための整理です。
同じベンチ条件で計測した値を揃えることで、導入後に“何がどれだけ速くなったか”を説明できます。

指標の定義(読むポイント)

  • ns/day(ns/日):同じ系・同じ条件でのスループット指標(大きいほど速い)
  • timesteps/s(step/s):1秒あたりのステップ数(推論/計算コストの目安)
  • katom-step/s(k-atom·step/s):規模(原子数)を加味したスループット
  • 並列(レプリカ並列):同条件ジョブを複数同時に流し「合計スループット」を上げる(開発反復に効く)

まず結論(迷ったら)

  • 反復を回したい/同時に複数条件を試したい → 4GPU(レプリカ並列が効く)
  • 学習/推論を最短で終えたい/スループット最優先 → 8GPU
  • 初手の最適解 → まず1GPUで「検収できる状態(Runbook/受入テスト)」を固定

参照

  • Bench1(推論スループット):/benchmarks/lammps-allegro-llzo-bulk-50k/
  • まず1GPU(Runbook付き):/lp/h200-nvl-1gpu-runbook/
  • 4GPU/8GPUの選び方:/solutions/h200-nvl-selection/

次のアクション(迷ったらここ)