コンテンツにスキップ

はじめての材料シミュレーションを、最短で “動く” ところまで(Runbook付き)

QE/LAMMPS を触ったことがなくても大丈夫です。
「何をしたいか(目的)」だけ決めれば、こちらで実行環境・再現パック・手順(Runbook)まで揃えます。

  • まずは 1GPU 構成でスタート(導入しやすい)
  • 需要が出たら 4GPU/8GPU にスケール(同じRunbookの延長で運用)
  • PoC は NDA/閉域OK(日本国内のみ)

こんな人向け

  • シミュレーションをやりたいが QE/LAMMPSの導入と運用が重い
  • 社内に専門家がいないので、「実行コマンドからトラブル対応まで」必要
  • 研究テーマはあるが、まずは 小さく始めて段階的に伸ばしたい

提供するもの(入口パックのイメージ)

  • GPUサーバ(まずは 1GPU構成を中心に提案)
  • CUDA / LAMMPS / QE / Allegro(NequIP) など一式
  • Runbook(手順書):実行コマンド、ジョブ投入、ログの見方、再現方法、トラブルシュート
  • ベンチ / 再現パック(“同じ条件で再測定できる” 形で納品)

Proof(Bench1):再現できる実測を公開

下の Proof は A100 80GB で再現できる「推論スループットの基準値」です。
H200 側も同じベンチパックで測って比較できます。

Proof(Bench1):Allegro + LAMMPS 推論スループット(LLZO bulk / 51,840 atoms / dt=1fs)

目的:「Allegro推論を毎step回すコスト」を、爆発しない条件で確実に測り、A100→H200の比較や4GPU/8GPU選定の土台にする。

項目
LLZO bulk(base 2,592 atoms を 2×2×5 replicate → 51,840 atoms
ポテンシャル Allegro(NequIP/Allegro deployed model)
実行 LAMMPS + pair_style allegro
dt 1 fs
測定方法 Throughput mode(座標固定 + setforce 0。物理MDではなく“推論コスト測定”)
Warmup 2,000 steps
Measure 20,000 steps
実行 ns/day timesteps/s katom-step/s 備考
A100 80GB ×1 0.175 2.024 104.930 1GPU
A100 80GB ×4(4レプリカ並列・平均/1GPU) 0.174 2.010 104.222 4ジョブ同時実行の「1GPUあたり」
A100 80GB ×4(4レプリカ並列・合計) 0.695 8.041 416.886 合計スループット(3.97×)
  • 注:ここは「物理的に意味のあるNVT運動」を見ていません。推論スループットの下限(再現可能な基準値)として使います。
  • 物理MD(NVT/安定条件)でのns/dayは、別ベンチ(Bench1-phys)として追加します。
  • 詳細ページ:→ /benchmarks/lammps-allegro-llzo-bulk-50k/
  • H200 NVL実測:同一ベンチパックを PoCで実行して提示(NDA/閉域OK、日本国内のみ)

相談・見積(目的を聞いて、最短ルートを提案します)

  • 目的(何を知りたいか)
  • 対象(材料・系・サイズ感)
  • 期間(いつまでに、どれくらい回したいか)

この3点がわかれば、最短で動く構成とRunbookを出せます。

相談・見積(最短1分)
この条件、4GPUで足りるか / 8GPUが必要かだけでも整理できます(NDA/閉域/学内規程もOK)。
相談・見積へ(最短1分)
※ 研究記事の文脈を崩さない“要件整理”の相談として扱います