コンテンツにスキップ

Proof-First

何が得られるか

どのように進めるか

事例(抜粋)

次の一手

Proof-first:まず「証拠セット」で実現性を証明し、必要なら「再現セット」まで整える

「予算はある/やりたいことも明確。でも この構成で本当に回るのか買った後に詰まらないか が不安」
その不安を最短で潰すために、私たちは 最初に“証拠”を納品してから本番へ進む 進め方を用意しています。

Proof-first は、いわゆる PoC を「丸投げで長期化」させません。
合意した受入条件に対して、測定して、記録して、再説明できる形(成果物) にして納品します。


二層で設計します:証拠セット/再現セット

Proof-first の肝は、納品物を 二層 に分けることです。

証拠セット(Proof) 再現セット(Repro)
目的 意思決定(稟議・投資判断)を前に進める 社内で再現・運用できる状態にする
受け取れるもの 「できる/できない」の根拠 「同じ状態を自分たちで作れる」一式
典型的な使い方 まずはここでリスクを潰す 本番導入・内製運用に進むとき

まず納品するもの:証拠セットの中身(例)

証拠セットは、結果と根拠 が中心です(“再現のための自動化一式”は含めません)。

  • 受入条件(OKの定義):速度、安定性、再現性、運用制約 など
  • 受入テスト計画:何をどう測るか(測定方法・前提・注意点)
  • 受入テスト結果:ログ/グラフ/主要メトリクス/比較表
  • 環境サマリ:OS/driver/CUDA/主要ライブラリ/設定要点(ピン留め含む)
  • 検証Runbook(実行手順):当社検証環境で同じ測定を再実行できる手順
  • リスク・次アクション:本番で詰まりやすい論点と対策案

重要:ここで納品する「Runbook」は 検証の再実行手順 です。
「一から構築して社内で運用するための自動化/運用Runbook」は、再現セットで扱います。


必要なら納品するもの:再現セットの中身(例)

再現セットは、“社内で同じ状態を再現し、運用できる” ところまでを一式にします。

  • 構築自動化:Ansible / Terraform / shell / container など(環境を作り直せる)
  • 設定・テンプレ一式:設定ファイル、ジョブスクリプト、パラメータテンプレ
  • 運用Runbook:障害切り分け、更新手順、バックアップ、権限設計の要点
  • (必要に応じて)監視・計測の型:最低限のメトリクスと見方

相殺(クレジット):Proof-first費用を「次の購入」に繋げやすく

Proof-first は 有償の検証 です。
ただし、検証で終わらず同一案件の本番導入/ハード購入へ進む場合は、後工程の費用から相殺(クレジット) できる設計にしています。

  • 相殺の対象:本番導入の作業費、導入設計パック、ハード調達サポート等
  • 相殺率・条件(対象範囲/期限など)は お見積書に明記 します

「検証費用が無駄になるのが不安」という壁を下げつつ、
きちんと結果に責任を持てる形にしています。


保証範囲(ここを最初に明確にします)

Proof-first が保証するのは “結果を出すこと”ではなく、“根拠を残すこと” です。

私たちが保証すること(例) - 合意した受入条件に基づく 測定の実施 - 証拠セットの納品(結果が良かった/悪かったに関係なく納品) - 測定前提・手順・再現条件の明記(第三者説明ができる粒度)

保証しないこと(例) - お客様環境の差異(ネットワーク、ストレージ、セキュリティ製品等)による結果差 - データ品質・ラベル品質に起因する精度/損失の改善 - OSSや依存ライブラリの仕様変更による将来の挙動(ただしバージョンは固定して記録します)


プラン(目安):A=証拠セット、B=証拠+再現セット

※ 正確には「ワークロード」「制約(閉域/NDA/運用要件)」「期間」で上下します。
広告や初回相談では、まずこの2プランで会話を始めるのが分かりやすいです。

プランA:証拠セット(投資判断を前に進める最小構成)

  • 期間目安:1〜2週間
  • 価格目安:税別 60万〜120万円 / 1テーマ(多くのケースで 80万円前後が着地)
  • 向いている:性能確認・互換性確認・クラウド vs オンプレ比較・稟議資料づくり

プランB:証拠セット + 再現セット(社内再現・運用まで)

  • 期間目安:2〜4週間
  • 価格目安:税別 150万〜350万円 / 1テーマ(多くのケースで 200〜250万円前後が着地)
  • 向いている:オンプレ運用、内製チームへの引き継ぎ、将来の増設や保守を見据えるケース

Proof-firstで刺さりやすい「やりたいこと」例

ここにある例はすべて オープンソース × GPUサーバ で実現しやすい領域です。
多くの案件は「証拠セット(プランA)」で始め、必要なら「再現セット(プランB)」へ拡張します。


証拠セット向き:まずは“できる/できない”の根拠が欲しい

  1. LLMを社内(閉域)で安全に動かしたい(vLLM / TGI / Ollama など)
  2. 納品例:想定モデルの推論スループット/レイテンシ、VRAM/CPU/RAM使用量、同時接続限界、運用上の注意点

  3. RAG(社内文書検索)を試したい(text-embedding + Vector DB)

  4. 納品例:RAGの精度/再現性、検索設定の当たり、データ前処理の要点、費用対効果の見積り材料

  5. 「そのモデル、手元のGPUに載る?」を事前に確認したい

  6. 納品例:モデルサイズごとの必要VRAM、量子化/バッチ/コンテキスト長の限界、現実的な構成案

  7. 学習/推論が遅いので“どこがボトルネックか”知りたい

  8. 納品例:I/O・CPU・GPU・ネットワークの切り分け結果、改善余地の見積り(やる価値があるか判断)

  9. HPCコードをGPUで速くしたい/速くなるか確かめたい

  10. 例:Quantum ESPRESSO、LAMMPS、GROMACS、OpenFOAM など(対象に合わせて)
  11. 納品例:CPU vs GPU比較、スケーリング、主要パラメータの感度、安定運用の注意点

  12. “クラウド vs オンプレ”の費用対効果を判断したい

  13. 納品例:想定ワークロードでの実測値、運用コストの論点、損益分岐の材料(稟議にそのまま使える形)

再現セット向き:社内で回し続ける/引き継ぐところまで欲しい

  1. オンプレLLM推論の本番運用(監視・権限・更新まで)
  2. 例:API化、同時接続、監視(GPU/メモリ/レイテンシ)、アップデート手順
  3. 再現セット例:構築自動化 + 運用Runbook + 設定テンプレ

  4. 学習(fine-tuning)パイプラインを内製化したい

  5. 例:LoRA/QLoRA、分散学習、再現性の担保、学習ログの管理
  6. 再現セット例:ジョブスクリプト/設定テンプレ、再現可能な環境固定、手順と運用ノウハウ

  7. 社内で回せる“ワークロードRunbook”を作りたい

  8. 例:特定の解析/学習ジョブを、誰が実行しても同じ結果が出る状態にする
  9. 再現セット例:入力ファイル雛形、ジョブ投入テンプレ、失敗時の切り分け手順

  10. 増設(スケール)まで見据えて、最初から設計を固めたい

  11. 例:単体→複数GPU→複数ノード、ストレージ設計、ネットワーク設計
  12. 再現セット例:設計の型 + 自動化 + 構成変更の手順(将来のコストを下げる)


相談はこちら

用途に近い入口を選んでください(相談内容が曖昧でもOKです)。

ワークロード別 Runbook を相談 HPC/AI 導入設計を相談 H200 NVL ハードを相談


プライバシーポリシー:こちら