§ Capability 03 · PoC 脱出 Sprint
Phase: 決めるDECIDE

PoC を、
「やってみた」で終わらせない

PwC Japan の調査では日本企業の 76.3% が生成 AI 導入の効果を定量測定できていません。Tufe の PoC 脱出 Sprint は契約時点で『成功基準』『本番展開計画』『運用体制』を成果物に組み込み、6-8 週間で「次の一歩が決まる状態」を作ります。

76.3%
PoC 死率(日本)
6-8 週
PoC 期間
契約時
成功基準・本番計画を確定
国内完結
Bedrock 東京 + 大阪
§ 起きている事

PoC を 3 つ走らせたが、本番化したものは 0 個

個別の業務に Claude / ChatGPT を試してみた。動くことは確認できた。けれど、本番に投入しようとすると「誰が運用するのか」「どこまで自動化していいのか」「失敗時の責任は」が決まっていない。

結局「効果は確認できたので、引き続き検討」のまま、PoC が物置に。これが日本企業の 76.3% に起きていることです。

原因は技術ではなく、PoC の最初の段階で『本番に持ち上がった時に何が必要か』を設計していないこと。Tufe の PoC 脱出 Sprint はこの構造問題を契約時点で解消します。

01個別 PoC を 3 つ並行で発注
02各 PoC が「動いた / 動かなかった」だけで終わる
03本番化に必要な追加投資が見えていない
04経営に「で、本番化はいつ?」と聞かれて答えられない
05翌期の予算に組み込まれず、PoC が物置に
§ Tufe が届けるもの

成功基準(契約時に確定)

「何を、どの数字で、いつまでに達成すれば本番化するか」を契約時に明文化。

本番展開計画

PoC 期間中に、本番化のための体制・予算・スケジュール・運用設計を並行で完成させる。

動くプロトタイプ

実業務データで動く Claude 構成。Bedrock 東京・大阪で国内完結。

本番化判断材料

PoC 結果 + 効果実測値 + 本番化提案書を 1 セットで納品。経営判断に直結。

§ Workflow · 進め方
4 ステップ

実際の作業の中身

01

Week 0 (契約時): 成功基準と本番計画の合意

「何を測るか」「どの数字なら本番化するか」「本番化時の体制・予算」を契約書の付属文書に明記。Tufe 独自のチェックリスト 30 項目で網羅。

02

Week 1-3: プロトタイプ構築

実業務データで動く構成を 3 週間で構築。Bedrock 東京・大阪標準、Claude プロジェクト機能・MCP コネクタを活用。

03

Week 4-6: 実業務での試運転 + 効果実測

現場 5-10 名が実業務で利用。時間削減・品質・利用率を Braintrust で計測。週次レポートで経営に進捗共有。

04

Week 7-8: 本番化判断 + 移行設計

成功基準達成可否を判定、達成なら本番化計画を確定(体制・予算・スケジュール)、未達ならどう改善するか or 撤退かを明確化。

§ Deliverables

納品される物

すべて貴社所有。コード・ドキュメント・運用 Runbook を クライアント側に残します。

契約付属の成功基準書
30 項目チェックリストで網羅
動くプロトタイプ
Bedrock 東京・大阪、実業務データ対応
効果実測レポート
Braintrust 計測、週次共有
本番展開計画書
体制・予算・スケジュール・運用設計
経営承認用デッキ
本番化 GO/STOP 判断材料
次フェーズ移行プラン
Production Build / Managed への接続
§ 業種別ユースケース
適用例

業種別の適用例

中堅士業(議事録 / 契約書)

顧問先打ち合わせ議事録 + 契約レビューの PoC を本番化基準付きで。

中堅製造業(RFQ / 見積)

RFQ 一次対応の PoC。受注率・対応時間を実測、本番化基準を契約時に明示。

EC(CS / 在庫)

問い合わせ自動下書きの PoC。応答品質と業務削減効果を実測。

不動産仲介

物件問い合わせ自動応答の PoC。成約率と機会損失削減を実測。

クリニック(受付業務)

予約・問い合わせ自動応対の PoC。スタッフ負担と CSAT を実測。

建設・工務店

現場メモ自動構造化 PoC。現場担当の事務時間削減を実測。

§ World References
すべて出典付き

PwC Japan: 76.3% が効果を定量測定できていない

「PoC 死」が日本の構造問題として顕在化。Tufe の PoC 脱出メソッドは、この構造問題に直接対処する設計。

PwC Japan 2025 春

Menlo Ventures: 95% の AI パイロットが ROI 不明

全世界でも同じ問題。PoC の入口で「何を測るか」を決めない設計が原因。

Menlo Ventures 2025

Anthropic: Eval-in-CI を Building Effective Agents で推奨

PoC 段階から Eval を組み込むことで、本番化判断の客観性を確保。Tufe は Braintrust を標準採用。

Anthropic Engineering
§ Stack

標準構成

LLM
Claude Opus 4.7 / Sonnet 4.6 / Haiku 4.5(用途別ルーティング)
Infra
Amazon Bedrock 東京 + 大阪 Cross-Region Inference(国内完結)
Auth
Google Workspace / Microsoft Entra ID SSO + 部署別アクセス制御
Eval
Braintrust(CI ゲート)+ 週次効果実測レポート
プロンプト管理
Git 版管理 + プロンプトレジストリ
観測
Langfuse / Helicone(オプション)
§ Timeline

スケジュール

Week 0
契約時
成功基準と本番化計画を契約書付属文書に明記。
Week 1-3
プロトタイプ構築
実業務データで動く構成を 3 週間で。
Week 4-6
試運転 + 効果実測
現場 5-10 名が実業務で利用、Braintrust で計測。
Week 7-8
本番化判断 + 移行設計
GO/STOP 判断、本番化計画を確定 or 改善案を策定。
Bedrock 東京 + 大阪 国内完結·Anthropic Commercial Terms 学習除外·AI 事業者ガイドライン v1.1 整合
§ FAQ
よくある質問

Q. 「成功基準達成」しなかった場合は?

「うまくいかなかった」を成果物として持ち帰れます。何が原因で動かなかったか、改善するなら何が必要か、撤退するなら次にどうするかを明確化します。これも PoC 脱出の重要な成果です。

Q. 通常の PoC との価格差は?

個別見積ですが、契約時点での成功基準合意・本番化計画作成・効果実測のためのコストは含まれます。本番化できないリスクの方が圧倒的に大きいため、ROI は高い傾向にあります。

Q. 他社実装した PoC を持ち込めますか?

はい。「動いているが本番化できていない」既存 PoC の本番化計画策定だけを Sprint 化することも可能です。最短 4 週間で対応します。

Q. 本番化決定後の実装も依頼できますか?

はい。Tufe の Production Build / MCP / Multi-Agent / Managed の各 capability にスムーズに移行できます。他社実装も構いません。

Q. 規制業種(金融・医療)でも対応できますか?

はい。Bedrock 東京・大阪国内完結、AI 事業者ガイドライン v1.1 整合、業種別規制(FISC・3 省 2 ガイドライン等)への対応経験があります。

§ Start

8 週間後に、
本番化が決まる

貴社の対象業務・既存システム・期待効果をお伺いした上で、Sprint スコープと成功基準案をその場でお伝えします。

NDA 締結対応·Bedrock 東京 / 大阪 国内完結·2 営業日以内に返信