← Claude 導入/支援メニュー/Multi-Agent / Agent SDK 開発

§ Capability 05 · Multi-Agent / Agent SDK 開発

Phase: 作る（BUILD）

1 つのエージェントでは足りない業務を、
複数の Claude で分業。

Anthropic 自身が「Lead-Opus + Sonnet サブエージェント構成で研究系評価で +90.2% 精度向上」を公表しています（Anthropic Engineering）。Tufe は Anthropic Agent SDK / Managed Agents をベースに、貴社業務に Multi-Agent 構成を設計・構築します。

Multi-Agent を相談 30 分の無料相談中身を見る

+90.2%

Anthropic 内部評価向上

Agent SDK

+ Managed Agents 標準

8-20 週

標準構築期間

国内完結

Bedrock 東京 + 大阪

§ 起きている事

1 つの Claude では回せない業務がある。

「与信判定」「契約書作成」「採用合否判定」のような複合業務は、1 つの LLM 呼び出しでは回せません。複数の判断ポイント、複数のデータソース、複数の人間承認が必要です。

個別の Claude 呼び出しを順番に並べる「直列パイプライン」では、エラー処理・並列化・人間介入が複雑になり、運用負荷が爆発します。

Multi-Agent 構成（Lead エージェント + 業務別 Sub-agent）に分解することで、Anthropic 自身が +90.2% の精度向上を公表しています。Tufe は同じ実装パターンを業務に組み込みます。

011 つの Claude 呼び出しで全部やらせようとする

02プロンプトが肥大化、出力が不安定

03個別呼び出しを順番に並べる

04エラー処理・並列・人間承認の運用が爆発

05結局運用できず、撤退

§ Tufe が届けるもの

複合業務のエージェント分解

Lead エージェント（オーケストレーション）+ Sub-agent（QA / 検証 / 個別判断）の構成。

並列処理 & 高速化

独立した判断は並列実行、結果を統合。Anthropic 自身の研究で +90.2% 精度。

人間承認ポイントの設計

破壊的操作・重要判断には HITL（Human In The Loop）を組み込み、安全運用を担保。

Agent SDK / Managed Agents 標準準拠

Anthropic 公式の最新仕様に準拠、将来のアップデートでも保守可能。

§ Workflow · 進め方

4 ステップ

実際の作業の中身。

業務プロセス分析 & エージェント分解

対象業務を判断ポイントごとに分解、どこを Lead に、どこを Sub に分担させるかを設計。

Agent SDK / Managed Agents 実装

Lead エージェント（オーケストレーター）と Sub-agent 群を実装。MCP 経由で業務システム接続。

HITL & Eval 構築

重要判断・破壊的操作には人間承認を組み込み。Braintrust で各エージェントの精度を CI ゲート化。

本番デプロイ & 運用化

Managed Agents（Anthropic ホスト）または自社環境にデプロイ。監視・コスト最適化を整備。

§ Deliverables

納品される物

すべて貴社所有。コード・ドキュメント・運用 Runbook をクライアント側に残します。

Lead + Sub-agent 構成

業務プロセス分解書 + 実装

Agent SDK 実装コード

Python / TypeScript

Eval スイート

Braintrust CI ゲート

HITL 承認フロー

Slack / Web 上の承認 UI

監視ダッシュボード

Langfuse / Datadog

Runbook

障害対応・コスト管理

§ 業種別ユースケース

適用例

業種別の適用例。

金融（与信判定 / 融資審査）

Lead が全体オーケスト、与信スコア計算 / 反社チェック / 過去履歴確認を並列 Sub-agent で。

製造業（RFQ 対応）

Lead が RFQ 解釈、見積試算 / 在庫確認 / 納期算定を並列 Sub-agent で実行。

法務（契約書作成）

Lead が契約全体構成、各条項を Sub-agent が起草、最終チェックを Lead が統合。

EC（CS 自動応対）

Lead が問い合わせ分類、在庫確認 / 配送追跡 / 返品処理を並列 Sub-agent で実行。

人材紹介（マッチング）

Lead が求職者ニーズ理解、案件検索 / スコア化 / 推薦文作成を並列 Sub-agent で。

建設（現場運営）

Lead が現場進捗管理、工程更新 / 発注 / 報告を並列 Sub-agent で。

§ World References

すべて出典付き

Anthropic: Multi-Agent で +90.2% 精度向上

Anthropic 自身がリサーチエージェントで、Lead-Opus + Sonnet サブエージェント構成で単一エージェントを大幅に上回る精度を公表。

Anthropic Engineering

Anthropic Managed Agents: $0.08 / session-hour

Anthropic がエージェント実行環境をホストする SaaS。Tufe はこれをベースに垂直エージェントを構築可能。

Anthropic Managed Agents

Anthropic Building Effective Agents（重要原則）

「単純な構成から始め、複雑な Multi-Agent は本当に必要な時だけ」が公式ガイダンス。Tufe はこの原則に従い、必要十分な複雑性で設計します。

Anthropic Engineering

§ Stack

標準構成

Agent SDK

Anthropic Claude Agent SDK (Python / TypeScript)

Hosting

Anthropic Managed Agents (推奨) / 自社環境

Orchestration

Mastra (TS) / LangGraph (Py) + Inngest / Temporal

Tools

MCP サーバ経由（社内 / 外部システム接続）

Eval

Braintrust（CI ゲート）+ Langfuse（self-host）

HITL

Slack / Web 承認 UI

Infra

Amazon Bedrock 東京 + 大阪 Cross-Region Inference

§ Timeline

スケジュール

Week 1-2

業務分析 & エージェント設計

プロセス分解、Lead/Sub の役割分担、Eval 基準

Week 3-8

実装

Agent SDK / Managed Agents 実装、MCP 接続、HITL 構築

Week 9-12

Eval & チューニング

Braintrust で精度測定、プロンプト改善、コスト最適化

Week 13+

本番運用

監視・障害対応・継続改善（マネージドサービスへ移行可）

Bedrock 東京 + 大阪国内完結·Anthropic Commercial Terms 学習除外·AI 事業者ガイドライン v1.1 整合

§ FAQ

よくある質問

Q. 単一エージェントとどう使い分けますか？

Anthropic 公式ガイダンスは「まず単一から、必要になったら Multi-Agent」です。複数の独立判断・並列処理・複合データソースが必要な業務でのみ Multi-Agent を選択します。Tufe は無駄な複雑化を避ける設計を提案します。

Q. Anthropic Managed Agents との関係は？

Tufe は Managed Agents を本番運用環境として推奨します。Anthropic がインフラを管理、$0.08/session-hour で従量課金、起動時間が高速。Tufe はその上のエージェント設計・実装・運用を担当します。

Q. コストはどのくらいかかりますか？

Multi-Agent はトークン消費が単一の 10-15 倍になることが Anthropic からも報告されています。Tufe は Haiku ルーティング・キャッシュ・Batch を駆使してコスト最適化を標準実装します。

Q. デバッグ・運用の難しさは？

Multi-Agent はデバッグが複雑です。Tufe は Langfuse / Braintrust 等で全 Sub-agent のトレースを可視化、障害時の根本原因特定を高速化します。

Q. 既存の単一 Agent システムから移行できますか？

可能です。既存実装の評価（どこを Multi-Agent 化すべきか）から始め、段階的に移行する設計を提案します。

§ 関連する支援メニュー

BUILD

MCP サーバ設計・構築

Claude を、貴社の業務システムに繋ぐ「連携基盤」。

詳しく

OPERATE

マネージドサービス

本番化後の Claude を、月次で継続改善・コスト最適化・モデル更新する。

詳しく

OPERATE

Forward Deployed Engineer 常駐

Tufe シニアエンジニアが貴社に常駐、AI 全社展開を伴走する。

詳しく

§ この能力で動かせる主力商品

商品 10

Claude Code 開発加速

Rakuten 79%・Spotify 90%・Mercari 70% の生産性向上事例（出典付）。Claude Code を IDE / CI / Sub-agent / Skills に組み込み、SaaS スタートアップ・受託開発の出力を倍加。

詳しく

商品 07

社内 FAQ Claude

規程・マニュアル・過去の Slack / メールを Claude に学習させた社内ボット。新人質問・繰り返し質問が一掃される。

詳しく

商品 08

営業日報・CRM Claude

営業が音声で 30 秒話すだけで、Claude が CRM への構造化入力 + 上司向け要約 + 次のアクション提案を生成。SFA 入力の苦痛を消す。

詳しく

§ Start

貴社の複合業務を、
Multi-Agent で運用化。

対象業務の複雑性・既存システム・期待効果をお伺いした上で、Multi-Agent 化の妥当性と構築規模をその場でお伝えします。

Multi-Agent を相談他の支援メニューも見る

NDA 締結対応·Bedrock 東京 / 大阪国内完結·2 営業日以内に返信

1 つのエージェントでは足りない業務を、複数の Claude で分業。