← Claude 導入/支援メニュー/Multi-Agent / Agent SDK 開発
§ Capability 05 · Multi-Agent / Agent SDK 開発
Phase: 作るBUILD

1 つのエージェントでは足りない業務を、
複数の Claude で分業

Anthropic 自身が「Lead-Opus + Sonnet サブエージェント構成で研究系評価で +90.2% 精度向上」を公表しています(Anthropic Engineering)。Tufe は Anthropic Agent SDK / Managed Agents をベースに、貴社業務に Multi-Agent 構成を設計・構築します。

+90.2%
Anthropic 内部評価向上
Agent SDK
+ Managed Agents 標準
8-20 週
標準構築期間
国内完結
Bedrock 東京 + 大阪
§ 起きている事

1 つの Claude では回せない業務がある

「与信判定」「契約書作成」「採用合否判定」のような複合業務は、1 つの LLM 呼び出しでは回せません。複数の判断ポイント、複数のデータソース、複数の人間承認が必要です。

個別の Claude 呼び出しを順番に並べる「直列パイプライン」では、エラー処理・並列化・人間介入が複雑になり、運用負荷が爆発します。

Multi-Agent 構成(Lead エージェント + 業務別 Sub-agent)に分解することで、Anthropic 自身が +90.2% の精度向上を公表しています。Tufe は同じ実装パターンを業務に組み込みます。

011 つの Claude 呼び出しで全部やらせようとする
02プロンプトが肥大化、出力が不安定
03個別呼び出しを順番に並べる
04エラー処理・並列・人間承認の運用が爆発
05結局運用できず、撤退
§ Tufe が届けるもの

複合業務のエージェント分解

Lead エージェント(オーケストレーション)+ Sub-agent(QA / 検証 / 個別判断)の構成。

並列処理 & 高速化

独立した判断は並列実行、結果を統合。Anthropic 自身の研究で +90.2% 精度。

人間承認ポイントの設計

破壊的操作・重要判断には HITL(Human In The Loop)を組み込み、安全運用を担保。

Agent SDK / Managed Agents 標準準拠

Anthropic 公式の最新仕様に準拠、将来のアップデートでも保守可能。

§ Workflow · 進め方
4 ステップ

実際の作業の中身

01

業務プロセス分析 & エージェント分解

対象業務を判断ポイントごとに分解、どこを Lead に、どこを Sub に分担させるかを設計。

02

Agent SDK / Managed Agents 実装

Lead エージェント(オーケストレーター)と Sub-agent 群を実装。MCP 経由で業務システム接続。

03

HITL & Eval 構築

重要判断・破壊的操作には人間承認を組み込み。Braintrust で各エージェントの精度を CI ゲート化。

04

本番デプロイ & 運用化

Managed Agents(Anthropic ホスト)または自社環境にデプロイ。監視・コスト最適化を整備。

§ Deliverables

納品される物

すべて貴社所有。コード・ドキュメント・運用 Runbook を クライアント側に残します。

Lead + Sub-agent 構成
業務プロセス分解書 + 実装
Agent SDK 実装コード
Python / TypeScript
Eval スイート
Braintrust CI ゲート
HITL 承認フロー
Slack / Web 上の承認 UI
監視ダッシュボード
Langfuse / Datadog
Runbook
障害対応・コスト管理
§ 業種別ユースケース
適用例

業種別の適用例

金融(与信判定 / 融資審査)

Lead が全体オーケスト、与信スコア計算 / 反社チェック / 過去履歴確認を並列 Sub-agent で。

製造業(RFQ 対応)

Lead が RFQ 解釈、見積試算 / 在庫確認 / 納期算定を並列 Sub-agent で実行。

法務(契約書作成)

Lead が契約全体構成、各条項を Sub-agent が起草、最終チェックを Lead が統合。

EC(CS 自動応対)

Lead が問い合わせ分類、在庫確認 / 配送追跡 / 返品処理を並列 Sub-agent で実行。

人材紹介(マッチング)

Lead が求職者ニーズ理解、案件検索 / スコア化 / 推薦文作成を並列 Sub-agent で。

建設(現場運営)

Lead が現場進捗管理、工程更新 / 発注 / 報告を並列 Sub-agent で。

§ World References
すべて出典付き

Anthropic: Multi-Agent で +90.2% 精度向上

Anthropic 自身がリサーチエージェントで、Lead-Opus + Sonnet サブエージェント構成で単一エージェントを大幅に上回る精度を公表。

Anthropic Engineering

Anthropic Managed Agents: $0.08 / session-hour

Anthropic がエージェント実行環境をホストする SaaS。Tufe はこれをベースに垂直エージェントを構築可能。

Anthropic Managed Agents

Anthropic Building Effective Agents(重要原則)

「単純な構成から始め、複雑な Multi-Agent は本当に必要な時だけ」が公式ガイダンス。Tufe はこの原則に従い、必要十分な複雑性で設計します。

Anthropic Engineering
§ Stack

標準構成

Agent SDK
Anthropic Claude Agent SDK (Python / TypeScript)
Hosting
Anthropic Managed Agents (推奨) / 自社環境
Orchestration
Mastra (TS) / LangGraph (Py) + Inngest / Temporal
Tools
MCP サーバ経由(社内 / 外部システム接続)
Eval
Braintrust(CI ゲート)+ Langfuse(self-host)
HITL
Slack / Web 承認 UI
Infra
Amazon Bedrock 東京 + 大阪 Cross-Region Inference
§ Timeline

スケジュール

Week 1-2
業務分析 & エージェント設計
プロセス分解、Lead/Sub の役割分担、Eval 基準
Week 3-8
実装
Agent SDK / Managed Agents 実装、MCP 接続、HITL 構築
Week 9-12
Eval & チューニング
Braintrust で精度測定、プロンプト改善、コスト最適化
Week 13+
本番運用
監視・障害対応・継続改善(マネージドサービスへ移行可)
Bedrock 東京 + 大阪 国内完結·Anthropic Commercial Terms 学習除外·AI 事業者ガイドライン v1.1 整合
§ FAQ
よくある質問

Q. 単一エージェントとどう使い分けますか?

Anthropic 公式ガイダンスは「まず単一から、必要になったら Multi-Agent」です。複数の独立判断・並列処理・複合データソースが必要な業務でのみ Multi-Agent を選択します。Tufe は無駄な複雑化を避ける設計を提案します。

Q. Anthropic Managed Agents との関係は?

Tufe は Managed Agents を本番運用環境として推奨します。Anthropic がインフラを管理、$0.08/session-hour で従量課金、起動時間が高速。Tufe はその上のエージェント設計・実装・運用を担当します。

Q. コストはどのくらいかかりますか?

Multi-Agent はトークン消費が単一の 10-15 倍になることが Anthropic からも報告されています。Tufe は Haiku ルーティング・キャッシュ・Batch を駆使してコスト最適化を標準実装します。

Q. デバッグ・運用の難しさは?

Multi-Agent はデバッグが複雑です。Tufe は Langfuse / Braintrust 等で全 Sub-agent のトレースを可視化、障害時の根本原因特定を高速化します。

Q. 既存の単一 Agent システムから移行できますか?

可能です。既存実装の評価(どこを Multi-Agent 化すべきか)から始め、段階的に移行する設計を提案します。

§ Start

貴社の複合業務を、
Multi-Agent で運用化

対象業務の複雑性・既存システム・期待効果をお伺いした上で、Multi-Agent 化の妥当性と構築規模をその場でお伝えします。

NDA 締結対応·Bedrock 東京 / 大阪 国内完結·2 営業日以内に返信