Extended Thinking（拡張思考）とは？（Extended Thinking — Claude の段階的推論モード）意味と使い方を実務目線で解説

Extended Thinking（拡張思考）とは？

Extended Thinking は、Claude が最終的な回答を出力する前に「思考過程」を内部で段階的に展開する推論モードです。数学の証明・法律文書の解釈・コードのデバッグなど、一度の推論では誤りやすいタスクにおいて、段階的に仮説を立て・検証し・修正するプロセスを経ることで回答精度を高めます。Anthropic が2025年に正式公開した機能で、2026年5月時点では Claude Sonnet 4.6 と Claude Haiku 4.5 が本機能に対応しています。

※ 出典: Anthropic Claude Models Overview（取得 2026-05）

なぜ重要なのか

従来の LLM は、プロンプトに対して即座にトークンを生成するため、複数のステップを踏む問題では途中の論理的ミスが最終回答に引き継がれやすい弱点がありました。Extended Thinking はこの「思考の短絡化」を防ぎ、困難なタスクでの精度を実用レベルに引き上げます。

業務での影響は大きく、特に以下の分野で顕著です。士業・法律事務所での契約書レビュー自動化、会計事務所での税務判断補助、エンジニアチームのバグ解析など、「答えが合っているだけでなく、判断根拠が正確でなければならない」用途に適しています。精度向上の代償として思考トークン分のコストが追加されますが、人間の確認工数削減効果と比較した場合、多くのケースでコスト効率が上回ります。

対応モデルと価格の仕組み

2026年5月時点で Extended Thinking に対応する Claude モデルは以下のとおりです。

モデル	入力価格	出力価格	Extended Thinking	Adaptive Thinking
Claude Sonnet 4.6	$3/MTok	$15/MTok	対応	対応
Claude Haiku 4.5	$1/MTok	$5/MTok	対応	非対応
Claude Opus 4.7	$5/MTok	$25/MTok	非対応	対応

※ 出典: Anthropic Claude Models Overview／Anthropic Pricing（取得 2026-05）

Extended Thinking を有効にすると、Claude が内部で生成する「思考トークン」も出力トークンとして課金されます。思考の深さ（budget_tokens パラメータ）を制御することでコストを調整できますが、budget_tokens を下げすぎると思考が中途半端になり精度が落ちるため、タスクの複雑度に合わせた設定が必要です。

Adaptive Thinking との違い

Claude Opus 4.7 が対応する Adaptive Thinking は、問題の難易度に応じて推論量を動的に調整するモードです。Extended Thinking がユーザー側で思考予算を指定するのに対し、Adaptive Thinking はモデル自身が「どれだけ考えるべきか」を判断します。精度の最大化よりも、推論コストの自動最適化を重視するシナリオに向いています。

Chain of Thought との関係

Chain of Thought（CoT）プロンプティングは、「ステップバイステップで考えてください」とプロンプトに明示して推論過程を出力させる手法です。Extended Thinking はこれを API レベルで実装したもので、思考過程をユーザーに見える形で出力することも、非表示のまま最終回答だけを返すことも選択できます。CoT がプロンプトエンジニアリングの工夫であるのに対し、Extended Thinking はモデルアーキテクチャに組み込まれた仕組みという点で本質的に異なります。

実務での活用例

法律・士業: 契約書に含まれる複数条項の矛盾点を抽出するタスクは、条項間の論理的整合性を段階的に確認する必要があるため、Extended Thinking が有効です。Tufe Company ではClaude による契約書レビュー自動化の実装支援でこのモードを活用しています。

コードデバッグ: スタックトレースと複数ファイルの依存関係を同時に解析するシナリオで、思考過程を展開することで根本原因の特定精度が上がります。Claude API と MCP の実装ハンドブックでは具体的な API 呼び出し構成も解説しています。

数学・データ分析: 財務モデルの計算検証や統計的推論では、一段階ごとに計算結果を検証しながら進む Extended Thinking の特性が誤りの防止に機能します。

生成AIや AIエージェントを業務に組み込む際、精度が求められる判断ステップに Extended Thinking を使い、量をこなす単純タスクには通常モードを使い分けるのが実践的な設計方針です。

よくある誤解・注意点

誤解1: 思考過程は常にユーザーに見える Extended Thinking の思考過程はデフォルトでは API レスポンスに含まれますが、thinking.type: "enabled" 設定で思考ブロックを非表示にして最終回答のみを返すことも可能です。ユーザー向けチャット UI では思考過程を表示しないほうがUXが良いケースが多くあります。

誤解2: Extended Thinking をオンにすれば常に精度が上がる 単純な質問応答や短い文章生成では、思考時間の分だけ応答が遅くなるデメリットが生じ、精度の向上は限定的です。速度重視のリアルタイム用途や大量処理では通常モードのほうが適切です。

誤解3: Claude Opus 4.7 が Extended Thinking に対応している 現行の最上位モデルである Claude Opus 4.7 は Adaptive Thinking に対応していますが、Extended Thinking（budget_tokens による思考予算指定）には対応していません。Extended Thinking を使いたい場合は Claude Sonnet 4.6 または Claude Haiku 4.5 を選択してください。

よくある質問

Q. Extended Thinking の思考トークンはどのように課金されますか？

思考トークンは出力トークンと同じ単価で課金されます。Claude Sonnet 4.6 の場合、出力は $15/MTok です。budget_tokens パラメータで思考に使う最大トークン数を指定できるため、コスト管理が可能です。ただし思考予算を極端に絞ると推論が中途半端になり、精度が下がることがあります。業務用途では budget_tokens: 10000 程度から試してチューニングするのが一般的です。

※ 出典: Anthropic Pricing（取得 2026-05）

Q. Extended Thinking と通常モードをどう使い分けますか？

判断の基準は「タスクの複雑度」と「レイテンシ要件」の2軸です。複数ステップの論理推論・法的・数理的な判断・バグの根本原因解析など、精度が最優先のタスクには Extended Thinking を使います。一方、リアルタイムの会話応答・大量のドキュメント分類・テキスト変換など、速度やコストを重視するシナリオでは通常モードが適切です。プロンプトエンジニアリングの観点では、まず通常モードで試し、精度に課題があれば Extended Thinking に切り替えるアプローチが効率的です。

Q. RAG と組み合わせて使えますか？

はい、Extended Thinking と RAG（Retrieval-Augmented Generation）は組み合わせて使えます。検索で取得した文書を Context に渡しつつ Extended Thinking を有効にすることで、「複数の外部情報を参照しながら論理的に推論する」タスクの精度をさらに高められます。ただし Context に大量のドキュメントを含めると入力トークン数が増え、思考コストも上昇するため、事前に関連度の高いチャンクを絞り込む検索設計が重要です。

Tufe Companyのサービス

Tufe Company では、Extended Thinking を活用した Claude API 実装支援・業務自動化設計を提供しています。詳しくは AI活用・業務自動化サービスをご覧ください。また、実際の導入事例は Claude 活用完全ガイドと Claude API × MCP 実装ハンドブックでも解説しています。

実装支援が必要な方は無料相談をご利用ください。

Extended Thinking（拡張思考）とは？