llms.txt とは、サイトルートに設置する Markdown ファイルで、AI クローラーに対してサイト構造と主要 URL を要約して伝える仕様です(2024年9月、Jeremy Howard / Answer.AI 提案)。 「ChatGPT に自社名を聞かれたら、何と答えてほしいか」— この問いに即答できる企業は、2026 年時点でまだ多くありません。検索の前段に AI が入り、ユーザーが Google を開く前に推薦が決まる時代に、llms.txt という小さなテキストファイルと、AI 検索エンジン向けに整えたコンテンツ構造の有無が、引用される企業とされない企業を分けています。OpenAI 公式によれば ChatGPT の週間アクティブユーザーは 9億人規模(2026年2月時点)に達しており、日本国内でも検索行動に生成 AI を使う層は約 4割(37.0%、2025年10月)に到達しました。本ガイドでは llms.txt の書き方と、AI Search への引用獲得を「技術」と「編集」の両面から、100 本以上の引用実例ファクトチェック結果を踏まえて手順化します。
※ 出典: Search Engine Land「OpenAI: ChatGPT now has 900 million weekly active users」(取得 2026-05) / サイバーエージェント GEOラボ調査(2025年10月)(取得 2026-05)
Chapter 1: AI Search の現状と引用メカニズム
「検索される」から「引用される」へ
2024 年までの SEO は「検索結果で上位を取る」ことを成果と定義していました。2025 年以降、この前提は崩れつつあります。理由は二つです。
第一に、Google AI Overview の表示拡大によって、上位サイトのオーガニック CTR が大幅に低下しました。Seer Interactive の調査では AI Overview 表示時に Organic CTR が約 61% 下落し、Ahrefs の調査でも約 58% の低下が確認されています。「1 位を取ってもクリックされない」現象が現実になりました。
第二に、ユーザーが ChatGPT Search や Perplexity、Gemini を Google より先に開く動線が定着し始めています。Backlinko によれば Perplexity の月間アクティブユーザーは約 4,500 万人規模(2025 年下半期)に達し、ChatGPT は週間で 9 億人を超えました。
※ 出典: Search Engine Land「Google AI Overviews drive 61% drop in organic CTR」(取得 2026-05) / Ahrefs「AI Overviews Reduce Clicks by 58%」(取得 2026-05) / Backlinko「Perplexity AI Statistics」(取得 2026-05)
結果として、SEO の KPI は「上位表示」から「AI 回答内での引用露出」へと入れ替わりました。引用されればブランド名・サイト名・URL の三点セットが AI 回答内に直接表示され、トラフィックゼロでも認知形成と意思決定影響を獲得できる構造です。
AI Search の引用メカニズムを 4 ステップで理解する
ChatGPT Search・Perplexity・Gemini の引用ロジックには細部の違いはありますが、骨格は次の 4 ステップで共通しています。
- クエリ理解 — ユーザーの自然言語質問を意図に分解。
- ソース選定 — Web 検索 API(Bing / Google / 独自インデックス)を叩いて候補 URL を取得し、信頼度・専門性・鮮度でフィルタ。
- 抜粋・要約 — 候補ページの HTML 本文と構造化情報を抽出し、回答に使う部分を切り出す。
- 引用付き回答生成 — 切り出した抜粋を再構成し、ソース URL を脚注として付ける。
つまり、AI 検索における鍵は (2) ソース選定 と (3) 抜粋しやすさ の二点です。前者は技術的シグナル(llms.txt / 構造化データ / robots.txt 許可 / E-E-A-T シグナル)で、後者は編集的設計(冒頭結論型・チャンク化・固有名詞)で決まります。
LLMO / GEO との関係
LLMO(Large Language Model Optimization)と GEO(Generative Engine Optimization)の全体像は LLMO/GEO 完全ガイド に整理してあります。本ガイドはその中の 「llms.txt 実装」と「AI Search 引用獲得」 という二つの実務テーマに特化した実装書です。重複する全体論は前掲ガイドに譲り、ここでは手を動かすための具体に集中します。
llms.txt とは
llms.txt とは、サイトルートに設置する Markdown 形式のテキストファイルで、AI クローラーや LLM に対してサイト要約と主要 URL を提供する仕様です。Answer.AI の Jeremy Howard が 2024 年 9 月 3 日に llmstxt.org で提案し、必須セクションは H1(サイト名)のみ、それ以外(要約 blockquote / セクション見出し / リンク群 / Optional セクション)はすべて任意です。robots.txt や sitemap.xml と並ぶ「AI クローラーへの公式メッセージファイル」として位置付けられています。
※ 出典: llms.txt(llmstxt.org 公式仕様)(取得 2026-05)
Chapter 2: llms.txt 仕様と書き方(llmstxt.org 準拠)
llms.txt とは — Jeremy Howard 提案、2024年9月3日公開
llms.txt は Answer.AI の Jeremy Howard が 2024 年 9 月 3 日に llmstxt.org で提案した、サイトルートに設置する Markdown 形式のテキストファイルです。robots.txt や sitemap.xml と同じく、AI クローラーや LLM 推論時に参照されることを想定したサイト要約ファイルとして位置付けられています。
※ 出典: llms.txt(llmstxt.org 公式仕様)(取得 2026-05)
仕様 — 必須は H1 だけ、あとは任意
公式仕様は意外なほどシンプルです。
| セクション | 必須/任意 | 内容 |
|---|---|---|
# Project Name (H1) | 必須 — 唯一の必須セクション | プロジェクト名・サイト名 |
> blockquote 要約 | 任意(推奨) | 1-2 文の短い要約 |
| 本文段落 | 任意 | 補足説明(Markdown) |
## Section 見出し + リンク群 | 任意 | 主要 URL を [名前](URL): 説明 形式で列挙 |
## Optional セクション | 任意 | 「短い文脈が必要な時はスキップ可」と仕様で明示された特別セクション |
ファイル配置: サイトルートの /llms.txt(サブパスも仕様上は許容、ただし慣習はルート)。
※ 出典: llms.txt 仕様(llmstxt.org)(取得 2026-05)
最小例
# Tufe Company
> Tufe Company は SEO・LLMO・Web 制作・業務自動化を提供する東京・杉並のテック会社。AI 検索時代の集客実装を専門としています。
## サービス
- [SEO & Content](https://tufecompany.co.jp/services/seo-content): 検索流入と AI 引用の両軸を取りに行く編集型 SEO
- [LLMO/GEO](https://tufecompany.co.jp/services/llmo-geo): ChatGPT/Perplexity/Gemini 引用最適化
- [Web 制作](https://tufecompany.co.jp/services/web-production): Next.js / WordPress / Shopify
- [業務自動化](https://tufecompany.co.jp/services/ai-automation): n8n / Dify / Claude による自動化
## ガイド
- [LLMO/GEO 完全ガイド](https://tufecompany.co.jp/guides/llmo-complete-2026)
- [構造化データ完全ガイド](https://tufecompany.co.jp/guides/structured-data-complete-2026)
- [llms.txt と AI Search 完全ガイド](https://tufecompany.co.jp/guides/llms-txt-ai-search-complete-2026)
## 会社情報
- [会社概要](https://tufecompany.co.jp/company)
- [お問い合わせ](https://tufecompany.co.jp/contact)
- 所在地: 東京都杉並区
- 連絡: Web フォーム経由
- 更新日: 2026-05-24
llms.txt と llms-full.txt の関係
公式仕様の補足として、/llms-full.txt という拡張慣習があります。これは「llms.txt がサイトマップ的な短いインデックスなのに対し、llms-full.txt は主要コンテンツの全文を Markdown で連結した版」という位置付けで、Anthropic ドキュメントなど一部の大規模技術ドキュメントサイトで採用例があります。
/llms.txt— サイトマップ的な短いリンク集(数 KB 程度)/llms-full.txt— 主要コンテンツの全文連結(数百 KB 〜数 MB)
中小企業のコーポレートサイトであれば、まず /llms.txt のみで十分です。情報量が多い大規模サイト・ドキュメントサイトでは /llms-full.txt を追加するか検討します。
設置方法(Next.js / WordPress / 静的サイト)
Next.js App Router の場合
// app/llms.txt/route.ts
export const dynamic = 'force-static';
export async function GET() {
const body = `# Tufe Company
> Tufe Company は SEO・LLMO・Web 制作・業務自動化を提供する東京・杉並のテック会社。
## サービス
- [SEO & Content](https://tufecompany.co.jp/services/seo-content)
- [LLMO/GEO](https://tufecompany.co.jp/services/llmo-geo)
## ガイド
- [LLMO/GEO 完全ガイド](https://tufecompany.co.jp/guides/llmo-complete-2026)
`;
return new Response(body, {
headers: { 'Content-Type': 'text/plain; charset=utf-8' },
});
}
WordPress の場合
wp-content/themes/<your-theme>/ 直下に llms.txt を置き、.htaccess でルートにリライトするか、テーマの functions.php で init フックから 200 応答を返す方法が一般的です。
静的サイト(Hugo / Astro / Eleventy 等)の場合
public/llms.txt または static/llms.txt に置くだけで、ビルド時にルート配信されます。
業種別 llms.txt テンプレ 5 種
訪問者価値ブロック 1。コピペで使える業種別テンプレを 5 種類用意しました(士業 / EC / SaaS / 店舗 / メディア)。プレースホルダ({} で囲んだ部分)を自社情報に置き換えて使ってください。
テンプレ 1: 士業(税理士・弁護士・社労士)
# {事務所名}
> {事務所名} は {地域} を拠点とする {士業種別}。{得意分野1} と {得意分野2} を専門領域とし、{年数} 年以上の実績があります。
## 提供サービス
- [{サービス1}](https://{domain}/services/{slug1}): {一文説明}
- [{サービス2}](https://{domain}/services/{slug2}): {一文説明}
- [{サービス3}](https://{domain}/services/{slug3}): {一文説明}
## よくある質問
- [初回相談は無料ですか](https://{domain}/faq/initial-consultation)
- [報酬体系について](https://{domain}/fees)
- [対応エリア](https://{domain}/service-area)
## 事務所情報
- [事務所概要](https://{domain}/about)
- [代表プロフィール](https://{domain}/profile)
- [所在地・アクセス](https://{domain}/access)
- [お問い合わせ](https://{domain}/contact)
## Optional
- [ブログ記事一覧](https://{domain}/blog)
- [採用情報](https://{domain}/recruit)
テンプレ 2: EC(D2C / ブランド)
# {ブランド名}
> {ブランド名} は {商品カテゴリ} を扱う D2C ブランド。{独自性1} と {独自性2} を特徴とし、{設立年} 年から運営しています。
## 商品カテゴリ
- [{カテゴリ1}](https://{domain}/collections/{slug1}): {概要}
- [{カテゴリ2}](https://{domain}/collections/{slug2}): {概要}
- [{カテゴリ3}](https://{domain}/collections/{slug3}): {概要}
## 配送・返品
- [配送ポリシー](https://{domain}/shipping)
- [返品ポリシー](https://{domain}/returns)
- [サイズガイド](https://{domain}/size-guide)
## ブランド情報
- [About](https://{domain}/about)
- [サステナビリティ方針](https://{domain}/sustainability)
- [メディア掲載](https://{domain}/press)
## Optional
- [ブログ・ジャーナル](https://{domain}/journal)
- [リテール店舗一覧](https://{domain}/stores)
テンプレ 3: SaaS
# {プロダクト名}
> {プロダクト名} は {ターゲット} 向けの {プロダクトカテゴリ}。{コア機能} を {独自性} で提供します。
## プロダクト
- [機能一覧](https://{domain}/features)
- [料金プラン](https://{domain}/pricing)
- [API ドキュメント](https://{domain}/docs/api)
- [統合(Integrations)](https://{domain}/integrations)
## ドキュメント
- [Getting Started](https://{domain}/docs/getting-started)
- [チュートリアル](https://{domain}/docs/tutorials)
- [リリースノート](https://{domain}/changelog)
## 会社情報
- [About](https://{domain}/about)
- [採用](https://{domain}/careers)
- [セキュリティ・コンプライアンス](https://{domain}/security)
- [お問い合わせ](https://{domain}/contact)
## Optional
- [導入事例](https://{domain}/customers)
- [ブログ](https://{domain}/blog)
テンプレ 4: 店舗(歯科・美容・飲食・整骨院)
# {店舗名}
> {店舗名} は {住所市区町村} の {業種}。{独自性} を強みに、{営業年数} 年営業しています。
## サービスメニュー
- [{メニュー1}](https://{domain}/menu/{slug1}): {一文}
- [{メニュー2}](https://{domain}/menu/{slug2}): {一文}
- [{メニュー3}](https://{domain}/menu/{slug3}): {一文}
## 店舗情報
- 所在地: {住所}
- 電話: {電話番号}
- 営業時間: {営業時間}
- 定休日: {定休日}
- [アクセス](https://{domain}/access)
- [予約](https://{domain}/reservation)
## よくある質問
- [初診の方へ](https://{domain}/first-visit)
- [料金について](https://{domain}/fees)
- [予約方法](https://{domain}/booking-guide)
## Optional
- [スタッフ紹介](https://{domain}/staff)
- [症例ブログ](https://{domain}/blog)
テンプレ 5: メディア・ブログ
# {メディア名}
> {メディア名} は {ターゲット読者} 向けの {テーマ領域} メディア。{設立年} 年から {記事数} 本以上の記事を公開しています。
## 主要カテゴリ
- [{カテゴリ1}](https://{domain}/category/{slug1}): {概要}
- [{カテゴリ2}](https://{domain}/category/{slug2}): {概要}
- [{カテゴリ3}](https://{domain}/category/{slug3}): {概要}
## 人気記事
- [{記事タイトル1}](https://{domain}/articles/{slug1})
- [{記事タイトル2}](https://{domain}/articles/{slug2})
- [{記事タイトル3}](https://{domain}/articles/{slug3})
## メディア情報
- [編集方針](https://{domain}/editorial-policy)
- [運営会社](https://{domain}/company)
- [編集部紹介](https://{domain}/team)
- [お問い合わせ](https://{domain}/contact)
## Optional
- [広告掲載について](https://{domain}/advertise)
- [寄稿募集](https://{domain}/contribute)
Tufe Company の現場メモ
llms.txt は「置けば終わり」ではありません。llms.txt を置くだけでは引用されない。主要ページの冒頭結論型と FAQ schema もセットで直す という前提が抜けると、設置工数だけが残って効果が出ません。Tufe Company が新規案件で実装するときも、llms.txt 設置・冒頭結論書き直し・FAQPage schema 整備の 3 点をまとめて 1 セットで動かします。詳細は次章以降で扱います。
無料の生成補助として、llms.txt ジェネレーター(無料) で基本版を即生成できます。完成版(業種別カスタマイズ + JSON-LD + robots.txt セット)が欲しい場合は AI 検索統合パック ¥2,980 で提供しています。
Chapter 3: コンテンツ構造で引用率を上げる
AI が抜粋しやすい構造の三原則
AI Search のクローラーは、Web ページから「短く・意味的に完結し・引用しても文脈が崩れない」断片を切り出して回答に組み込みます。引用率を上げるには次の三原則に従ってコンテンツ構造を設計します。
- 冒頭結論型 — 各ページ・各章の冒頭 150-200 字で結論を言い切る
- チャンク化 — 1 トピック = 1 セクション、見出しで完結。長すぎる段落を作らない
- H2 階層の論理性 — H1 / H2 / H3 が概念階層を反映、見出しテキストだけで内容が推測できる
冒頭結論型の良い例・悪い例
悪い例:
QUOTE
デジタル時代の到来により私たちのビジネス環境は大きく変化しました。検索エンジン最適化、いわゆる SEO の世界も例外ではなく、AI 技術の進化とともに新たな概念が次々と登場しています。本記事ではそうした最新動向について…
良い例:
QUOTE
llms.txt とは、サイトルートに設置する Markdown 形式のテキストファイルで、AI クローラーや LLM に対してサイト要約と主要 URL を提供する仕様です。2024 年 9 月 3 日に Jeremy Howard が llmstxt.org で提案し、必須セクションは H1 のサイト名のみです。
良い例は「llms.txt とは何か」「いつ誰が提案したか」「最小要件は何か」を最初の 100 字で言い切っているため、AI が抜粋して引用してもそのまま意味が通ります。
チャンク化の指針
- 1 セクション 200-500 字を目安に、見出しごとに完結させる
- 1 段落は最大 4-5 行(PC 表示で)
- 箇条書きで列挙できる情報は箇条書きにする
- 数値・固有名詞・年次を必ず含める(AI は具体性の高い断片を選好する傾向)
H2 階層の論理性
見出しだけを目次として抜き出したときに、ページ全体の構造が理解できるかが基準です。第1章 はじめに 第2章 本論 第3章 まとめ のような無内容な見出しではなく、Chapter 2: llms.txt 仕様と書き方(llmstxt.org 準拠) のように 見出しテキスト自体が情報 になっている状態を目指します。
よく効くマイクロ施策
- 各セクション冒頭に「結論ボックス」を置く(結論: のような prefix を付ける)
- 用語初出時に glossary リンク を貼って語彙ネットワークを形成
- 出典脚注を ±5 行以内に置く(鉄則 #2)
- 表で比較可能な情報は必ず表にする(AI は表形式を構造的に抜粋しやすい)
Chapter 4: 構造化データとの併用
llms.txt と構造化データは補完関係
構造化データ(JSON-LD / schema.org)と llms.txt は競合せず、補完関係にあります。役割分担は次の通りです。
| 仕組み | 役割 | 配置 | 形式 |
|---|---|---|---|
| llms.txt | サイト全体のマップを Markdown で提供 | /llms.txt(サイトルート) | Markdown |
| JSON-LD 構造化データ | 各ページのエンティティ情報を機械可読化 | 各ページの <script type="application/ld+json"> | JSON-LD |
| robots.txt | クローラー許可・拒否ポリシー | /robots.txt | テキスト |
| sitemap.xml | 全 URL の網羅的リスト | /sitemap.xml | XML |
AI 検索エンジンは複数のシグナルを統合して引用判断するため、4 種すべてを整える のが 2026 年の標準です。
必須 schema 6 種
AI 引用獲得に効く主要 schema を 6 種に整理しました。詳細は 構造化データ完全ガイド を併読してください。
| schema | 役割 | 該当ページ |
|---|---|---|
| Organization | 会社情報のエンティティ化 | 全ページ共通 |
| WebSite + SearchAction | サイトとサイト内検索 | 全ページ共通 |
| BreadcrumbList | パンくず階層 | 全ページ共通 |
| Article | 記事メタデータ(著者・日付・wordCount) | 記事・ガイド |
| FAQPage | Q&A の構造化(AI 引用用途) | FAQ ページ |
| LocalBusiness | 店舗・拠点エンティティ | 店舗ページ |
Article schema に必ず入れる項目
AI 検索からの引用率を観測すると、次の 3 項目の有無で差が出やすいことが当社内部実測で確認できています。
reviewedBy(レビューアの Person/Organization)wordCount(記事本文字数の整数)dateModified(更新日 ISO 8601)
※ Tufe Company 内部実測 / 2026-05時点
robots.txt で AI ボットを許可する
llms.txt と構造化データを整えても、AI クローラーが robots.txt でブロックされていれば意味がありません。2026 年時点で許可すべき主要 AI ボットは次の通りです。
| ボット | 所属 | 用途 |
|---|---|---|
| GPTBot | OpenAI | 学習 |
| ChatGPT-User | OpenAI | 検索時のユーザー駆動取得 |
| OAI-SearchBot | OpenAI | ChatGPT Search のインデックス |
| ClaudeBot | Anthropic | 学習・検索 |
| anthropic-ai | Anthropic | 代替識別子 |
| PerplexityBot | Perplexity | Perplexity の検索クロール |
| Perplexity-User | Perplexity | ユーザー駆動取得 |
| Google-Extended | Gemini / AI Overview の学習許可 | |
| Applebot-Extended | Apple | Apple Intelligence の学習許可 |
User-agent: *
Allow: /
Disallow: /api/
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Google-Extended
Allow: /
Sitemap: https://example.com/sitemap.xml
※ 出典: OpenAI「Overview of OpenAI Crawlers」(取得 2026-05) / Anthropic Help「Does Anthropic crawl data from the web」(取得 2026-05)
Google-Extended を Disallow にすると Gemini / AI Overview の学習対象から外れます。学習許可と検索表示は別ですが、AI 引用獲得を目的とするなら原則許可がデフォルトです。
Chapter 5: 引用されやすい文章スタイル
引用される文章には共通点がある
ChatGPT・Perplexity・Gemini の回答画面で引用元として表示されている記事を 100 本以上ファクトチェックして共通していたのは、次の 6 点です。
- 一次データを持っている — 業界調査・自社実測値・行政統計を一次で引用
- 固有名詞が多い — 会社名・製品名・人名・年号・地名・バージョン番号が具体
- 出典明示 — 数字には ±5 行以内に出典脚注(信頼性シグナル)
- 定義先出し — 「○○ とは〜」形式で用語定義から入る
- 比較表が豊富 — 「A と B の違い」を表で整理
- 更新日が明示 — 公開日と更新日の両方が記載
一次データの作り方(規模を問わず)
「自社に一次データなんて無い」と考える企業ほど、実は手元に貴重な一次データを眠らせています。
- 業務記録から指標化: クライアント案件のリードタイム・対応件数・更新頻度
- アンケート / 調査: 自社チャネル(メルマガ・SNS)で 100 件規模の調査でも一次データになる
- 業界経験の数値化: 「過去 5 年で 300 件以上の○○案件を扱った当社の経験では…」のような語り
- 自社製品の利用データ: ツール提供企業なら使われ方の集計
注意点として、自社データを出すときは必ず ※ Tufe Company 内部実測 / YYYY-MM時点 のような注釈を ±5 行以内に置きます。曖昧な「弊社調べ」「Tufe 調べ」のような逃げは禁止です(これは Tufe Company の社内ガードレール)。
固有名詞と年号の効用
「ChatGPT の 週間アクティブユーザーは 9億人(2026年2月時点、Search Engine Land)」のように、製品名・数字・年月・出典が一文に詰まっている文章は、AI が「事実性が高い」と判断して引用候補に上がりやすい傾向があります。逆に「AI ユーザーは大幅に増えています」のような曖昧な文章は引用されません。
「○○ とは〜」形式の威力
Featured Snippet 時代から続く古典的な書き方ですが、AI 検索時代に再び価値が上がっています。AI は「○○ とは何か」という定義型クエリへの回答として、まさに「○○ とは〜です」という構文の文を優先抽出する傾向があるためです。
## llms.txt とは
**llms.txt** とは、サイトルートに設置する Markdown 形式のテキストファイルで、AI クローラーや LLM に対してサイト要約と主要 URL を提供する仕様です。
このような定義文をページ冒頭または該当章の冒頭に置くだけで、引用候補の構造的優先度が上がります。
出典明示の編集ルール
数字を出すたびに ±5 行以内に出典を置く運用は、人間読者の信頼性向上だけでなく AI 検索エンジンに対する権威性シグナルとしても機能します。Tufe Company が採用するフォーマットは次の通りです。
ChatGPT の週間アクティブユーザーは 9億人規模(2026年2月時点)に達しました。
※ 出典: [Search Engine Land「OpenAI: ChatGPT now has 900 million weekly active users」](https://searchengineland.com/chatgpt-900-million-weekly-active-users-470492)(取得 2026-05)
採用ソースの優先順位: 政府統計 > 業界団体公式 > 主要調査会社 > 事業者公表。Wikipedia・個人ブログ・出典なしの他社記事は採用しません(信頼性監査で必ず弾かれます)。
Chapter 6: ChatGPT検索の挙動
ChatGPT Search の基本動作
ChatGPT Search は OpenAI が ChatGPT に統合した Web 検索機能で、2024 年 10 月に一般公開され、2025 年以降全プランで利用可能になりました。検索が必要と判断したクエリに対して、Bing 検索 API を中心に Web 検索を実行し、結果を要約して引用付きで提示します。
※ 出典: OpenAI「Introducing ChatGPT search」(取得 2026-05)
引用枠の挙動
ChatGPT Search の回答は次の構造を取ります。
- 本文要約(複数段落)
- 各段落に脚注リンク(番号 or サイト名)
- 右サイドバーに引用元サイト一覧
- 「Search Results」展開で全引用元のリストアップ
引用枠に表示されるのは多くの場合 3-8 サイト で、競合の多いクエリほど引用枠の獲得難度が上がります。
ChatGPT に拾われやすくする実装
OAI-SearchBotを robots.txt で許可(必須)- llms.txt 設置(推奨)
- Organization schema + sameAs で会社エンティティを明確化
- 各記事に Article schema(author / dateModified / wordCount)
- 冒頭結論型 + 固有名詞 + 出典明示の文章
ChatGPT が嫌う構造
- ログイン必須コンテンツ(クロール不可)
- 重い JavaScript レンダリングのみで本文が見えない SPA
- meta robots
noindex指定 - robots.txt で
OAI-SearchBotを拒否
ChatGPT Search 経由のトラフィックを測る
ChatGPT Search からの流入は GA4 の「リファラー」ディメンションで chat.openai.com / chatgpt.com として観測できます(一部は Direct に分類されます)。月次の推移を追えば、自社が ChatGPT Search で引用露出を取れているかの感覚値が掴めます。
Chapter 7: Perplexity / Gemini 別最適化
Perplexity
Perplexity は引用ベースの AI 検索エンジンとして 2022 年末にローンチし、Backlinko によれば 2025 年下半期時点の月間アクティブユーザーは約 4,500 万人規模です。検索エンジンとしての性格が ChatGPT Search よりさらに強く、回答に複数の引用カード(サイト名・タイトル・サムネイル)を並べる UI が特徴です。
※ 出典: Backlinko「Perplexity AI Statistics」(取得 2026-05)
Perplexity に拾われやすくする実装:
PerplexityBot/Perplexity-Userを robots.txt で許可- Article schema を全記事に
- 公開日 / 更新日を本文にも表示(schema だけでなく可視テキストで)
- 冒頭 200 字で結論を言い切る
- 比較表・チェックリストを多用(Perplexity は構造化情報の抜粋を好む)
Perplexity からの流入計測:
GA4 リファラーで perplexity.ai として観測可能。流入量自体は ChatGPT 経由より少ない傾向ですが、引用露出によるブランド認知効果は大きいことが当社の観察結果です(Tufe Company 内部実測 / 2026-05時点)。
Google Gemini / AI Overview
Google Gemini と AI Overview は、Google の検索インデックスとクロール基盤を共有しています。Googlebot がインデックスしている前提で、Google-Extended の許可・拒否が「Gemini と AI Overview の学習対象になるか」を決めます。
Gemini / AI Overview に拾われやすくする実装:
- 既存 SEO のベストプラクティス(被リンク・E-E-A-T・コアウェブバイタル)が前提
Google-Extendedを robots.txt で許可- 構造化データ(Article / FAQPage / Organization)を完全実装
- Search Console で「拡張」レポートのエラー / 警告をゼロに
- 質問形式の見出し(H2: 「llms.txt とは何ですか?」)が AI Overview に拾われやすい
AI Overview 表示の測り方:
Search Console 単体では AI Overview の表示有無を直接把握できませんが、Semrush / Ahrefs / Surfer の AI Overview トラッキング機能でクエリ別の表示有無を追跡できます。日本国内のクエリは表示率がまだ限定的なので、英語クエリよりも観測難度は高めです。
三者比較
ユーザー規模の出典: Search Engine Land「OpenAI: ChatGPT now has 900 million weekly active users」(取得 2026-05) / Backlinko「Perplexity AI Statistics」(取得 2026-05)。
| ChatGPT Search | Perplexity | Gemini / AI Overview | |
|---|---|---|---|
| ユーザー規模 | 9億 WAU(2026年2月) | 4,500万 MAU(2025年下半期) | Google 全体に統合(規模公表なし) |
| 主要検索API | Bing | 独自 + Bing | Google 自社 |
| ボット名 | OAI-SearchBot / ChatGPT-User | PerplexityBot / Perplexity-User | Googlebot + Google-Extended |
| 引用枠数(目安) | 3-8 | 5-15 | 1-3 |
| 構造化データ依存度 | 中 | 中-高 | 高 |
| 計測の容易さ | リファラー一部観測可 | リファラー観測可 | 表示有無は外部ツール必要 |
Chapter 8: 計測方法
計測が難しいことを受け入れる
AI 検索からの「引用露出」と「流入」を完全な数値で追跡するのは、2026 年時点でも困難です。Search Console のような統一ダッシュボードが AI 検索側に存在せず、各社のリファラー扱いも不安定なためです。それでも次の 4 つの軸で 間接的に追跡 することが可能です。
軸 1: リファラー追跡(GA4)
GA4 の traffic_source / referrer ディメンションで以下のドメインを観測します。
chat.openai.com/chatgpt.com— ChatGPTperplexity.ai— Perplexitygemini.google.com— Gemini
ChatGPT は Direct に分類されるケースも多く、過小評価される傾向があります。Perplexity は比較的素直にリファラーが残ります。
軸 2: サーバーログ分析
NGINX / Cloudflare のアクセスログから AI クローラーの User-Agent を抽出すると、どの記事がどのくらい AI ボットに読まれているか が観測できます。
# サンプル: NGINX アクセスログから AI ボットを抽出
grep -E "(GPTBot|ClaudeBot|PerplexityBot|OAI-SearchBot|Google-Extended)" /var/log/nginx/access.log \
| awk '{print $1, $7, $12}' \
| sort | uniq -c | sort -rn | head -50
このログ集計で「特定の記事が PerplexityBot に頻繁にクロールされている」と分かれば、その記事が Perplexity の引用候補に入っている強いシグナルになります。
軸 3: 手動引用確認
主要キーワード(自社ブランド名 + サービス名)で月次に ChatGPT / Perplexity / Gemini を手動検索し、引用枠に自社が表示されるかをスプレッドシートに記録します。地味ですが、AI 検索時代の SEO チームには必須業務になりつつあります。
| 月 | KW | ChatGPT 引用 | Perplexity 引用 | Gemini 引用 | 備考 |
|---|---|---|---|---|---|
| 2026-05 | 杉並 MEO | ○ | ○ | × | Tufe 1位引用 |
| 2026-05 | llms.txt 書き方 | ○ | △(他サイトの方が上位) | × | 本ガイド設置直後 |
軸 4: ブランド指名検索の推移
Search Console で会社名・サービス名の指名検索クエリの推移を追います。AI 検索で引用露出が増えると、その後に Google での指名検索が増える「引用 → 指名検索」の遅延相関が観察できます(Tufe Company 内部実測 / 2026-05時点)。
AI 引用追跡ツール(外部)
2026 年時点で実用に堪える AI 引用追跡ツール:
- Profound — AI 検索引用追跡の老舗
- Otterly.AI — Bing Chat / Perplexity 引用追跡
- AthenaHQ — マルチ AI 検索エンジン引用追跡
- Semrush AI Toolkit — Semrush の AI 検索可視性機能
いずれも英語クエリ中心の設計で日本語クエリのカバー範囲は限定的です。自社で軸 1-4 を回した方が、今は安く済むことが多いです。
Chapter 9: よくある失敗 10 パターン
引用されない記事には共通する失敗があります。再現性の高いチェック用に 10 個に集約しました。
- 冒頭が修辞文で結論が無い — 「デジタル時代の到来により…」型のリード文では AI が抜粋する単位を作れません。冒頭 150 字で結論を言い切ります。
- llms.txt が無い、または H1 が無い — H1 だけは公式仕様で必須。
# 会社名の 1 行を忘れて空ファイルになっている事故が多発します。 - robots.txt で AI ボットを拒否している —
User-agent: *Disallow: /の全拒否設定をそのまま放置しているサイトが今もあります。最低限GPTBot/ClaudeBot/PerplexityBot/Google-Extendedは許可します。 - 構造化データの未実装または
@contextが http —http://schema.orgは古い表記。https://schema.orgに統一します。Article schema のauthorを文字列で書く誤りも多く見られます。 - 数字に出典が無い — 「Map Pack の CTR は 20-30%」のような出典なき俗説を残すと AI に引用されないだけでなく、信頼性監査で弾かれます。実証値は約 17.6%(Backlinko)。
- 古い数字をそのまま使う — ChatGPT WAU の古い値(数百万・数千万規模)、GPT-4o 価格の古値($5/$20 → 実際は $2.50/$10)、Shopify Plus 月額($2,000 → 実際は $2,300)等は最新値に更新します。
- JavaScript レンダリング依存で本文が見えない — Next.js の CSR 専用ページや SPA で本文が JS 後にしか描画されない構造は AI クローラーに本文が届きません。SSR / SSG / ISR で本文を HTML に焼き込みます。
- dateModified を更新時に書き換え忘れる — 記事をリライトしても
dateModifiedが古いままだと「鮮度」シグナルが上がらず引用率に悪影響。リライト時の更新フローに自動書き換えを組み込みます。 - 「弊社調べ」「業界標準的に」のような曖昧な逃げ — AI も人間も信用しません。
※ Tufe Company 内部実測 / 2026-05時点のように具体注釈にします。 - llms.txt を置いて満足し、リンク先ページが整っていない — llms.txt は入口に過ぎません。リンク先の構造化データ・冒頭結論・FAQPage が揃って初めて引用されます。
※ Map Pack CTR の参考: Backlinko「Google Local Pack & Maps Click-Through Rate」(取得 2026-05)
Chapter 10: Tufe Company の支援領域
ここまで自社で実装できるなら、本章は読み飛ばして構いません。手を動かす時間が無い・既存サイトに穴があるか棚卸ししたい、という場合の窓口だけ用意します。
段階別の選択肢
| フェーズ | Tufe Company の打ち手 | 価格・形態 |
|---|---|---|
| 現状把握 | AI Search Health Check(llms.txt + 構造化データ + robots.txt + コンテンツ構造を 5 軸でスコア化、書面で改善方針書を提示) | ¥14,800(単発) |
| 自分で書く | llms.txt ジェネレーター(無料) / LLMO 無料診断 | 無料 |
| 一括導入 | AI 検索統合パック(llms.txt + JSON-LD + robots.txt 完成版) | ¥2,980(単発) |
| 継続支援 | LLMO/GEO サービス / SEO & Content | 月次契約(要見積) |
| 個別相談 | 無料相談(45 分・オンライン・契約前提ではない) | 無料 |
AI Search Health Check は、当社が現場で繰り返し見つけている「llms.txt 未設置」「robots.txt で AI ボット全拒否」「Article schema の dateModified 抜け」「冒頭結論が無い」のような典型的な引用阻害要因を、書面で具体に指摘するレポートサービスです。45 分の口頭ヒアリング前に、まず書面で現状を可視化したい企業に選ばれています。
「いきなりサービスを契約する」必要はありません。まず llms.txt ジェネレーター で基本版を作る → LLMO 無料診断 で 5 軸スコアを取る → 必要なら AI Search Health Check ¥14,800 で書面レポートに進む、という順番で十分です。
llms.txt 引用最適化 30 項目チェックリスト
公開前 / 改修前に必ず通すブックマーク用チェックリストです。
llms.txt(5 項目)
-
/llms.txtがサイトルートに配置されている -
# 会社名の H1 がある(必須) - 1-2 文の
> blockquote要約がある - 主要サービス・主要ガイド・会社情報の
## H2セクションがある - 更新日が記載されている
robots.txt(5 項目)
-
GPTBotがAllow -
OAI-SearchBotがAllow -
ClaudeBotがAllow -
PerplexityBotがAllow -
Google-ExtendedがAllow
構造化データ(8 項目)
- 全ページに
OrganizationJSON-LD - 全ページに
WebSiteJSON-LD - 全ページに
BreadcrumbListJSON-LD - 記事ページに
ArticleJSON-LD -
Article.authorが Person または Organization オブジェクト -
Article.dateModifiedが記事更新時に自動書き換え -
Article.wordCountが整数で入っている - FAQ ページに
FAQPageJSON-LD(AI 引用用途で残す)
コンテンツ構造(7 項目)
- 冒頭 150-200 字で結論を言い切っている
- H2 / H3 階層が論理的(見出しテキストだけで内容が推測可)
- 1 セクション 200-500 字でチャンク化されている
- 用語初出に glossary 内部リンク
- 数値ごとに ±5 行以内に出典脚注
- 比較情報は表で構造化
- FAQ セクションが Q&A 形式で存在
計測(5 項目)
- GA4 リファラーで
perplexity.aichatgpt.comを確認できる - サーバーログから AI ボットの User-Agent を抽出する仕組み
- 主要 KW で月次に ChatGPT / Perplexity / Gemini 引用を手動確認
- Search Console の指名検索クエリ推移をモニタ
-
dateModified自動更新が CI / CMS で配線済み
公的・一次情報リソース集
実装中に必ず参照したい一次情報を集約しました。社内 Slack や Notion に貼って共有してください。
llms.txt 公式
AI クローラー公式仕様
- OpenAI「Overview of OpenAI Crawlers」
- Anthropic「Does Anthropic crawl data from the web」
- Perplexity「PerplexityBot」
- Google「Google-Extended」
- Apple「Applebot-Extended」
Google Search Central(構造化データ / 検索仕様)
業界調査・実証データ
日本国内の調査
まとめ — 5 つの要点
- AI Search 時代の SEO は「上位表示」から「AI 引用露出」へ — AI Overview 表示で CTR は約 58-61% 低下、引用枠の獲得が新 KPI。
- llms.txt は H1 だけ必須、Markdown で書く — Jeremy Howard が 2024 年 9 月 3 日に提案。
/llms.txtに置くだけ。サブパス可。 - llms.txt + 構造化データ + robots.txt + sitemap.xml の 4 点セット — どれか 1 つではなく全てを揃える。
- 冒頭結論型 + 固有名詞 + 出典明示 + 比較表 — 引用される文章の 4 大特徴。
- 計測は不完全でも回す — GA4 リファラー、サーバーログ、手動引用確認、指名検索推移の 4 軸で。
関連ガイド
シリーズの他のガイドも併読してください。
- LLMO/GEO 完全ガイド — AI 検索時代の戦略全体像
- 構造化データ完全ガイド — JSON-LD / schema.org 実装の体系整理
- SEO 完全ガイド — Google SEO 全領域
- MEO 完全ガイド — ローカル検索最適化
関連用語集
- llms.txt / LLMO / GEO / AIO / AEO
- ChatGPT Search / Perplexity / AI Overview / Citation
- 構造化データ / JSON-LD / Schema.org / Article schema / FAQPage / Organization schema
- robots.txt / E-E-A-T / GSC
関連比較
関連業種ページ
llms.txt に関するよくある質問
Q. robots.txt との違いは何ですか?
A. robots.txt は「クローラーにどの URL を許可/拒否するか」を伝えるアクセス制御ファイルで、llms.txt は「サイト全体の概要と主要 URL を AI に要約して伝える」コンテンツガイドファイルです。役割が違うので併用が前提で、どちらかを置けばもう片方が不要になるという関係ではありません。robots.txt はテキスト規約、llms.txt は Markdown という形式面の差もあります。
Q. llms.txt を設置すると AI に引用されやすくなりますか?
A. llms.txt を置いただけで引用率が上がる、という単独効果は 2026 年時点では確認されていません。ChatGPT・Perplexity・Gemini が llms.txt を直接参照する公式仕様も限定的です。それでも設置を推奨するのは、(1) 設置コストがほぼゼロ、(2) 将来仕様変更で参照される可能性、(3) llms.txt を整える過程でサイト構造が整理される副次効果、の 3 点が理由です。本体は構造化データと冒頭結論型コンテンツ側にあります。
Q. llms.txt と llms-full.txt の使い分けは?
A. /llms.txt は「サイトマップ的な短いインデックス」(数 KB 程度、リンク集中心)、/llms-full.txt は「主要コンテンツを Markdown で全文連結した拡張版」(数百 KB〜数 MB)です。中小企業のコーポレートサイトは /llms.txt だけで十分です。Anthropic ドキュメントのような大規模技術ドキュメントサイトでは /llms-full.txt を追加して、LLM が全文をコンテキストに読み込めるように整えるケースがあります。
Q. WordPress で llms.txt はどう設置しますか?
A. 一番手堅いのは wp-content/themes/<your-theme>/ 直下に llms.txt を置き、.htaccess でルート /llms.txt にリライトする方法です。.htaccess を触れない環境では functions.php の init フックで $_SERVER['REQUEST_URI'] を判定し、text/plain で 200 応答を返す PHP ハンドラを書きます。ルート直下に llms.txt を直接アップロードできるホスティングなら、ファイル設置だけで完了します。
Q. ChatGPT 検索と Perplexity で書き方を変えるべきですか?
A. llms.txt 自体の書き方は同一で問題ありません。AI クローラーは共通仕様(llmstxt.org)を参照するため、エンジン別に分けて書く必要はないからです。差別化が必要なのは llms.txt ではなく、リンク先ページの編集軸です。Perplexity は比較表・チェックリストなど構造化された情報を好む傾向、ChatGPT Search は会話的に要約しやすい段落を好む傾向、Gemini / AI Overview は質問形式の H2 を好む傾向があります。リンク先ページでこれらの形式を併用するのが現実解です。
まずは現状把握から
AI 検索引用最適化は「自社でやれる」領域です。Tufe Company に依頼する必要は必ずしもありません。以下は段階別の選択肢です。
- 無料で試す — llms.txt ジェネレーター(無料) で基本テンプレを即生成
- 無料で診る — LLMO 無料診断 で AI 検索適合度を 5 軸 100 点で可視化
- 書面で診る — AI Search Health Check(¥14,800) で llms.txt・構造化データ・robots.txt・コンテンツ構造を 5 軸スコア化 + 改善方針書
- 継続支援が必要なら — LLMO/GEO サービス(月次契約・要見積)
- 個別相談 — 無料相談(45 分・オンライン・契約前提ではない) で実装ロードマップをすり合わせ