Embeddingとは?
Embedding(埋め込み) は、テキスト・画像などを「意味を保持した数値ベクトル」に変換する技術。例えば「犬」と「ワンちゃん」は別の単語だが、Embedding空間では近い位置になります。
代表的な Embeddingモデル
| 提供元 | モデル | 用途 |
|---|---|---|
| OpenAI | text-embedding-3-large | 汎用最強 |
| Cohere | Embed v3 | 多言語特化 |
| text-embedding-004 | 高速 | |
| OSS | multilingual-e5-large | セルフホスト |
どこで使われるか
よくある質問
Q. Embeddingはコストかかる?
OpenAI text-embedding-3-small は $0.02/1M tokens と非常に安価。
Q. 日本語対応は?
主要モデル全て対応。日本語特化なら multilingual-e5 や cl-tohoku/bert-japanese も有効。