Cohere AIの料金(2026年版):実際のコストを徹底解説
Kira
Katelin Teen
最終更新 June 9, 2026

料金ページを一目見て
数字に入る前に、cohere.com/pricing自体を見てみましょう。3つのタブ(Workplace systems、Generative models、Advanced retrieval models)、Model Vaultのテーブル、レガシー料金が記載されたFAQブロック、リード獲得フォームがあります。
最近このページを訪問した方は、不思議なことに気づいたかもしれません。現在の生成モデルと検索モデルのトークン単価テーブルは、HTMLの「ソースを表示」では表示されません。Sanity CMSを通じてクライアントサイドでレンダリングされるため、スクレイピングツール(およびほとんどのLLMクローラー)は静的な部分だけを取得します:Model Vaultの専用インスタンステーブル、FAQのレガシー/Ayaの注記、エンタープライズ「営業に相談」カード。透明性を売りにするベンダーの公開料金ページとしては奇妙な選択です。残りを取得するためにOpenRouter、AWS Bedrock、Cohereの公式ドキュメント、Wayback Machineのスナップショットを照合しました。この記事はそれを基に作成しています。
価格の概要をひと目で確認:

Cohere APIの料金:モデル別
Cohereのカタログは3つに分けられます:生成系(Commandファミリー)、検索系(EmbedとRerank)、音声(Transcribe)。ほとんどはトークンまたは検索ごとの料金がありますが、一部はありません。
生成系:Commandファミリー
これらはCohereのテキスト生成モデルで、Chatエンドポイントを通じて提供されます。完全な仕様(ステータス、モダリティ、コンテキストウィンドウ、出力上限)はCohereモデルカタログから取得しました。レガシーブロックのトークン単価はCohereの料金FAQから、2024年8月のR/R+更新とCommand AについてはOpenRouterを使用しました。
| モデル | ステータス | コンテキスト | 最大出力 | 入力 $/1M | 出力 $/1M | ソース |
|---|---|---|---|---|---|---|
| Command A+ | 稼働中 | 128k | 64k | 非公開 | 非公開 | Cohere pricing、本番環境 = 営業に問い合わせ |
| Command A Reasoning | 稼働中 | 256k | 32k | 非公開 | 非公開 | Cohere、営業に問い合わせ |
| Command A Translate | 稼働中 | 8k | 8k | 非公開 | 非公開 | Cohere、営業に問い合わせ |
| Command A Vision | 稼働中 | 128k | 8k | 非公開 | 非公開 | Cohere、営業に問い合わせ |
| Command A | 稼働中 | 256k | 8k | $2.50 | $10.00 | OpenRouter |
| Command R+ (08-2024) | 稼働中 | 128k | 4k | $2.50 | $10.00 | Cohere FAQ |
| Command R (08-2024) | 稼働中 | 128k | 4k | $0.15 | $0.60 | OpenRouter |
| Command R7B (12-2024) | 稼働中 | 128k | 4k | $0.0375 | $0.15 | OpenRouter |
| Command(レガシー) | 2025-09-15非推奨 | 4k | 4k | $1.00 | $2.00 | Cohere FAQ |
| Command-light(レガシー) | 2025-09-15非推奨 | 4k | 4k | $0.30 | $0.60 | Cohere FAQ |
| Command R 03-2024 | 2025-09-15非推奨 | 128k | 4k | $0.50 | $1.50 | Cohere FAQ |
| Command R+ 04-2024 | 2025-09-15非推奨 | 128k | 4k | $3.00 | $15.00 | Cohere FAQ |
| Aya Expanse 8B | 稼働中 | 128k | 4k | $0.50 | $1.50 | Cohere FAQ |
| Aya Expanse 32B | 稼働中 | 128k | 4k | $0.50 | $1.50 | Cohere FAQ |
注目すべき点がいくつかあります。第1に、Command R+の実際の価格は下がっています:04-2024のリリース時は$3.00/$15.00でしたが、08-2024の更新で$2.50/$10.00になり、現在もそのままです。元のHacker NewsローンチスレッドはR+を高い価格で固定し、コミュニティはパラメーター数の増加がそれを正当化するかを問い質しました。数ヶ月後の値下げがその答えです。
第2に、Command Aは「同じ料金表の現代版R+」と言えます。同じ$2.50/$10.00ですが、256kのコンテキスト、150%高いスループット、そしてドキュメントによると優れたエージェント性能があります。R+で汎用作業をしていたなら、Aが新しいデフォルトです。
第3に、Command R7Bは本当に安いです。100万トークンあたり$0.0375入力/$0.15出力で、1回のGPTクラスのリクエスト分の費用で大量のサマリー、分類、ルーティングが実行できます。

検索系:EmbedとRerank
ここでCohereの料金設定は本当にその評判に値します。検索スタックはPeerSpotや開発者ブログで称賛される部分のほとんどで、料金もそれを裏付けています。
| モデル | タイプ | コンテキスト | 価格 | ソース |
|---|---|---|---|---|
| Embed v4 | Embeddings(テキスト+画像+PDF) | 128k | $0.12 / 100万入力トークン | AWS Bedrock |
| Embed v3 English | Embeddings | 512 | $7.12/時間(Bedrockのみ Provisioned Throughput) | AWS Bedrock |
| Embed v3 Multilingual | Embeddings | 512 | $7.12/時間(Bedrockのみ Provisioned Throughput) | AWS Bedrock |
| Rerank 4 Pro | Rerank | 32k | $0.0025 / 検索 | OpenRouter |
| Rerank 4 Fast | Rerank | 32k | $0.002 / 検索 | OpenRouter |
| Rerank v3.5 | Rerank | 4k | $0.001 / 検索(OpenRouter)、1,000クエリあたり$2.00(Bedrock) | OpenRouter / AWS Bedrock |
2つの定義を明確にしておきます:
- 「1回の検索」はクエリ1件+最大100ドキュメントです。Cohereの料金FAQより。500トークンを超えるものは自動的に複数のドキュメントに分割され、各チャンクがカウントされます。
- Embed v4はPDFをネイティブに処理できます。これは実際に重要な料金詳細です。他のベンダーでは自分でPDFをチャンクに分割して各チャンクを埋め込む必要があるからです。
推奨:Embed v4 + Rerank v3.5 + Command Rは、Cohereでの「安価で高性能なRAGスタック」の定番です。適度な検索ワークロードでのエンドツーエンドコストは、同等のGPTクラス+OpenAI Embeddingsパイプラインよりも低くなります。品質を重視する場合はRerank 4 ProとCommand Aに切り替えてください。

音声:Cohere Transcribe
Transcribeはcohere-transcribe-03-2026というCohereの音声テキスト変換モデルです。14言語対応、最大ファイルサイズ25MB。分単価は料金ページのライブタブに掲載されており、静的HTMLには表示されないため、誤解を招かずにここで引用することはできません。音声テキスト変換のドキュメントによると、トライアルキーは1分あたり5リクエストに制限されており、本番アクセスはsales@cohere.comから申請する必要があります。
公開料金ページにないもの
これは正直に言う価値がある部分です。すべてのモデルにトークン単価が公開されているAnthropicやOpenAIとの違いです。
以下はCohereのライブ料金ページに掲載されていますが、静的HTMLではレンダリングされず、サードパーティホストでも明確に公開されていません:
- Command A+:CohereのフラッグシップMoEモデル、2026年5月19日にオープンソースとしてリリース。「ソブリン重要インフラ」向けとして販売。公開トークン単価なし。
- Command A Reasoning、Translate、Vision:レート制限ドキュメントによると本番キーはすべて「営業に問い合わせ」。トライアルキーは20リクエスト/分、月1,000コールに制限。
- ファインチューニング料金(トレーニング、ホスティング、サービング)。
- 画像単価:Command A VisionとCommand A+の画像入力。
- バッチAPI割引:記載はあるが具体的な料金なし。
- North-Mini-Code-1.0:レート制限テーブルに表示;トークン単価非公開。
購入者への意味:現在のCohereのフラッグシップをGPT-5.xやClaude Sonnetと$/1Mトークンベースで比較したい場合、営業コールを予約しなければできません。これが問題かどうかは役割によります。調達文書を作成するエンタープライズアーキテクトにとっては摩擦点ですが壁ではありません。1つの午後で5つのLLMプロバイダーを評価する小チームにとっては、Cohereをリストの下に置く十分な理由になります。
Model Vault:専用デプロイメント、正確な料金
Model VaultはCohereの専用インスタンス提供です:共有テナントなしで自分のモデルのみを実行するコンピュートを予約します。これはまた、Cohereの料金ページでHTMLに実際のドル金額が含まれている唯一のブロックでもあるため、直接引用できます。
| モデル | パフォーマンスティア | インスタンスあたりの時間料金 | インスタンスあたりの月額 |
|---|---|---|---|
| Embed 4 | Small | $4.00 | $2,500 |
| Embed 4 | Medium | $5.00 | $3,250 |
| Rerank 3.5 | Medium | $5.00 | $3,250 |
| Rerank 4 Fast | Medium | $5.00 | $3,250 |
| Rerank 4 Pro | Medium | $5.00 | $3,250 |
| Rerank 4 Pro | Large | $10.00 | $6,500 |
注意点:
- 請求は時間単位またはコミットメントベース(月次または年次)が選べます。月額は30×24で約$8.33/時間となるため、コミット月額が時間単位より安くなるのは月の約60〜80%以上稼働する場合のみです。
- 別のSanity CMSデータポイントでは、Compass連携のModel Vault価格としてインスタンスあたり$3.75/時間が記載されており、上記のメインテーブルには表示されていません。Compassがプランにある場合は営業との会話で確認する価値があります。
- Model VaultにはオンデマンドのCommandティアがありません。専用の生成スループットが必要な場合は、カスタムデプロイメントの領域になります。
Model Vaultは特定の購入者に対する答えです:「大規模な検索に予測可能な月次支出が必要で、ワークロードをマルチテナントプールで共有したくない。」典型的なRAGチームが、たとえば1時間あたり500のembedジョブと1分あたり5,000のrerankクエリを実行する場合、Rerank 4 Pro Medium(月$3,250)とEmbed 4 Medium(月$3,250)を組み合わせ、合計約月$6,500をリクエストごとの課金ではなく固定費として支払うことを選ぶでしょう。
NorthとCompass:エンタープライズプラットフォーム
Cohereの料金ページの最初のタブはWorkplace systemsで、料金全体の中で最も不透明な部分です。そこには2つの製品があります:
- North:Cohereのエージェントプラットフォーム。ホームページでは「ソブリンなAIワークプレイス」として紹介。ツールに接続し、ユーザーが自動化を実行でき、インテリジェント検索を含みます。
- Compass:Cohereのエンタープライズ検索・発見システム。事前構築済みのデータコネクター、ドキュメント解析、マネージドインデックスを備えています。
どちらも公開料金はありません。どちらも「カスタムエンタープライズ価格はお問い合わせください」で「デモをリクエスト」CTAがあります。cohere.com/pricing上のリード獲得フォームには、デプロイメント優先度のドロップダウン(AWS、Azure、GCP、OCI、IBM Cloud、Tencent Cloud、Alibaba Cloud、Private Deployment、Cohere Infrastructure (SaaS)、Other)があり、これらの契約がどれほどカスタマイズされる傾向にあるかを示しています。

エンタープライズ購入者との会話や公開リファレンス契約(Fujitsu、Oracle、RBC、Dell、LG CNS、すべてCohereホームページのロゴストリップにあります)に基づくと:複数のステークホルダーが関与する調達サイクル、1年目のコミットメントで最低6桁、専任ソリューションエンジニアリングサポート、そしてカスタムデプロイメント環境が予想されます。データ主権義務があるFortune 500企業なら当然の条件です。チケットをトリアージするAIを望む50人のサポートチームには向いていません。
PeerSpotのレビュアーも同じことを指摘しています:「Cohereは大量処理の顧客向けにエンタープライズ価格を提供しており、月に数十億トークンを処理する場合や専任サポート、SLA、プライベートデプロイが必要な場合は、カスタム価格について営業チームに問い合わせるべきです。」
パートナークラウドでの料金
CohereはすべてのメジャークラウドマーケットプレイスAWS Bedrock、Amazon SageMaker、Microsoft Azure(AI Foundry)、Oracle Cloud Infrastructure、Google Cloud、IBM Cloud、Tencent Cloud、Alibaba Cloudを通じて販売されています。各マーケットプレイスの料金はCohereではなくマーケットプレイスが設定しており、cohere.comと常に同じではありません。
最も驚くべきことは、AWS Bedrockが縮小されたことです。現在のオンデマンドCohereカタログはEmbed 4とRerank 3.5のみで、Command R、R+、Aはオンデマンドリストになくなりました。Bedrock上のCommandファミリーは現在Provisioned Throughputのみとなり、コスト構造が大きく異なります:
| AWS Bedrock:Cohereの項目 | 料金モデル | 価格 |
|---|---|---|
| Embed 4 | 100万入力トークンあたり | $0.12 |
| Rerank 3.5 | 1,000クエリあたり | $2.00 |
| Cohere Command | Provisioned Throughput/時間(コミットなし) | $49.50 |
| Cohere Command | Provisioned Throughput/時間(1ヶ月コミット) | $39.60 |
| Cohere Command | Provisioned Throughput/時間(6ヶ月コミット) | $23.77 |
| Cohere Command-Light | Provisioned Throughput/時間(コミットなし) | $8.56 |
| Cohere Command-Light | Provisioned Throughput/時間(1ヶ月コミット) | $6.85 |
| Embed 3 English | Provisioned Throughput/時間(コミットなし) | $7.12 |
| Embed 3 Multilingual | Provisioned Throughput/時間(コミットなし) | $7.12 |
Cohere Commandのモデルユニットあたり$49.50/時間(コミットなし)は、ユニットあたり月約$29,462になります。PeerSpotの「Oracleのすべてのサービスを使うのは高い」という引用は、別のタブで同じ話をしています:クラウドマーケットプレイスの上乗せこそが予算の驚きが潜む場所です。
Azure AI FoundryはCohere-command-a、Cohere-rerank-v4.0-pro/fast、embed-v-4-0を直接販売していますが、トークン単価はドキュメントページに記載されていません。Oracle OCIの事前学習済みモデルドキュメントはOCIがホストするすべてのCohereモデル(Command A Reasoning、A Vision、A、R+、R、Embed v4+v3バリアント、Rerank 4、Rerank 3.5)を一覧しますが、料金は別の料金ページにあります。
経験則:コストを重視するならCohereのファーストパーティで実行してください。マーケットプレイスはすでにそこにいる場合は便利ですが、上乗せは実在します。
トライアルと本番:細かい注意事項
サインアップ前に知っておく価値のあるメカニズムをいくつか、公式レート制限ドキュメントと料金FAQから:
- トライアルキーは無料ですが、月1,000 APIコールとチャットモデルあたり20リクエスト/分に制限されています。本番や商用利用は明示的に禁止されています。
- 本番キーは従量制で、より高いレート制限があります(Command A、R、R+、R7Bで500リクエスト/分)。
- 新しいモデルバリアント(Command A+、A Reasoning、A Translate、A Vision)では、本番キーがトライアルキーのように機能します。本当の本番アクセスにはsales@cohere.comへ問い合わせる必要があります。見落としやすいです。
- 請求サイクル:毎月末、または残高が**$250**に達した時点のいずれか早い方。
- 請求されるのは
billed_unitsのみで、基礎となるトークン数ではありません。Cohereは内部で追加されるコントロールトークンのコストを負担します。ドキュメントには実際のtokens数が7,596/645だがbilled_unitsが6,772/248の例が示されています。小さいですが実在します。 - アカウントは個人として始まります。チームメンバーと請求を共有するには組織を設定する必要があります。
フラッグシップモデルでのトライアルと本番のゲーティングが摩擦点です。ほとんどのLLMベンダーは初日からセルフサービスキーでGPT-5やClaude Sonnetにアクセスできます。Cohereはそうではなく、モデルをベンチマーク比較している場合、この非対称性が静かにテストを実際に実行できるモデルの方向へ誘導することがあります。
実際のコスト例
具体的に。3つのシナリオ:
シナリオ1:小規模RAGパイプライン(安価でシンプル)
10人の運用チームで、内部「Wikiに聞く」ボットを構築中。インデックス作成1日あたり約500万トークン、1日あたり約50,000の検索クエリ、Command Rで生成。
| 項目 | ボリューム | 料金 | 月額コスト |
|---|---|---|---|
| Embed v4(テキスト) | 500万トークン × 30日 = 1億5000万 | $0.12 / 100万 | $18 |
| Rerank v3.5 | 50,000 × 30 = 150万検索 | $0.001 / 検索 | $1,500 |
| Command R(入力+出力) | 入力2億、出力5000万 | 入力$0.15 / 出力$0.60 | $60 |
| 合計 | 約$1,578/月 |
Rerankが支配的な項目です。クエリあたりtop-100ではなくtop-5のrerankに縮小できれば、この請求額は大幅に下がります。
シナリオ2:中規模サポート自動化(典型的なピッチ)
サポートチームで1日約1,000チケット、Cohereに直接デフレクションボットを構築中。平均チケット = 3,000入力トークン(履歴+KBコンテキスト)+500出力トークン。
| 項目 | ボリューム | 料金 | 月額コスト |
|---|---|---|---|
| Command A(入力) | 1,000 × 3,000 × 30 = 9,000万 | $2.50 / 100万 | $225 |
| Command A(出力) | 1,000 × 500 × 30 = 1,500万 | $10.00 / 100万 | $150 |
| Embed+Rerank(KB検索) | シナリオ1と同様、スケール | 混在 | 約$200 |
| API合計 | 約$575/月 | ||
| 開発者の構築・維持の時間 | 約0.25〜0.5 FTE | 月$10,000〜$20,000(総コスト) | 月$10,000〜$20,000 |
$575のトークン費用は請求書の最も小さな項目です。実際のコストはプロンプトを書くエンジニア、オーケストレーション、リトライ、評価ハーネス、ボットが間違ってエスカレーションした時のオンコールローテーションです。これが…につながります。
シナリオ3:エンタープライズ専用(Model Vault)
500万ドキュメントのコーパス上でRAGを実行しているエンタープライズで、予測可能な検索ボリュームがあります。
| 項目 | ティア | 月額コスト |
|---|---|---|
| Embed 4 Medium | 専用 | $3,250 |
| Rerank 4 Pro Medium | 専用 | $3,250 |
| Command A(トークン単位) | API | 変動 |
| 専用検索の基準 | $6,500/月 |
その上にNorthまたはCompassの契約を追加すると、1年で6桁の範囲になります。FujitsuとOracleのリファレンス契約が指し示すのはそこです。

ユーザーが請求について実際に言っていること
PeerSpotとHacker NewsのCommand R+ローンチスレッドから実際の実践者の声を収集しました。この分布は一貫しており、知る価値があります:
「Cohereには無料ティアがあります…APIを開発モードで使えます。ただし本番に移行すると支払いが必要になります…高くつくことがあります。」 CollinsOmondi、モバイルデベロッパー、PeerSpot料金スレッド
「市場で利用可能なモデルと比較して、Cohereの価格設定、設定コスト、ライセンスはより良いです。」 Shivam Singh、シニアソリューションアーキテクト、PeerSpot料金スレッド
「RAGタスクにCohere Embed English v3.0を使用し、代替品よりも速く、安く、応答性が高いことを発見しました。」 PeerSpotレビュアーの要約
「価格設定、設定コスト、ライセンスに関する私の経験は、Oracleのすべてのサービスを使用するのは高いというものです。」 シニアデータサイエンティスト、PeerSpot料金スレッド
そしてHacker NewsのR+ローンチスレッド(かなり鋭い批評があった)から:
「[Command-R] エージェントがその結果に依存していた時、結果はひどいものでした。」 irthomasthomas、Hacker Newsスレッド
私たちの見解:
- EmbedとRerankの評判は一様に肯定的です。「速く、安く、応答性が高い」は検索コンテキストで繰り返し登場します。これはCohereの最も強力な料金ストーリーですが、マーケティングページでは十分に語られていません。
- Command Rはコストパフォーマンス重視派の居場所です。 35BパラメーターのModel、128kコンテキストで$0.15/$0.60は本当に優れています。
- Command R+は批判を受けています。 HNスレッドはR+をRの6倍の価格ステップで固定し、コミュニティはなぜかと問いました。Simon Willisonの返答は「104Bモデルなので、新しい能力ティアではなくパラメーター数の分を払っている」というものでした。正直な答えですが、出力品質を最優先する購入者には良い答えではありません。
- 本当の「価格ショック」はトークン単価ではなく、TCOです。複数の実践者の書き込みが同じことを言っています:「アプリを構築する開発チーム、モデルを調整するデータサイエンティスト、すべてを管理するITチームが必要です。」
最後の点は、じっくり考える価値があります。
Cohereが適している場合と適していない場合
価格は本当の問いではありません。適合性こそが問いです。Cohereの価格設定は特定の購入者プロフィール向けに設計されており、そのプロフィールに当てはまらない場合、トークン単価が「良い」か「高い」かという問いはポイントを外しています。

Cohereが適しているのは、以下の条件を持つエンタープライズです:
- データ主権の義務(金融サービス、公共部門、医療、防衛、通信)。
- APIレベルで統合できる既存のエンジニアリングチーム:プロンプトを書き、オーケストレーションを構築し、評価を実行できる。
- プライマリワークロードがRAGまたは検索重視。Embed+Rerank+Command Rスタックは、特に多言語コンテンツ(Commandで49言語、ホームページ参照)でコストパフォーマンスの勝者です。
- マルチクラウドまたはオンプレミスの要件。Cohereのデプロイメントストーリー(VPC、オンプレ、Model Vault、パートナークラウド)はこのために設計されています。
Cohereが間違った選択になるのは:
- 統合構築に3ヶ月かかるのではなく、初日から動くものが欲しい小チーム。
- 価値の単位が「処理されたトークン」ではなく「対応済みチケット」や「公開済み投稿」であるサポート、運用、コンテンツチーム。
- セルフサービス型でコストに敏感な場合。フラッグシップ料金が営業コールの裏に隠れているため、したい比較を実際に実行できません。
- Zendesk、Freshdesk、GorgiasなどのヘルプデスクにプラグアンドプレイのAIエージェントを求めている場合。
実際の購入者との会話で私たちが見るほとんどを占める後者のプロフィールにとって、問いは「CohereはトークンあたりでOpenAIより安いか?」ではありません。「統合チームへの支払いなしにAIの価値を得られるか?」です。そしてそれは異なる形の価格設定です。
eeselを試す
ここまで読んでいただき、CohereとすぐIN使えるオルタナティブを比較しているサポート、運用、コンテンツチームの方へ、正直な提案です。
eeselは、すでに使っているツールの中で生きるAIエージェントを提供します:Zendesk、Freshdesk、Gorgias、Slack、Gmail、Shopify、その他100以上。プロンプトのエンジニアリングも、オーケストレーションの構築も、本番キーのための営業コールも不要です。ヘルプデスクを接続し、新入社員にブリーフィングするような簡単な言葉でエージェントを指示すれば、チケット処理を始めます。
価格設定も異なる形です:通常タスクでチケットあたり$0.40、プラットフォーム料金なし、シート単位の料金なし、月次最低利用額なし。月1,000チケットのチームは$400を支払います。月100チケットのチームは$40を支払います。カードが必要になる前に$50の無料クレジット(ブログ生成2回無料)があります。詳細な料金はこちら。

私たちはCohereと同じ製品ではありません:Cohereはモデルを売り、eeselはモデルの上で動くAIチームメンバーを売ります。Fortune 500のソブリンAIスタック向けインフラを提供するのが仕事なら、Cohereが正しい選択です。来週のティア1チケットを効率化するのが仕事なら、eeselをお試しください:オンボーディングは数分で完了し、チケット単価の計算はProvisioned Throughputの項目よりも予算会議で説明しやすいです。
よくある質問
Cohere AIは100万トークンあたりいくらですか?
Cohere AIに無料プランはありますか?
CohereのEmbedとRerankの料金はいくらですか?
Model Vaultはいくらかかりますか?
Cohereのエンタープライズプラットフォームはいくらかかりますか?
Cohere AIはOpenAIやAnthropicより安いですか?
Cohere AIの隠れたコストとは何ですか?
Cohereの料金はどのような企業向けですか?

Article by
Kira
A Computer Science student deeply passionate in the fields of UI/UX Design and Web Development with a knack on writing. Fusing technical expertise with a creative flair, I'm driven to craft innovative and user-centric solutions, leveraging both coding proficiency and design sensibilities to create seamless, impactful experiences.



