2026年版 Qwenの料金体系：全モデルの比較、実際の支払額、コストパフォーマンスの検証

Q: Qwenの100万トークンあたりの料金はいくらですか？

Qwenの最も安価なテキストティアは Qwen-Turbo で、100万トークンあたり入力 $0.05 / 出力 $0.20 です。中位ティアの主力モデル Qwen-Plus は $0.40 / $1.20 となっています。フラッグシップの Qwen3.7-Max は現在、50%のプロモーション割引が適用されており $1.25 / $3.75 です（通常価格は $2.50 / $7.50）。現在のラインナップの全モデルについては、 こちらの料金表全文 をご覧ください。

Q: 2026年もQwenは無料で使えますか？

コンシューマー向けの Qwen Studio チャットアプリは、引き続き登録不要かつ無料で利用可能です。しかし、開発者向けAPIの無料ティアは 2026年4月15日に終了しました 。Alibaba Cloudの新規アカウントには、合計7000万トークン以上の無料トライアル（モデルごとに100万トークン、シンガポールエンドポイントで90日間有効）が提供されているため、完全無制限ではありませんが、試用するための手段は残されています。

Q: Qwenの料金はChatGPTやClaudeと比較してどうですか？

MoE（混合専門家）ティアにおいて、Qwenは劇的に安価です。Qwen3.5-Plusが100万トークンあたり $0.40/$2.40 であるのに対し、Claude Opus 4.6 は $5/$25 と、入力コストで 約9倍の差 があります。実際のベンチマークにおいて、 Artificial Analysis は、Claude Opus 4.6 で全インテリジェンス・インデックスを実行するのに $4,970 かかったのに対し、Qwen3.6 Plus では $483 で済んだと報告しています。最上位の Max ティアではその差が縮まり、Qwen3.7-Max（$1.25/$3.75）は GPT の中位ティアに近い価格設定になっています。注意点として、Qwenモデルはタスクあたりの出力トークン数が多くなる傾向（冗長性）があり、それが実質的な節約額を一部相殺する場合があります。

Q: Qwenの思考モード（thinking mode）とは何ですか？また、どのように課金されますか？

いくつかの Qwen モデル（Qwen3 シリーズ、Qwen-Plus、Qwen-Turbo）は、思考の連鎖（chain-of-thought）による推論を有効にする enable_thinking: true パラメータをサポートしています。思考プロセスとして出力されるトークンは、標準の出力トークンよりも高いレート（通常3-10倍）で課金されます。例えば、 Qwen-Plus では標準出力が $1.20/1M ですが、思考出力は $4.00/1M となります。標準の入力トークンについては、思考モードの有効・無効に関わらず同じレートで課金されます。

Q: Qwenを無料でセルフホストすることは可能ですか？

はい。すべての Qwen3 シリーズモデル（0.6Bから235B-A22Bまで）は Apache 2.0 ライセンスで公開されており、 vLLM や SGLang を通じて自由にセルフホスト可能です。30B-A3B MoE バリアントは、量子化ビルドを用いた M4 MacBook Pro 上で秒間約45トークンで動作し、API費用ゼロでほとんどのコーディングやエージェント業務をカバーできます。変動要素はハードウェアコストのみです。モデルのウェイトは Hugging Face でホストされています。

執筆者

Stevia Putri

レビュー者

Katelin Teen

最終更新 June 4, 2026

専門家による検証済み

要約

Qwen-Turbo（入力 $0.05/1M）は、現存する高性能テキストAPIの中で最も安価なものの一つです。Qwen-Plus（$0.40/1M）は、ほとんどの商用ワークロードにとってコストパフォーマンスのスイートスポットであり、幅広いタスクにおいて Claude Opus 4.6 と同等の品質を保ちつつ、9倍安く利用できます。ただし、最上位の Max ティアになると、Qwen の料金は欧米の最先端モデルの領域に近づくため、「常に安い」という図式はそのラインより下のティアでのみ成立します。2026年4月時点で開発者向けの無料 API ティアは終了しており、現在は 7,000万トークンのオンボーディング・トライアルと、永久無料のコンシューマー向けチャットアプリが提供されています。Qwen3 モデルをセルフホストすることが、依然として実質的なコストの底（トークンあたりゼロ）です。eesel を利用して AI パワーのワークロードを大規模に実行する場合、Qwen がどの部分で競合を下回り、どの部分でそうでないかを理解することが、大きなコスト削減につながります。

全モデルのラインナップを表示するQwen Cloudモデルマーケットプレイス

Qwen とは何か（そしてなぜ他と違うのか）

Qwen（通義千問）は Alibaba Cloud の大規模言語モデルファミリーです。テキスト、ビジョン、オーディオ、コード、翻訳、動画生成、埋め込みなど、145 以上のモデル ID を含む広大なカタログを誇り、すべて Qwen Cloud または Alibaba Cloud Model Studio を通じて一つの API キーでアクセス可能です。

LLM 市場において、Qwen が特異である理由は以下の3点です。

プロプライエタリ（独自の）モデルと並んでオープンウェイトモデルを提供している。 Qwen3 シリーズ全体（0.6B から 235B-A22B）が Apache 2.0 ライセンスで公開されており、Hugging Face で入手可能です。API で料金を支払っているものと同じモデルを、ローカルで、無料で動かすことができます。
中位ティアにおいて MoE アーキテクチャが主流である。 Qwen の競争力のある価格設定の多くは、Mixture-of-Experts (MoE) 設計に由来します。235B-A22B モデルは、トークンごとに 22B パラメータのみをアクティブ化するため、総規模は 235B でありながら、推論コストを 22B の密なモデルと同等に抑えています。
他のプロバイダーが追いつけないほどの処理ボリューム。 Qwen3.6-Plus は、OpenRouter 上で1日に1兆トークン以上を処理した最初のモデルとなりました。これは、開発者の採用がいかに Qwen ファミリーへシフトしているかを示すシグナルです。

Qwen の MoE アーキテクチャがトークンごとに一部のパラメータのみを稼働させ、推論コストを低く抑える仕組み

"The MoE Design: Most MoE models feel like bolt-ons. Qwen 3.5's sparse activation is native - only 4.3% of parameters fire per token. That's how you get trillion-parameter-class performance without trillion-parameter inference costs. The 0.8 RMB/million tokens pricing isn't subsidized; it's structurally earned."
@BoWang87 on X

Qwen API 料金表（2026年版）

価格はすべて米ドル（USD）、国際エンドポイント（Alibaba Cloud Model Studio、ap-southeast-1）での従量課金制です。価格は Qwen Cloud のモデル詳細ページおよび PricePerToken.com（2026年6月3日確認）を参考にしています。

テキスト生成モデル

モデル	入力 $/1M	出力 $/1M	コンテキスト	備考
Qwen3.7-Max	$1.25	$3.75	1M トークン	定価 $2.50/$7.50 の 50% 割引中。2026-05-21 リリース
Qwen3.7-Plus	$0.32–$0.96	$1.28–$3.84	1M トークン	ネイティブ・マルチモーダル。コンテキスト長による段階課金
Qwen3-Max	$1.20	$6.00	262K トークン	エージェント最適化。キャッシュ読込 $0.12/1M
Qwen3.6-Plus	$0.50–$2.00	$3.00–$6.00	1M トークン	ネイティブ・マルチモーダル。コーディング、画像+テキスト対応
Qwen3.6-Flash	$0.25–$1.00	$1.50–$4.00	1M トークン	コスト最適化された Vision-Language モデル
Qwen3-235B-A22B	$0.70	$2.80 / $8.40*	131K トークン	MoE フラッグシップ・オープンモデル。*思考モード時
Qwen3-30B-A3B	$0.20	$0.80 / $2.40*	131K トークン	バランス型 MoE。*思考モード時
Qwen3-8B	$0.18	$0.70 / $2.10*	131K トークン	密な小型モデル。*思考モード時
Qwen-Max	$1.60	$6.40	32K トークン	安定版プロダクション・エイリアス
Qwen-Plus	$0.40	$1.20 / $4.00*	1M トークン	安定版エイリアス。*思考モード時
Qwen-Turbo	$0.05	$0.20 / $0.50*	131K トークン	最安テキストティア。高スループット。*思考モード時
Qwen3.5-0.8B	$0.01	$0.05	-	最安値。マイクロオートメーションタスク用

*enable_thinking: true 設定時の思考モード出力は高いレートで課金されます。

Vision-Language およびマルチモーダルモデル

モデル	入力 $/1M	出力 $/1M	コンテキスト
Qwen3-VL-Plus	$0.20	$1.60	262K トークン

埋め込み（Embedding）モデル

モデル	価格
text-embedding-v3 / text-embedding-v4	$0.07/1M トークン。バッチ処理は $0.035/1M

動画生成モデル

モデル	価格
HappyHorse-1.0 シリーズ (T2V, I2V, R2V, 編集)	$0.112 / 秒
Wan2.7-T2V	$0.10 / 秒

Qwen3.7-Plus および Qwen3.6 シリーズの 価格帯（範囲） は、段階的な入力ブラケットを反映しています。単一のリクエスト内での入力長が長くなるにつれて、100万トークンあたりのコストが上昇します（累積使用量ではありません）。Qwen3.7-Plus の場合、短い入力には $0.32 のレートが適用され、長いコンテキストのリクエストには $0.96 のレートが適用されます。

実際の課金メカニズム

料金表を理解するのは第一歩に過ぎません。実際のワークロードでそれらのレートがどのように組み合わさるかを知ることで、思わぬコストの発生を防げます。

思考モード (Thinking mode)

いくつかの Qwen3 世代モデルは、最終的な回答の前に思考の連鎖（chain-of-thought）をトリガーするオプションの enable_thinking: true パラメータをサポートしています。思考トークンは内部的に生成され、その後に課金されますが、そのレートは通常、標準出力の 3-10倍です。Qwen-Plus では、標準出力が $1.20/1M ですが、思考出力は $4.00/1M かかります。Qwen3-235B-A22B では、思考出力は $2.80 から $8.40/1M に跳ね上がります。

分類、要約、構造化抽出などのほとんどの商用ワークロードにおいて、思考モードはオーバースペックです。推論が不可欠なタスク（複雑なコードレビュー、多段階の計画、数学など）にのみオンにし、それに応じた予算を立ててください。

プロンプトキャッシュ (Prompt caching)

暗黙的なプロンプトキャッシュは、ほとんどの Qwen モデルで自動的に機能します。繰り返されるコンテキストのプレフィックスはキャッシュされ、キャッシュヒットした部分は 標準入力レートの約 20% で課金されます。Qwen-Plus の場合、キャッシュされた部分は $0.40/1M ではなく $0.08/1M になります。

また、Qwen3-Max および Qwen-Plus では明示的なキャッシュ管理も利用可能です。

キャッシュ作成: 約 $0.50/1M（入力レートの 125%）
キャッシュ読込: 約 $0.04/1M（入力レートの 10%）

コミュニティで一貫して指摘されている注意点として、Qwen のキャッシュヒット率は競合他社よりも不安定であるという点があります。ある Reddit ユーザーは4つの AI CLI で同じコードレビュータスクを実行した結果、Qwen は単一のタスクで月間 $30 の割り当ての 23% を消費したと報告しています。一方、Claude や OpenAI の $100 プランでは、同じタスクの消費は 1% 未満でした。彼らの結論はこうです："彼ら（Qwen）は他のモデルプロバイダーほど上手くキャッシュしていないようだ。"

バッチ処理 (Batch processing)

非同期バッチ API は、リアルタイム性を必要としないワークロードに対して、標準レートの約 50% 引き を提供します。Qwen3-Max では、バッチ入力が $1.20 から $0.60/1M に、バッチ出力が $6.00 から $3.00/1M に下がります。ETL パイプライン、大量の分類ジョブ、夜間のレポート生成などには、バッチモードをデフォルトにすべきです。

節約プラン (Savings plans)

Alibaba Cloud は、使用量のコミットメントを通じて最大 47% のコスト削減を可能にする AI Savings Plans を提供しています。また、モデルをまたいで使用できる固定サブスクリプションクレジット「AI Token Plan」もありますが、これに関するコミュニティの評判は賛否両論です（詳細は以下の「実践的な支払額」を参照）。

実践的な支払額の例

カタログスペック上の価格と実際の請求額は異なります。現実のデータに基づいた3つの例を挙げます。

例1：1日1万タスクのコンテンツパイプライン

ChartGen AI は、Qwen 3.5、GPT-5.2、Claude Opus 4.5 を用い、それぞれ約2,000出力トークンを必要とする20のデータ視覚化タスクでベンチマークを行いました。 1日1万タスク実行した場合の経済性は以下の通りです。

モデル	タスクあたりコスト	1日のコスト	月間のコスト
Qwen 3.5-35B-A3B	約 $0.003	約 $30	約 $900
GPT-5.2	約 $0.032	約 $320	約 $9,600
Claude Opus 4.5	約 $0.054	約 $540	約 $16,200

ベンチマークのスコアでは、Qwen が 163/200 だったのに対し、GPT-5.2 は 178/200 でした。つまり、9% の品質差に対して、コストは 10倍の削減となります。

大規模運用時のコスト比較：1日1万タスクにおける Qwen vs GPT vs Claude

ChartGen チームは、マルチエージェントによる相乗効果についても言及しています。

"In ChartGen AI's pipeline, a single dashboard generation invokes the model 5-8 times... At this scale, you can run 10 Qwen 3.5 agents for the price of 1 GPT-5.2 call - and use ensemble voting to exceed any single model's accuracy."
Steven Cen, ChartGen AI [Source]

例2：インテリジェンス・インデックスのインフラテスト

Artificial Analysis は、Qwen3.6 Plus で全インテリジェンス・インデックス・ベンチマークを実行しました。合計コストは以下の通りです。

Qwen3.6 Plus: $483（約1億出力トークン、単価 $0.50/$3.00）
Claude Opus 4.6 (最大精度時): $4,970

インテリジェンススコアの差はわずか2ポイント（インデックス値で Qwen3.6 Plus が 51 に対し、Claude Opus 4.6 は 53）でありながら、コストは 10倍の開きがあります。ただし、Qwen は同等のタスクにおいて競合他社よりも明らかに多くの出力トークンを生成したため、トークン単価が同じであっても、冗長性の低いモデルよりコストが膨らむ点に注意が必要です。

例3：Token Plan の衝撃

Qwen の新しいサブスクリプション型サービス「AI Token Plan」は、ドルをクレジットに変換する仕組みですが、多くの初期ユーザーを混乱させました。2026年5月の Reddit スレッドより：

"I signed up for the $30 plan (which offers 25,000 credits)... in just 4 hours of use [with Qwen 3.6 Plus], [I burned through] approximately 8,000 credits (out of a total of 25,000 credits in the $30 plan)."

ユーザー qu1etus による直接比較は、特に Token Plan に対して厳しいものです。

"qwen3.7-max (using qwen cli - $30 plan): used 23% of my monthly quota. gpt-5.5 xhigh (using codex cli - $100 plan): used <1% of monthly quota. opus 4.7 (using claude code - $100 plan): used <1% of monthly quota. For the cost though, I'm out. They do not appear to cache as well as other model providers and their pricing model is broken."

生の従量課金 API レートは、Token Plan の計算が示唆するよりも優れています。Qwen と Claude や OpenAI を比較する場合は、サブスクリプションプランのティアではなく、100万トークンあたりの API 価格で判断するのが得策です。

Qwen の料金ティア：最適なモデルの選び方

すべてのワークロードに Max ティアが必要なわけではありません。多くの場合、モデルの世代よりもアーキテクチャの選択が重要です。

最安から最高性能までの Qwen API 料金ティア。各ユースケースに適したモデルを紹介

Qwen-Turbo ($0.05/$0.20) - 分類、ルーティング、抽出、および低コストでスループットを必要とするすべてのワークロードに最適です。分間 500万トークンのレートリミットにより、制限に達することなくアグレッシブなバッチパイプラインを処理できます。ある Reddit ユーザーは率直にこう述べています："At seven cents per million tokens, it feels like cheating."（100万トークンで7セントなんて、チートみたいだ。）

Qwen3-30B-A3B ($0.20/$0.80) - バランスの取れた MoE の選択肢です。30B-A3B は推論時に 3B パラメータのみをアクティブ化し、単一の H20 GPU 上で秒間約 137 トークンで動作します。Max ティアの能力を必要としない大部分のコーディングや推論タスクをカバーできます。r/LocalLLaMA でのコンセンサスは、「35B-A3B MoE バリアントは 27B dense モデルよりも15倍速く、コストはごくわずか。ターゲットとするサイズに MoE があるなら常にそれを選ぶべき」というものです。

Qwen-Plus ($0.40/$1.20) - 1M コンテキストを持つ安定したプロダクション・エイリアスです。モデルのアップデートによって変わることのない、予測可能な API ID を必要とする場合に適しています。思考モードは出力 $4.00/1M で利用可能です。

Qwen3.7-Plus ($0.32–$0.96/$1.28–$3.84) - 1M コンテキストとエージェント型コーディング機能を備えたネイティブ・マルチモーダルの選択肢です。テキスト、画像、ツール呼び出しを一つのリクエストに混合するパイプラインに適しています。

Qwen3-Max / Qwen3.7-Max ($1.20–$1.25 / $6.00–$3.75) - 最先端モデルの料金領域に近づいています。コミュニティの調査によれば、Max アーキテクチャ独自のエージェント・パイプライン最適化が特に必要でない限り、重いコーディング作業には $1.50/$7.50 の 480B MoE Coder バリアントの方が理にかなっている場合が多いようです。割引後の Qwen3.7-Max（$1.25）は、中位ティアの GPT-5 料金と競合しますが、この割引はプロモーション用とされています。

2026年の無料ティアの状況

ここは最も誤解されやすい部分です。

無料なもの： Qwen Studio コンシューマー向けチャットアプリ。登録不要、今のところレートリミットも公開されておらず、iOS、Android、macOS、Web でサポートされています。これは廃止されません。Alibaba にとって、コンシューマー向け製品を無料に保つことは強力な商業的インセンティブがあります。

かつて無料だったが、現在は廃止されたもの： API 経由で1日 1,000回（後に100回）のリクエストが可能だった開発者向け OAuth API 無料ティアは、2026年4月15日に終了しました。Qwen Code CLI の1日 2,000回のリクエストが可能だった無料コーディングティアも、ほぼ同時期に廃止されました。コミュニティの反応は素早いものでした：

"ngl i just subscribed to claude. I had qwen make .md files of everything so claude could just pick up from there."
u/ihateroomba, 3 upvotes

ある分析的な Reddit のコメントは、この違いを上手く説明しています：

"It's important to distinguish between two distinct worlds that coexist at Alibaba: The 'Consumer Product' world (Qwen Studio): The app you use on your phone is a finished product. Alibaba has every interest in keeping it free... The 'Developer / API' world: This is where the policy has changed... It's a classic strategy: attract users with the free version, then charge them when it scales."

現在も無料トライアルとして利用可能なもの： 新規の Alibaba Cloud Model Studio アカウントには、Qwen モデル全体で合計 7,000万トークン以上（モデルごとに100万トークン）の無料枠に加え、1,650秒分の動画生成クレジットが付与されます。有効期限は90日間、シンガポールエンドポイント限定です。米国のバージニアエンドポイントには無料枠はありません。

セルフホストによる最低コスト

API 料金表には載っていない数字があります。それは トークンあたり $0.00、つまり自前で推論環境を構築するコストです。

すべての Qwen3 モデル（0.6B から 235B-A22B）は Apache 2.0 のオープンウェイトであり、Hugging Face で入手可能です。@WolframRvnwlf は、M4 MacBook Pro 上で Qwen3-30B-A3B の Unsloth 量子化ビルドをテストしました：

"The 30B-A3B Unsloth quant delivered 82.20% while running locally at ~45 tok/s and with zero API spend... Quantised 30B models now get you ~98% of frontier-class accuracy - at a fraction of the latency, cost, and energy."

vLLM や SGLang が推奨されるセルフホスト用フレームワークであり、Qwen3 のドキュメントには完全なデプロイコマンドが含まれています。機密データを扱うチームや、中国発のクラウドコンプライアンスが問題になる管轄区域で活動するチームにとって、セルフホストはデータレジデンシーの問題を完全に解決する手段でもあります。

トレードオフとして、ハードウェアコストは無視できません。クラウドプロバイダーで単一の H20 GPU ノードを借りると、1時間あたり約 $3–5 かかります。中規模のワークロード（1日数百枚トークン以下）であれば、API を利用する方が専用の計算資源を確保するよりも安上がりでしょう。しかし、大規模運用や、すでに所有している GPU がある場合は、セルフホストがコスト面で勝利することが多いです。

Qwen vs Claude vs GPT：正直な比較

「Qwen は Claude より 9倍安い」という表現は事実ですが、それだけがすべてではありません。

"The API pricing comparison tells the story clearly. Claude Opus 4.6 runs $5 input and $25 output per million tokens. GPT-5.3 Codex runs $1.75 and $14. Qwen 3.5 Plus runs $0.40 and $2.40. That's not a marginal difference. That's a structural shift in who can afford to build with frontier-level AI."
@alex_prompter on X

Artificial Analysis が付け加える重要なニュアンスは、Qwen モデルは競合他社よりもタスクあたりの出力トークン数が多い（冗長である）という点です。Qwen3.5-27B はインテリジェンス・インデックスのベンチマーク完了までに 9,800万出力トークンを使用しましたが、これは MiniMax-M2.5（5,600万）や DeepSeek V3.2（6,100万）よりも大幅に多い数字です。もしワークロードが長い出力を生成するものであれば、このトークンの冗長性が、単価の安さを部分的に相殺してしまいます。

Rishabh Choudhary による Qwen3.6-Plus の LinkedIn 分析は、核心を突いています：

"It scored 78.8 on SWE-bench Verified... Claude Opus 4.5 scored 80.9. That's a 2-point gap. The price gap? Not 2 points. More like 17x... The question isn't whether Chinese models are catching up. They clearly are. The question is whether the remaining quality gaps matter enough to justify paying 17x more. For a lot of use cases, I think the honest answer is becoming no."

本番環境で Qwen を運用している実務家からの警告も無視できません。同じ LinkedIn の投稿へのコメントでは、無料プレビューティアにおける11秒という初回トークン・レイテンシ（待機時間が累積する多段階エージェント・ループでは致命的）や、本番テストで報告された 26% というコード推論ハルシネーション率が指摘されています。「検証レイヤーを追加する必要があり、それによってトークン単価で得た節約分がいくらか失われてしまう」とのことです。

最も人気のある代替案との直接比較については、Claude の料金、Gemini の料金、Mistral AI の料金をご覧ください。

ベンチマークの背景

Qwen Blogより引用された、OpenAI o1、DeepSeek-R1、Grok 3 Beta、Gemini 2.5 Pro、o3-mini に対する Qwen3-235B-A22B のベンチマーク比較

フラッグシップの Qwen3-235B-A22B MoE は、ArenaHard 95.6、AIME'24 85.7、LiveCodeBench 70.7、BFCL 70.8 といった公開ベンチマークにおいて、OpenAI o1、DeepSeek-R1、Gemini 2.5 Pro と直接競合します。100万トークンあたり $0.70/$2.80（標準時）という価格は、同等のスコアを持つこれらのモデルのほとんどを価格で下回っています。オープンウェイトで公開されているため、API に依存することなく自分でダウンロードして実行することも可能です。

オープンソースとしての普及度も際立っています。ML 研究者の Nathan Lambert によれば、Hugging Face のオープンモデル・ダウンロードランキングの上位10位のうち7つを Qwen が占めており、Qwen2.5-7B-Instruct が 5,240万ダウンロード、複数の Qwen3 バリアントがトップ5にランクインしています。このレベルの普及により、コミュニティ製のツール、量子化ビルド、エコシステム統合が充実し、セルフホストのハードルはますます下がっています。

API へのアクセス：開始方法

国際版 API は Alibaba Cloud Model Studio 上で動作します。OpenAI 互換であるため、OpenAI SDK から Qwen への移行は、通常、ベース URL と API キーを書き換えるだけの2行の変更で済みます。

Qwen Cloud の API キー管理インターフェース (出典: Qwen Cloud)

from openai import OpenAI
client = OpenAI(
    base_url="https://[workspace-id].ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1",
    api_key="your-dashscope-api-key"
)

利用可能なリージョンは、東南アジア（メイン）、フランクフルト（2026-03-20より）、香港（2026-03-17より）です。米国のバージニアエンドポイントも利用可能ですが、無料トライアル枠はありません。

レートリミットはほとんどのモデルで 600 RPM / 1M TPM ですが、Qwen-Turbo は 5M TPM とより高く設定されており、バースト性の高い大規模パイプラインに適しています。エンタープライズアカウントはサポートチケットを通じてクォータの増枠を依頼できます。

Qwen を導入しているのは誰か、静観しているのは誰か

開発者の採用は非常に強力です。Hugging Face での圧倒的なダウンロード数や OpenRouter でのトークンボリュームがそれを証明しています。NVIDIA は Qwen 3.5 のローンチ日に公式に支持を表明し、開発者に NeMo での構築を推奨しました。

一方で、エンタープライズ企業の導入状況は少し異なります。ある LinkedIn のコメントが指摘するように：

"For our Fortune 500 / enterprise customers the most used models are: 1. Gemma 2. Mistral 3. GPT-OSS 4. Llama... Some of our forward thinking enterprise customers are starting to use Qwen, but it's not the majority yet."
Andrew Jardine, エンタープライズ AI 部門 [Source]

導入の障壁として挙げられるのは、規制の厳しい業界（金融、医療、政府機関）における中国発の製品に対するコンプライアンス審査、および無料プレビューエンドポイントのレイテンシです。Qwen3 シリーズの有料 API は ISO 27001 認証を取得していますが、多くの企業のセキュリティ審査では、調達前にデータレジデンシーやモデルアクセスのログに関する追加の承認が必要です。セルフホストは、これらの問題の多くを回避する手段となります。

こうしたコンプライアンス上の制約がないチーム（特にスタートアップ、中堅 SaaS 開発者、コストに敏感なエージェント・パイプラインの運用者）にとって、この経済性は極めて魅力的です。

eesel を試してみる

AI を活用したワークロードを大規模に運用しており、トークンコストが重要になる場合は、eesel を検討してみてください。eesel は、Zendesk、Slack、Freshdesk、メール、Shopify など、チームがすでに使用しているツール内に自律型 AI エージェントを直接デプロイします。新しいインターフェースやユーザーごとのサブスクリプションは不要です。タスクごとに支払う形式（チケット解決1件につき $0.40、ブログ記事下書き1件につき $4.00 など）で、支出上限に達するとエージェントは自動的に停止します。この料金モデルにより、トークン数をカウントする手間から解放されます。カード登録不要で、まずは $50 分の無料クレジットから始められます。

よくある質問

Qwenの100万トークンあたりの料金はいくらですか？

Qwenの最も安価なテキストティアは Qwen-Turbo で、100万トークンあたり入力 $0.05 / 出力 $0.20 です。中位ティアの主力モデル Qwen-Plus は $0.40 / $1.20 となっています。フラッグシップの Qwen3.7-Max は現在、50%のプロモーション割引が適用されており $1.25 / $3.75 です（通常価格は $2.50 / $7.50）。現在のラインナップの全モデルについては、こちらの料金表全文をご覧ください。

2026年もQwenは無料で使えますか？

コンシューマー向けの Qwen Studio チャットアプリは、引き続き登録不要かつ無料で利用可能です。しかし、開発者向けAPIの無料ティアは 2026年4月15日に終了しました。Alibaba Cloudの新規アカウントには、合計7000万トークン以上の無料トライアル（モデルごとに100万トークン、シンガポールエンドポイントで90日間有効）が提供されているため、完全無制限ではありませんが、試用するための手段は残されています。

Qwenの料金はChatGPTやClaudeと比較してどうですか？

MoE（混合専門家）ティアにおいて、Qwenは劇的に安価です。Qwen3.5-Plusが100万トークンあたり $0.40/$2.40 であるのに対し、Claude Opus 4.6 は $5/$25 と、入力コストで約9倍の差があります。実際のベンチマークにおいて、Artificial Analysis は、Claude Opus 4.6 で全インテリジェンス・インデックスを実行するのに $4,970 かかったのに対し、Qwen3.6 Plus では $483 で済んだと報告しています。最上位の Max ティアではその差が縮まり、Qwen3.7-Max（$1.25/$3.75）は GPT の中位ティアに近い価格設定になっています。注意点として、Qwenモデルはタスクあたりの出力トークン数が多くなる傾向（冗長性）があり、それが実質的な節約額を一部相殺する場合があります。

Qwenの思考モード（thinking mode）とは何ですか？また、どのように課金されますか？

いくつかの Qwen モデル（Qwen3 シリーズ、Qwen-Plus、Qwen-Turbo）は、思考の連鎖（chain-of-thought）による推論を有効にする enable_thinking: true パラメータをサポートしています。思考プロセスとして出力されるトークンは、標準の出力トークンよりも高いレート（通常3-10倍）で課金されます。例えば、Qwen-Plus では標準出力が $1.20/1M ですが、思考出力は $4.00/1M となります。標準の入力トークンについては、思考モードの有効・無効に関わらず同じレートで課金されます。

Qwenを無料でセルフホストすることは可能ですか？

はい。すべての Qwen3 シリーズモデル（0.6Bから235B-A22Bまで）は Apache 2.0 ライセンスで公開されており、vLLM や SGLang を通じて自由にセルフホスト可能です。30B-A3B MoE バリアントは、量子化ビルドを用いた M4 MacBook Pro 上で秒間約45トークンで動作し、API費用ゼロでほとんどのコーディングやエージェント業務をカバーできます。変動要素はハードウェアコストのみです。モデルのウェイトは Hugging Face でホストされています。

AIチームメイトを採用しよう

数分でセットアップ。クレジットカード不要。

無料で試すデモを予約

Share this article

Article by

Stevia Putri

Stevia Putri is a marketing generalist at eesel AI, where she helps turn powerful AI tools into stories that resonate. She’s driven by curiosity, clarity, and the human side of technology.

2026年版 Qwenの料金体系：全モデルの比較、実際の支払額、コストパフォーマンスの検証

要約

Qwen とは何か（そしてなぜ他と違うのか）