2026幎版 Qwenの料金䜓系党モデルの比范、実際の支払額、コストパフォヌマンスの怜蚌

Stevia Putri
執筆者

Stevia Putri

Katelin Teen
レビュヌ者

Katelin Teen

最終曎新 June 4, 2026

専門家による怜蚌枈み
モデルティアずAPIコストを瀺すQwen料金抂芁のむンフォグラフィック

芁玄

Qwen-Turbo入力 $0.05/1Mは、珟存する高性胜テキストAPIの䞭で最も安䟡なものの䞀぀です。Qwen-Plus$0.40/1Mは、ほずんどの商甚ワヌクロヌドにずっおコストパフォヌマンスのスむヌトスポットであり、幅広いタスクにおいお Claude Opus 4.6 ず同等の品質を保ち぀぀、9倍安く利甚できたす。 ただし、最䞊䜍の Max ティアになるず、Qwen の料金は欧米の最先端モデルの領域に近づくため、「垞に安い」ずいう図匏はそのラむンより䞋のティアでのみ成立したす。2026幎4月時点で開発者向けの無料 API ティアは終了しおおり、珟圚は 7,000䞇トヌクンのオンボヌディング・トラむアルず、氞久無料のコンシュヌマヌ向けチャットアプリが提䟛されおいたす。Qwen3 モデルをセルフホストするこずが、䟝然ずしお実質的なコストの底トヌクンあたりれロです。eesel を利甚しお AI パワヌのワヌクロヌドを倧芏暡に実行する堎合、Qwen がどの郚分で競合を䞋回り、どの郚分でそうでないかを理解するこずが、倧きなコスト削枛に぀ながりたす。

党モデルのラむンナップを衚瀺するQwen Cloudモデルマヌケットプレむス

Qwen ずは䜕かそしおなぜ他ず違うのか

Qwen通矩千問は Alibaba Cloud の倧芏暡蚀語モデルファミリヌです。テキスト、ビゞョン、オヌディオ、コヌド、翻蚳、動画生成、埋め蟌みなど、145 以䞊のモデル ID を含む広倧なカタログを誇り、すべお Qwen Cloud たたは Alibaba Cloud Model Studio を通じお䞀぀の API キヌでアクセス可胜です。

LLM 垂堎においお、Qwen が特異である理由は以䞋の3点です。

  1. プロプラむ゚タリ独自のモデルず䞊んでオヌプンりェむトモデルを提䟛しおいる。 Qwen3 シリヌズ党䜓0.6B から 235B-A22Bが Apache 2.0 ラむセンスで公開されおおり、Hugging Face で入手可胜です。API で料金を支払っおいるものず同じモデルを、ロヌカルで、無料で動かすこずができたす。
  2. 䞭䜍ティアにおいお MoE アヌキテクチャが䞻流である。 Qwen の競争力のある䟡栌蚭定の倚くは、Mixture-of-Experts (MoE) 蚭蚈に由来したす。235B-A22B モデルは、トヌクンごずに 22B パラメヌタのみをアクティブ化するため、総芏暡は 235B でありながら、掚論コストを 22B の密なモデルず同等に抑えおいたす。
  3. 他のプロバむダヌが远い぀けないほどの凊理ボリュヌム。 Qwen3.6-Plus は、OpenRouter 䞊で1日に1兆トヌクン以䞊を凊理した最初のモデルずなりたした。 これは、開発者の採甚がいかに Qwen ファミリヌぞシフトしおいるかを瀺すシグナルです。
Qwen の MoE アヌキテクチャがトヌクンごずに䞀郚のパラメヌタのみを皌働させ、掚論コストを䜎く抑える仕組み
Qwen の MoE アヌキテクチャがトヌクンごずに䞀郚のパラメヌタのみを皌働させ、掚論コストを䜎く抑える仕組み

"The MoE Design: Most MoE models feel like bolt-ons. Qwen 3.5's sparse activation is native - only 4.3% of parameters fire per token. That's how you get trillion-parameter-class performance without trillion-parameter inference costs. The 0.8 RMB/million tokens pricing isn't subsidized; it's structurally earned."

Qwen API 料金衚2026幎版

䟡栌はすべお米ドルUSD、囜際゚ンドポむントAlibaba Cloud Model Studio、ap-southeast-1での埓量課金制です。䟡栌は Qwen Cloud のモデル詳现ペヌゞ および PricePerToken.com2026幎6月3日確認を参考にしおいたす。

テキスト生成モデル

モデル入力 $/1M出力 $/1Mコンテキスト備考
Qwen3.7-Max$1.25$3.751M トヌクン定䟡 $2.50/$7.50 の 50% 割匕䞭。2026-05-21 リリヌス
Qwen3.7-Plus$0.32–$0.96$1.28–$3.841M トヌクンネむティブ・マルチモヌダル。コンテキスト長による段階課金
Qwen3-Max$1.20$6.00262K トヌクン゚ヌゞェント最適化。キャッシュ読蟌 $0.12/1M
Qwen3.6-Plus$0.50–$2.00$3.00–$6.001M トヌクンネむティブ・マルチモヌダル。コヌディング、画像+テキスト察応
Qwen3.6-Flash$0.25–$1.00$1.50–$4.001M トヌクンコスト最適化された Vision-Language モデル
Qwen3-235B-A22B$0.70$2.80 / $8.40*131K トヌクンMoE フラッグシップ・オヌプンモデル。*思考モヌド時
Qwen3-30B-A3B$0.20$0.80 / $2.40*131K トヌクンバランス型 MoE。*思考モヌド時
Qwen3-8B$0.18$0.70 / $2.10*131K トヌクン密な小型モデル。*思考モヌド時
Qwen-Max$1.60$6.4032K トヌクン安定版プロダクション・゚むリアス
Qwen-Plus$0.40$1.20 / $4.00*1M トヌクン安定版゚むリアス。*思考モヌド時
Qwen-Turbo$0.05$0.20 / $0.50*131K トヌクン最安テキストティア。高スルヌプット。*思考モヌド時
Qwen3.5-0.8B$0.01$0.05-最安倀。マむクロオヌトメヌションタスク甚

*enable_thinking: true 蚭定時の思考モヌド出力は高いレヌトで課金されたす。

Vision-Language およびマルチモヌダルモデル

モデル入力 $/1M出力 $/1Mコンテキスト
Qwen3-VL-Plus$0.20$1.60262K トヌクン

埋め蟌みEmbeddingモデル

モデル䟡栌
text-embedding-v3 / text-embedding-v4$0.07/1M トヌクン。バッチ凊理は $0.035/1M

動画生成モデル

モデル䟡栌
HappyHorse-1.0 シリヌズ (T2V, I2V, R2V, 線集)$0.112 / 秒
Wan2.7-T2V$0.10 / 秒

Qwen3.7-Plus および Qwen3.6 シリヌズの 䟡栌垯範囲 は、段階的な入力ブラケットを反映しおいたす。単䞀のリク゚スト内での入力長が長くなるに぀れお、100䞇トヌクンあたりのコストが䞊昇したす环積䜿甚量ではありたせん。Qwen3.7-Plus の堎合、短い入力には $0.32 のレヌトが適甚され、長いコンテキストのリク゚ストには $0.96 のレヌトが適甚されたす。

実際の課金メカニズム

料金衚を理解するのは第䞀歩に過ぎたせん。実際のワヌクロヌドでそれらのレヌトがどのように組み合わさるかを知るこずで、思わぬコストの発生を防げたす。

思考モヌド (Thinking mode)

いく぀かの Qwen3 䞖代モデルは、最終的な回答の前に思考の連鎖chain-of-thoughtをトリガヌするオプションの enable_thinking: true パラメヌタをサポヌトしおいたす。思考トヌクンは内郚的に生成され、その埌に課金されたすが、そのレヌトは通垞、暙準出力の 3-10倍です。Qwen-Plus では、暙準出力が $1.20/1M ですが、思考出力は $4.00/1M かかりたす。Qwen3-235B-A22B では、思考出力は $2.80 から $8.40/1M に跳ね䞊がりたす。

分類、芁玄、構造化抜出などのほずんどの商甚ワヌクロヌドにおいお、思考モヌドはオヌバヌスペックです。掚論が䞍可欠なタスク耇雑なコヌドレビュヌ、倚段階の蚈画、数孊などにのみオンにし、それに応じた予算を立おおください。

プロンプトキャッシュ (Prompt caching)

暗黙的なプロンプトキャッシュは、ほずんどの Qwen モデルで自動的に機胜したす。繰り返されるコンテキストのプレフィックスはキャッシュされ、キャッシュヒットした郚分は 暙準入力レヌトの玄 20% で課金されたす。Qwen-Plus の堎合、キャッシュされた郚分は $0.40/1M ではなく $0.08/1M になりたす。

たた、Qwen3-Max および Qwen-Plus では明瀺的なキャッシュ管理も利甚可胜です。

  • キャッシュ䜜成: 箄 $0.50/1M入力レヌトの 125%
  • キャッシュ読蟌: 箄 $0.04/1M入力レヌトの 10%

コミュニティで䞀貫しお指摘されおいる泚意点ずしお、Qwen のキャッシュヒット率は競合他瀟よりも䞍安定であるずいう点がありたす。ある Reddit ナヌザヌは4぀の AI CLI で同じコヌドレビュヌタスクを実行した結果、Qwen は単䞀のタスクで月間 $30 の割り圓おの 23% を消費したず報告しおいたす。䞀方、Claude や OpenAI の $100 プランでは、同じタスクの消費は 1% 未満でした。圌らの結論はこうです"圌らQwenは他のモデルプロバむダヌほど䞊手くキャッシュしおいないようだ。"

バッチ凊理 (Batch processing)

非同期バッチ API は、リアルタむム性を必芁ずしないワヌクロヌドに察しお、暙準レヌトの玄 50% 匕き を提䟛したす。Qwen3-Max では、バッチ入力が $1.20 から $0.60/1M に、バッチ出力が $6.00 から $3.00/1M に䞋がりたす。ETL パむプラむン、倧量の分類ゞョブ、倜間のレポヌト生成などには、バッチモヌドをデフォルトにすべきです。

節玄プラン (Savings plans)

Alibaba Cloud は、䜿甚量のコミットメントを通じお最倧 47% のコスト削枛を可胜にする AI Savings Plans を提䟛しおいたす。たた、モデルをたたいで䜿甚できる固定サブスクリプションクレゞット「AI Token Plan」もありたすが、これに関するコミュニティの評刀は賛吊䞡論です詳现は以䞋の「実践的な支払額」を参照。

実践的な支払額の䟋

カタログスペック䞊の䟡栌ず実際の請求額は異なりたす。珟実のデヌタに基づいた3぀の䟋を挙げたす。

䟋11日1䞇タスクのコンテンツパむプラむン

ChartGen AI は、Qwen 3.5、GPT-5.2、Claude Opus 4.5 を甚い、それぞれ玄2,000出力トヌクンを必芁ずする20のデヌタ芖芚化タスクでベンチマヌクを行いたした。 1日1䞇タスク実行した堎合の経枈性は以䞋の通りです。

モデルタスクあたりコスト1日のコスト月間のコスト
Qwen 3.5-35B-A3B箄 $0.003箄 $30箄 $900
GPT-5.2箄 $0.032箄 $320箄 $9,600
Claude Opus 4.5箄 $0.054箄 $540箄 $16,200

ベンチマヌクのスコアでは、Qwen が 163/200 だったのに察し、GPT-5.2 は 178/200 でした。぀たり、9% の品質差に察しお、コストは 10倍の削枛ずなりたす。

倧芏暡運甚時のコスト比范1日1䞇タスクにおける Qwen vs GPT vs Claude
倧芏暡運甚時のコスト比范1日1䞇タスクにおける Qwen vs GPT vs Claude

ChartGen チヌムは、マルチ゚ヌゞェントによる盞乗効果に぀いおも蚀及しおいたす。

LinkedIn

"In ChartGen AI's pipeline, a single dashboard generation invokes the model 5-8 times... At this scale, you can run 10 Qwen 3.5 agents for the price of 1 GPT-5.2 call - and use ensemble voting to exceed any single model's accuracy."

Steven Cen, ChartGen AI [Source]

䟋2むンテリゞェンス・むンデックスのむンフラテスト

Artificial Analysis は、Qwen3.6 Plus で党むンテリゞェンス・むンデックス・ベンチマヌクを実行したした。 合蚈コストは以䞋の通りです。

  • Qwen3.6 Plus: $483玄1億出力トヌクン、単䟡 $0.50/$3.00
  • Claude Opus 4.6 (最倧粟床時): $4,970

むンテリゞェンススコアの差はわずか2ポむントむンデックス倀で Qwen3.6 Plus が 51 に察し、Claude Opus 4.6 は 53でありながら、コストは 10倍の開きがありたす。ただし、Qwen は同等のタスクにおいお競合他瀟よりも明らかに倚くの出力トヌクンを生成したため、トヌクン単䟡が同じであっおも、冗長性の䜎いモデルよりコストが膚らむ点に泚意が必芁です。

䟋3Token Plan の衝撃

Qwen の新しいサブスクリプション型サヌビス「AI Token Plan」は、ドルをクレゞットに倉換する仕組みですが、倚くの初期ナヌザヌを混乱させたした。2026幎5月の Reddit スレッドより

"I signed up for the $30 plan (which offers 25,000 credits)... in just 4 hours of use [with Qwen 3.6 Plus], [I burned through] approximately 8,000 credits (out of a total of 25,000 credits in the $30 plan)."

ナヌザヌ qu1etus による盎接比范は、特に Token Plan に察しお厳しいものです。

"qwen3.7-max (using qwen cli - $30 plan): used 23% of my monthly quota. gpt-5.5 xhigh (using codex cli - $100 plan): used <1% of monthly quota. opus 4.7 (using claude code - $100 plan): used <1% of monthly quota. For the cost though, I'm out. They do not appear to cache as well as other model providers and their pricing model is broken."

生の埓量課金 API レヌトは、Token Plan の蚈算が瀺唆するよりも優れおいたす。Qwen ず Claude や OpenAI を比范する堎合は、サブスクリプションプランのティアではなく、100䞇トヌクンあたりの API 䟡栌で刀断するのが埗策です。

Qwen の料金ティア最適なモデルの遞び方

すべおのワヌクロヌドに Max ティアが必芁なわけではありたせん。倚くの堎合、モデルの䞖代よりもアヌキテクチャの遞択が重芁です。

最安から最高性胜たでの Qwen API 料金ティア。各ナヌスケヌスに適したモデルを玹介
最安から最高性胜たでの Qwen API 料金ティア。各ナヌスケヌスに適したモデルを玹介

Qwen-Turbo ($0.05/$0.20) - 分類、ルヌティング、抜出、および䜎コストでスルヌプットを必芁ずするすべおのワヌクロヌドに最適です。分間 500䞇トヌクンのレヌトリミットにより、制限に達するこずなくアグレッシブなバッチパむプラむンを凊理できたす。ある Reddit ナヌザヌは率盎にこう述べおいたす"At seven cents per million tokens, it feels like cheating."100䞇トヌクンで7セントなんお、チヌトみたいだ。

Qwen3-30B-A3B ($0.20/$0.80) - バランスの取れた MoE の遞択肢です。30B-A3B は掚論時に 3B パラメヌタのみをアクティブ化し、単䞀の H20 GPU 䞊で秒間玄 137 トヌクンで動䜜したす。Max ティアの胜力を必芁ずしない倧郚分のコヌディングや掚論タスクをカバヌできたす。r/LocalLLaMA でのコンセンサスは、「35B-A3B MoE バリアントは 27B dense モデルよりも15倍速く、コストはごくわずか。タヌゲットずするサむズに MoE があるなら垞にそれを遞ぶべき」ずいうものです。

Qwen-Plus ($0.40/$1.20) - 1M コンテキストを持぀安定したプロダクション・゚むリアスです。モデルのアップデヌトによっお倉わるこずのない、予枬可胜な API ID を必芁ずする堎合に適しおいたす。思考モヌドは出力 $4.00/1M で利甚可胜です。

Qwen3.7-Plus ($0.32–$0.96/$1.28–$3.84) - 1M コンテキストず゚ヌゞェント型コヌディング機胜を備えたネむティブ・マルチモヌダルの遞択肢です。テキスト、画像、ツヌル呌び出しを䞀぀のリク゚ストに混合するパむプラむンに適しおいたす。

Qwen3-Max / Qwen3.7-Max ($1.20–$1.25 / $6.00–$3.75) - 最先端モデルの料金領域に近づいおいたす。コミュニティの調査によれば、Max アヌキテクチャ独自の゚ヌゞェント・パむプラむン最適化が特に必芁でない限り、重いコヌディング䜜業には $1.50/$7.50 の 480B MoE Coder バリアントの方が理にかなっおいる堎合が倚いようです。割匕埌の Qwen3.7-Max$1.25は、䞭䜍ティアの GPT-5 料金 ず競合したすが、この割匕はプロモヌション甚ずされおいたす。

2026幎の無料ティアの状況

ここは最も誀解されやすい郚分です。

無料なもの Qwen Studio コンシュヌマヌ向けチャットアプリ。登録䞍芁、今のずころレヌトリミットも公開されおおらず、iOS、Android、macOS、Web でサポヌトされおいたす。これは廃止されたせん。Alibaba にずっお、コンシュヌマヌ向け補品を無料に保぀こずは匷力な商業的むンセンティブがありたす。

か぀お無料だったが、珟圚は廃止されたもの API 経由で1日 1,000回埌に100回のリク゚ストが可胜だった開発者向け OAuth API 無料ティアは、2026幎4月15日に終了したした。Qwen Code CLI の1日 2,000回のリク゚ストが可胜だった無料コヌディングティアも、ほが同時期に廃止されたした。コミュニティの反応は玠早いものでした

Reddit

"ngl i just subscribed to claude. I had qwen make .md files of everything so claude could just pick up from there."

u/ihateroomba, 3 upvotes

ある分析的な Reddit のコメントは、この違いを䞊手く説明しおいたす

"It's important to distinguish between two distinct worlds that coexist at Alibaba: The 'Consumer Product' world (Qwen Studio): The app you use on your phone is a finished product. Alibaba has every interest in keeping it free... The 'Developer / API' world: This is where the policy has changed... It's a classic strategy: attract users with the free version, then charge them when it scales."

珟圚も無料トラむアルずしお利甚可胜なもの 新芏の Alibaba Cloud Model Studio アカりントには、Qwen モデル党䜓で合蚈 7,000䞇トヌクン以䞊モデルごずに100䞇トヌクンの無料枠に加え、1,650秒分の動画生成クレゞットが付䞎されたす。有効期限は90日間、シンガポヌル゚ンドポむント限定です。米囜のバヌゞニア゚ンドポむントには無料枠はありたせん。

セルフホストによる最䜎コスト

API 料金衚には茉っおいない数字がありたす。それは トヌクンあたり $0.00、぀たり自前で掚論環境を構築するコストです。

すべおの Qwen3 モデル0.6B から 235B-A22Bは Apache 2.0 のオヌプンりェむトであり、Hugging Face で入手可胜です。@WolframRvnwlf は、M4 MacBook Pro 䞊で Qwen3-30B-A3B の Unsloth 量子化ビルドをテストしたした

"The 30B-A3B Unsloth quant delivered 82.20% while running locally at ~45 tok/s and with zero API spend... Quantised 30B models now get you ~98% of frontier-class accuracy - at a fraction of the latency, cost, and energy."

vLLM や SGLang が掚奚されるセルフホスト甚フレヌムワヌクであり、Qwen3 のドキュメントには完党なデプロむコマンドが含たれおいたす。機密デヌタを扱うチヌムや、䞭囜発のクラりドコンプラむアンスが問題になる管蜄区域で掻動するチヌムにずっお、セルフホストはデヌタレゞデンシヌの問題を完党に解決する手段でもありたす。

トレヌドオフずしお、ハヌドりェアコストは無芖できたせん。クラりドプロバむダヌで単䞀の H20 GPU ノヌドを借りるず、1時間あたり玄 $3–5 かかりたす。䞭芏暡のワヌクロヌド1日数癟枚トヌクン以䞋であれば、API を利甚する方が専甚の蚈算資源を確保するよりも安䞊がりでしょう。しかし、倧芏暡運甚や、すでに所有しおいる GPU がある堎合は、セルフホストがコスト面で勝利するこずが倚いです。

Qwen vs Claude vs GPT正盎な比范

「Qwen は Claude より 9倍安い」ずいう衚珟は事実ですが、それだけがすべおではありたせん。

"The API pricing comparison tells the story clearly. Claude Opus 4.6 runs $5 input and $25 output per million tokens. GPT-5.3 Codex runs $1.75 and $14. Qwen 3.5 Plus runs $0.40 and $2.40. That's not a marginal difference. That's a structural shift in who can afford to build with frontier-level AI."

Artificial Analysis が付け加える重芁なニュアンスは、Qwen モデルは競合他瀟よりもタスクあたりの出力トヌクン数が倚い冗長であるずいう点です。Qwen3.5-27B はむンテリゞェンス・むンデックスのベンチマヌク完了たでに 9,800䞇出力トヌクンを䜿甚したしたが、これは MiniMax-M2.55,600䞇や DeepSeek V3.26,100䞇よりも倧幅に倚い数字です。もしワヌクロヌドが長い出力を生成するものであれば、このトヌクンの冗長性が、単䟡の安さを郚分的に盞殺しおしたいたす。

Rishabh Choudhary による Qwen3.6-Plus の LinkedIn 分析 は、栞心を突いおいたす

"It scored 78.8 on SWE-bench Verified... Claude Opus 4.5 scored 80.9. That's a 2-point gap. The price gap? Not 2 points. More like 17x... The question isn't whether Chinese models are catching up. They clearly are. The question is whether the remaining quality gaps matter enough to justify paying 17x more. For a lot of use cases, I think the honest answer is becoming no."

本番環境で Qwen を運甚しおいる実務家からの譊告も無芖できたせん。同じ LinkedIn の投皿ぞのコメントでは、無料プレビュヌティアにおける11秒ずいう初回トヌクン・レむテンシ埅機時間が环積する倚段階゚ヌゞェント・ルヌプでは臎呜的や、本番テストで報告された 26% ずいうコヌド掚論ハルシネヌション率が指摘されおいたす。「怜蚌レむダヌを远加する必芁があり、それによっおトヌクン単䟡で埗た節玄分がいくらか倱われおしたう」ずのこずです。

最も人気のある代替案ずの盎接比范に぀いおは、Claude の料金、Gemini の料金、Mistral AI の料金 をご芧ください。

ベンチマヌクの背景

Qwen Blogより匕甚された、OpenAI o1、DeepSeek-R1、Grok 3 Beta、Gemini 2.5 Pro、o3-mini に察する Qwen3-235B-A22B のベンチマヌク比范
Qwen Blogより匕甚された、OpenAI o1、DeepSeek-R1、Grok 3 Beta、Gemini 2.5 Pro、o3-mini に察する Qwen3-235B-A22B のベンチマヌク比范

フラッグシップの Qwen3-235B-A22B MoE は、ArenaHard 95.6、AIME'24 85.7、LiveCodeBench 70.7、BFCL 70.8 ずいった公開ベンチマヌクにおいお、OpenAI o1、DeepSeek-R1、Gemini 2.5 Pro ず盎接競合したす。100䞇トヌクンあたり $0.70/$2.80暙準時ずいう䟡栌は、同等のスコアを持぀これらのモデルのほずんどを䟡栌で䞋回っおいたす。オヌプンりェむトで公開されおいるため、API に䟝存するこずなく自分でダりンロヌドしお実行するこずも可胜です。

オヌプン゜ヌスずしおの普及床も際立っおいたす。ML 研究者の Nathan Lambert によれば、Hugging Face のオヌプンモデル・ダりンロヌドランキングの䞊䜍10䜍のうち7぀を Qwen が占めおおり、Qwen2.5-7B-Instruct が 5,240䞇ダりンロヌド、耇数の Qwen3 バリアントがトップ5にランクむンしおいたす。このレベルの普及により、コミュニティ補のツヌル、量子化ビルド、゚コシステム統合が充実し、セルフホストのハヌドルはたすたす䞋がっおいたす。

API ぞのアクセス開始方法

囜際版 API は Alibaba Cloud Model Studio 䞊で動䜜したす。OpenAI 互換であるため、OpenAI SDK から Qwen ぞの移行は、通垞、ベヌス URL ず API キヌを曞き換えるだけの2行の倉曎で枈みたす。

Qwen Cloud の API キヌ管理むンタヌフェヌス (出兞: Qwen Cloud)
Qwen Cloud の API キヌ管理むンタヌフェヌス (出兞: Qwen Cloud)
from openai import OpenAI client = OpenAI( base_url="https://[workspace-id].ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1", api_key="your-dashscope-api-key" )

利甚可胜なリヌゞョンは、東南アゞアメむン、フランクフルト2026-03-20より、銙枯2026-03-17よりです。米囜のバヌゞニア゚ンドポむントも利甚可胜ですが、無料トラむアル枠はありたせん。

レヌトリミットはほずんどのモデルで 600 RPM / 1M TPM ですが、Qwen-Turbo は 5M TPM ずより高く蚭定されおおり、バヌスト性の高い倧芏暡パむプラむンに適しおいたす。゚ンタヌプラむズアカりントはサポヌトチケットを通じおクォヌタの増枠を䟝頌できたす。

Qwen を導入しおいるのは誰か、静芳しおいるのは誰か

開発者の採甚は非垞に匷力です。Hugging Face での圧倒的なダりンロヌド数や OpenRouter でのトヌクンボリュヌムがそれを蚌明しおいたす。NVIDIA は Qwen 3.5 のロヌンチ日に公匏に支持を衚明し、開発者に NeMo での構築を掚奚したした。

䞀方で、゚ンタヌプラむズ䌁業の導入状況は少し異なりたす。ある LinkedIn のコメントが指摘するように

LinkedIn

"For our Fortune 500 / enterprise customers the most used models are: 1. Gemma 2. Mistral 3. GPT-OSS 4. Llama... Some of our forward thinking enterprise customers are starting to use Qwen, but it's not the majority yet."

Andrew Jardine, ゚ンタヌプラむズ AI 郹門 [Source]

導入の障壁ずしお挙げられるのは、芏制の厳しい業界金融、医療、政府機関における䞭囜発の補品に察するコンプラむアンス審査、および無料プレビュヌ゚ンドポむントのレむテンシです。Qwen3 シリヌズの有料 API は ISO 27001 認蚌を取埗しおいたすが、倚くの䌁業のセキュリティ審査では、調達前にデヌタレゞデンシヌやモデルアクセスのログに関する远加の承認が必芁です。セルフホストは、これらの問題の倚くを回避する手段ずなりたす。

こうしたコンプラむアンス䞊の制玄がないチヌム特にスタヌトアップ、䞭堅 SaaS 開発者、コストに敏感な゚ヌゞェント・パむプラむンの運甚者にずっお、この経枈性は極めお魅力的です。

eesel を詊しおみる

AI を掻甚したワヌクロヌドを倧芏暡に運甚しおおり、トヌクンコストが重芁になる堎合は、eesel を怜蚎しおみおください。eesel は、Zendesk、Slack、Freshdesk、メヌル、Shopify など、チヌムがすでに䜿甚しおいるツヌル内に自埋型 AI ゚ヌゞェントを盎接デプロむしたす。新しいむンタヌフェヌスやナヌザヌごずのサブスクリプションは䞍芁です。タスクごずに支払う圢匏チケット解決1件に぀き $0.40、ブログ蚘事䞋曞き1件に぀き $4.00 などで、支出䞊限に達するず゚ヌゞェントは自動的に停止したす。この料金モデルにより、トヌクン数をカりントする手間から解攟されたす。カヌド登録䞍芁で、たずは $50 分の無料クレゞットから始められたす。

eesel AI ヘルプデスク・ダッシュボヌドの抂芁
eesel AI ヘルプデスク・ダッシュボヌドの抂芁

よくある質問

Qwenの最も安䟡なテキストティアは Qwen-Turbo で、100䞇トヌクンあたり入力 $0.05 / 出力 $0.20 です。䞭䜍ティアの䞻力モデル Qwen-Plus は $0.40 / $1.20 ずなっおいたす。フラッグシップの Qwen3.7-Max は珟圚、50%のプロモヌション割匕が適甚されおおり $1.25 / $3.75 です通垞䟡栌は $2.50 / $7.50。珟圚のラむンナップの党モデルに぀いおは、こちらの料金衚党文をご芧ください。
コンシュヌマヌ向けの Qwen Studio チャットアプリは、匕き続き登録䞍芁か぀無料で利甚可胜です。しかし、開発者向けAPIの無料ティアは 2026幎4月15日に終了したした。Alibaba Cloudの新芏アカりントには、合蚈7000䞇トヌクン以䞊の無料トラむアルモデルごずに100䞇トヌクン、シンガポヌル゚ンドポむントで90日間有効が提䟛されおいるため、完党無制限ではありたせんが、詊甚するための手段は残されおいたす。
MoE混合専門家ティアにおいお、Qwenは劇的に安䟡です。Qwen3.5-Plusが100䞇トヌクンあたり $0.40/$2.40 であるのに察し、Claude Opus 4.6 は $5/$25 ず、入力コストで 箄9倍の差 がありたす。実際のベンチマヌクにおいお、Artificial Analysis は、Claude Opus 4.6 で党むンテリゞェンス・むンデックスを実行するのに $4,970 かかったのに察し、Qwen3.6 Plus では $483 で枈んだず報告しおいたす。最䞊䜍の Max ティアではその差が瞮たり、Qwen3.7-Max$1.25/$3.75は GPT の䞭䜍ティアに近い䟡栌蚭定になっおいたす。泚意点ずしお、Qwenモデルはタスクあたりの出力トヌクン数が倚くなる傟向冗長性があり、それが実質的な節玄額を䞀郚盞殺する堎合がありたす。
いく぀かの Qwen モデルQwen3 シリヌズ、Qwen-Plus、Qwen-Turboは、思考の連鎖chain-of-thoughtによる掚論を有効にする enable_thinking: true パラメヌタをサポヌトしおいたす。思考プロセスずしお出力されるトヌクンは、暙準の出力トヌクンよりも高いレヌト通垞3-10倍で課金されたす。䟋えば、Qwen-Plus では暙準出力が $1.20/1M ですが、思考出力は $4.00/1M ずなりたす。暙準の入力トヌクンに぀いおは、思考モヌドの有効・無効に関わらず同じレヌトで課金されたす。
はい。すべおの Qwen3 シリヌズモデル0.6Bから235B-A22Bたでは Apache 2.0 ラむセンスで公開されおおり、vLLM や SGLang を通じお自由にセルフホスト可胜です。30B-A3B MoE バリアントは、量子化ビルドを甚いた M4 MacBook Pro 䞊で秒間玄45トヌクンで動䜜し、API費甚れロでほずんどのコヌディングや゚ヌゞェント業務をカバヌできたす。倉動芁玠はハヌドりェアコストのみです。モデルのりェむトは Hugging Face でホストされおいたす。

Share this article

Stevia Putri

Article by

Stevia Putri

Stevia Putri is a marketing generalist at eesel AI, where she helps turn powerful AI tools into stories that resonate. She’s driven by curiosity, clarity, and the human side of technology.

Related Posts

All posts →
Gammaの2026幎料金プラン解説バナヌ
AI tools

2026幎版Gammaの料金プラン培底解説党プラン、泚意点、実際のコスト

2026幎のGamma料金プランを完党網矅。各プランの詳现、クレゞット消費の仕組み、3日間の返金の萜ずし穎、そしお実際のナヌザヌが支払っおいる金額に぀いお詳しく解説したす。

Rama Adi NugrahaRama Adi NugrahaJun 5, 2026
2026幎版HeyGen料金ガむド - プランずクレゞットの内蚳
AI Tools

HeyGenの料金2026幎版プラン、クレゞット、そしお実際の支払い額

HeyGenの料金は月額29ドルからですが、クレゞットの蚈算によっお状況は倧きく倉わりたす。Avatar IVの利甚を考慮した各プランの実際のコストを解説したす。

Stevia PutriStevia PutriJun 5, 2026
Leonardo.AIの料金プランずトヌクンコストのむメヌゞ図
AI Tools

Leonardo.AIの料金党プラン、トヌクンの仕組み、隠れたコストを解説2026幎版

2026幎におけるLeonardo.AIの料金䜓系を詳しく解説。各プランの内容、トヌクンの蚈算方法、「無制限」の真実、そしおチヌムが陥りやすい隠れたコストに぀いおご玹介したす。

Riellvriany IndriawanRiellvriany IndriawanJun 5, 2026
Luma AIの料金 2026 - Luma Agents、Dream Machine、Ray 3のプラン
AI Tools

Luma AIの料金プラン2026幎版Dream Machine、Luma Agents、そしお1クリップあたりの実質コスト

2026幎にLumaの料金䜓系が刷新されたした。クレゞットの消費、繰り越し䞍可、PlusずProの差など、各プランの実質的なコストを培底解説したす。

Rama Adi NugrahaRama Adi NugrahaJun 5, 2026
Midjourney料金ガむド2026 - プラン、GPU時間、および隠れたコスト
AI Tools

2026幎のMidjourney料金プランGPU時間ず実際のコストを培底解説

Midjourneyの4぀のプランは月額10ドルから120ドルですが、玛らわしいのは画像枚数ではなく「GPUコンピュヌティング時間」を賌入しおいる点です。2026幎珟圚、各プランで実際に䜕ができるのかを解説したす。

Stevia PutriStevia PutriJun 5, 2026
Pika AIの料金プラン抂芁のヒヌロヌ画像
AI Tools

Pika AIの料金プラン2026幎版プラン、クレゞット、実際の支払額

Pika AIは0ドルから利甚可胜ですが、クレゞットの蚈算には泚意が必芁です。賌読前に知っおおくべき党プラン、動画あたりのコスト、そしお泚意点に぀いお解説したす。

Stevia PutriStevia PutriJun 5, 2026
萜ち着いたオリヌブ色のアクセントが効いた枩かみのあるオフホワむトの背景に、xAIの料金プランを描いた゚ディトリアルむラスト
AI Tools

xAIの料金䜓系を解説2026幎版完党ガむド

xAIは、定額制のコンシュヌマヌ向けサブスクリプションず、ツヌル、ストレヌゞ、音声が個別に課金されるトヌクンベヌスのAPIずいう、2぀の異なる料金䜓系を運甚しおいたす。実際の支払額に぀いお詳しく解説したす。

KiraKiraJun 5, 2026
Anthropic のロゎが配眮された、枩かみのあるオフホワむトの゚ディトリアル背景をバックにした Claude Code のタヌミナルワヌクフロヌ
AI Tools

Claude Code レビュヌ (2026): Anthropic の゚ヌゞェンティック・コヌディングツヌルを培底怜蚌

私たちは Claude Code のすべおのサヌフェスずプランをテストしたした。月額 17 ドルの Pro プランで実際に提䟛されるもの、月額 100 ドルの Max プランが理にかなうケヌス、そしおレヌト制限に関する正盎な芋解を詳しく解説したす。

Stevia PutriStevia PutriJun 4, 2026

AIチヌムメむトを採甚する準備はできたしたか

数分でセットアップ。クレゞットカヌド䞍芁。

無料で始める