MiniMax M3とは?オープンウェイトモデルを解説

Alicia Kirana Utomo
執筆者

Alicia Kirana Utomo

Katelin Teen
レビュー者

Katelin Teen

最終更新 June 19, 2026

専門家による検証済み
画像・音声・動画入力に対応したMiniMax M3マルチモーダルAIモデルのイラスト

MiniMax M3とは?

MiniMax M3は汎用の大規模言語モデルで、MiniMaxは「MSAという新しいアテンションアーキテクチャに基づき、1Mコンテキストを持つフロンティアコーディング・エージェントモデル」と説明しています。以前のM2ライン(M2、M2.1、M2.5、M2.7)の後継であり(M2ラインも引き続き利用可能)、最初のステップからマルチモーダルとしてトレーニングされた最初のMiniMaxモデルです。画像・動画入力に対応し、デスクトップコンピューターを操作することさえ可能です。

MiniMax自体は「Intelligence with everyone」をキャッチフレーズとする中国のAI研究所で、テキストをはるかに超えてビデオ(Hailuo)、音声、音楽まで手がけています。M3はそのラインナップにおけるテキストとエージェントの旗艦モデルです。中国から登場する強力なモデルの波を追っている方なら、M3がQwenKimi K2.5と同じ文脈に位置することがわかるでしょう。今年最も注目すべきオープンウェイトのリリースの一つです。

公式リリースはMiniMaxのXアカウントでその主張を明確に示しました:

"Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities... Coding & Agentic Frontier: 59.0% SWE-Bench Pro, 66.0% Terminal Bench 2.1... MiniMax Sparse Attention scales context to 1M... Natively Multimodal from Step Zero"

MiniMax (@MiniMax_AI)、リリースアナウンス

進める前に名前について一点:「MiniMax 3」という名前のモデルは存在しません。正式名称はMiniMax M3であり、このガイドではそれを取り上げます。

MiniMax M3の仕組み:スパースアテンションと1Mトークンウィンドウ

M3について最も興味深いのはベンチマークではなく、コストを爆発させずに100万トークンを読めるアーキテクチャです。これは本当に巧妙だと感じる部分なので、どのように機能するか説明します。

MiniMax Sparse Attentionが1Mトークンコンテキストのコストを削減する仕組み
MiniMax Sparse Attentionが1Mトークンコンテキストのコストを削減する仕組み

内部的にM3はMixture-of-Expertsモデルで、総パラメータ数は約428B、トークンごとに活性化されるのは約23Bです。つまり、各リクエストでは自身のごく一部のみを実行します。その上にある真の目玉がMiniMax Sparse Attention(MSA)です。コンテキストをブロックに分割し、すべてのトークンを相互比較するのではなく、関連するブロックにのみアテンションを向ける新しいアテンション設計です。

これが重要なのは、通常のアテンションはコンテキストが増えるにつれて二次的にコストが上昇するためで、長いコンテキストウィンドウが通常低速で高コストな理由がここにあります。MiniMaxによると、MSAはトークンあたりの計算量を約1/20に削減し、M2と比較して1Mコンテキストで9倍以上高速なプリフィルと15倍高速なデコードを実現しながら、アブレーション実験では大多数の能力でフルアテンションと同等のパフォーマンスを維持しています。結果として1,000,000トークンのコンテキストウィンドウ(最低512Kを保証)を実現しており、M2ラインの204,800から大幅に向上しています。

M3の動作について知っておくべきその他の点:

  • 思考モード。 thinkingパラメーターで推論をenabledadaptive(モデルが判断)、または低レイテンシ向けのdisabledに設定でき、両モードは同一の料金を共有します。
  • ネイティブマルチモーダル。 「ステップ0から」テキスト・画像・動画のインターリーブでトレーニングされているため、後からビジョンが追加されたモデルよりもモダリティを深く融合しています。
  • 長期的な作業向けに構築。 MiniMax自身のデモでは、M3が研究論文を再現するためにほぼ12時間自律的に動作し、147のベンチマーク提出と1,959のツール呼び出しにわたって約24時間かけてCUDAカーネルを最適化しました。

詳細な手法はM3技術レポートに記載されています。

MiniMax M3はどれくらい優れているか?ベンチマーク

MiniMaxはM3をソフトウェアエンジニアリングとターミナル実行のフロンティアと位置付け、GPT-5.5、Gemini 3.1 Pro、Claude Opusなどのクローズドモデルと比較しています。以下はアナウンスで公開されたスコアです:

ベンチマーク測定内容MiniMax M3
SWE-Bench Pro実際のソフトウェア修正59.0%
Terminal-Bench 2.1コマンドラインエージェントタスク66.0%
MCP Atlasエージェントプロトコルでのツール使用74.2%
SWE-fficiency効率的なコード変更34.8%
KernelBench HardGPUカーネル最適化28.8%
PostTrainBench自律的なモデルトレーニング37.1 (#3)
Video-MME(512フレーム)動画理解84.6

これらの数値が意味することについて正直に言うと、自律的なモデルトレーニングベンチマークPostTrainBenchでは、M3は全体で3位となり、Claude Opus 4.7(42.4)とGPT-5.5(39.3)にわずかに及びませんでしたが、それ以外のすべてを上回りました。これが全体的なパターンです:M3はオープンウェイトモデルとして優れており、コーディングで競争力がありますが、クローズドなフロンティアのトップではありません。以前のM2ファミリーはすでに独立したインデックスでオープンウェイトのスコアを押し上げており、M3はそこからの明確な一歩前進です。

これらのモデルの比較について広いコンテキストを知りたい方は、Claude代替Gemini代替のガイドで比較のクローズドモデル側を網羅しています。

MiniMax M3の料金は?

ここがM3の評判の源泉です。開発者が繰り返し言及する理由は料金にあります。

MiniMaxはM3を2つの方法で販売しています。1つ目は、リリース時に3段階に更新されたサブスクリプションToken Planで、テキスト・画像・音声・音楽がすべて共通の使用プールを使います:

Token Plan価格 / 月月あたりM3トークン目安
Plus$20約17億トークン
Max$50約51億トークン
Ultra$120約98億トークン

MiniMaxはエントリー層を"$20 = Claude Proの10倍"のスループットと表現していますが、これはマーケティングであり、方針を示しています:1ドルあたり最大トークン数。Qwnの料金やオープンウェイトパックの他のモデルと同様の低コスト戦略です。

2つ目は従量制APIで、入力長による課金です。512K入力トークン未満の呼び出しは標準料金、それ以上はフルリポジトリや超長文書作業向けの高い長文コンテキスト料金が適用されます。思考のオン・オフは料金が同じで、レイテンシに敏感なワークロード向けにpriorityサービス層も利用できます。r/LLMDevsの開発者によると、リリース時のトークン単価は512K以下で100万トークンあたり$0.60/$2.40と報告されており、彼らの言葉では「DeepSeek領域」に入る価格です。

コスト面の残り半分はライセンスです。M3はMiniMax Community Licenseの下でオープンウェイトです:非商用利用は無料ですが、商用利用には「Built with MiniMax M3」という目に見えるクレジット表記が必要で、年間収益2,000万ドル超の場合は事前の書面による承認が必要です。つまりオープンウェイトであり、オープンソースではありません。コミュニティがすぐに指摘する区別です。他の有料オプションとの純粋なコスト比較には、安価なAIツールリストとKimi K2.5料金ガイドが役立つ参考資料です。

開発者がMiniMax M3について実際に言っていること

公開ベンチマークだけではわからないことがあります。より有益なシグナルは、実際の業務でM3を使用している開発者から来ており、評価は一致しています:コストパフォーマンスの高い選択肢であり、フロンティアの代替ではありません。

価値についての最も明確な議論は、実はM2.7の前モデルに切り替えた人物から来ており、r/openclawに投稿されています:

"claude is a slightly better model. better reasoning, better depth on hard problems. that's just how it is. but minimax m2.7 delivers exceptionally well for what i actually use it for, at a fraction of the cost... sometimes good enough is actually great when it's reliable and affordable."

u/[deleted]、r/openclaw

M3について具体的には、r/opencodeの開発者が他の中国モデルを試した後にこう述べています:

"I started using Kimi 2.6, then GLM 51, then DeepSeek4. But now after trying minimax m3 I am really impressed. It seems to think very deeply and really do a good job following directions... It seems to have flown a lot under the radar."

u/gameguy56、r/opencode

これはM3が市場でどのような位置にあるかをおおよそ表しています:オープンウェイト、Sonnetクラス程度の能力、バリュー層の価格設定。

MiniMax M3の位置付け:Sonnetクラス程度の能力を持つオープンウェイトモデルがバリュー価格で
MiniMax M3の位置付け:Sonnetクラス程度の能力を持つオープンウェイトモデルがバリュー価格で

ただし、賞賛ばかりではなく、本番環境を考えている場合は批判も真剣に受け止める必要があります。最も多い不満はプレッシャー下での信頼性です。r/hermesagentのテスターはM3の予測不能さを指摘しています:

"I feel like it is much more chaotic and verbose, as well as hallucinations being more common. Now it just suddenly keeps stopping mid action... Right now I wouldn't use it in production."

u/FUTC-Photography、r/hermesagent

また、ホストされたAPIについてデータ保持の懸念が繰り返し指摘されており、ユーザーはプロンプトデータのトレーニング利用からのオプトアウト方法が明確に見つからないと述べています。これはホビープロジェクト以上に顧客データにとって重要な問題であり、セルフホスティングコミュニティがHugging Faceでウェイトが公開されていることを評価している大きな理由の一つです。

落とし穴:優れたモデルはまだサポートエージェントではない

新しい輝かしいモデルがリリースされるときに見落とされがちなことをお伝えします。M3のようなモデルは素晴らしいエンジンです。しかしエンジンは車ではなく、生のモデルはカスタマーサポートエージェントではありません。

生のモデルが実際のチケットに回答できるようになる前に、知識・シミュレーション・ガードレールのレイヤーが必要な理由
生のモデルが実際のチケットに回答できるようになる前に、知識・シミュレーション・ガードレールのレイヤーが必要な理由

私はeeselでここ数年、言語モデルをライブサポートキューに向けたときに何が起きるかを観察してきました。失敗パターンは常に同じです:モデルは自信ありげに聞こえるが、具体的な内容で間違える。なぜなら返金ポリシー、過去5万件の解決済みチケット、あるいは人間がレビューせずに送っても安全な回答を知らないからです。リーダーボードで最も賢いモデルでも、誰も教えなければ出荷期限を幻覚します。だからすべてのeeselの展開は、顧客に回答する前に過去チケットに対してシミュレーションを実行します。

サポートに関する重要な質問は「M3はSWE-Benchで何点を取ったか」ではありません。それは:実際のチケットとドキュメントから学習できるか、本番前に安全にテストできるか、誤った回答を自信を持って送ることを何が防ぐのか、です。これらはモデルの問題ではなく製品の問題であり、カスタマーサービス向けの最良のAIのまとめが中心に置いている問いです。

同じ点は、チャットボットが誤って回答するたびに浮かび上がり、AIエージェントのコストが人間と比べてどうかが、モデルのトークン単価よりもチケットをどれだけ確実に解決するかに大きく依存する理由でもあります。

eesel:モデルをサポートのチームメイトに変えるレイヤー

これがまさにeeselが埋めるために構築されたギャップです。モデルを選んで祈るよう求める代わりに、eesselはヘルプデスクの上にAIチームメイトとして座り、初日から過去チケット・ヘルプドキュメント・ツールから学習し、その後Tier-1の作業を下書き・トリアージ・解決する際に、安全に稼働させ続けるためのガードレールを維持します。

eesselのAIヘルプデスクダッシュボード。AIチームメイトが既存ツール全体でTier-1チケットを処理
eesselのAIヘルプデスクダッシュボード。AIチームメイトが既存ツール全体でTier-1チケットを処理

具体的な差別化要因はシミュレーションモードです:過去の実際のチケット数千件に対してエージェントを実行し、何を回答したか、どこにギャップがあるかを正確に確認し、それを埋めてからようやく本番稼働させます。信頼度ベースのルーティングにより、信頼度の低い回答は送信ではなく下書きとして扱われます。これが、SmabaのようなチームがZendeskエージェントを月間10万件以上のドイツ語チケットで完全自動化している方法であり、Gridwiseが初月に73%のTier-1解決率を達成した方法です。100以上のインテグレーションに接続し、80以上の言語で回答し、1チケットあたり$0.40の従量制料金でシート料金なしで動作します。

サポート向けのモデルを選ぶためにここに来たなら、より良い出発点はレイヤーであり、リーダーボードではありません。eesselを無料でお試しいただけます。クレジットカード不要で、1人の顧客にも触れる前に、シミュレーションで自分のチケットを解決する様子を見ることができます。私が機能を見てきたすべてのカスタマーサービスAI展開の背後にある同じ教訓です:モデルは交換可能、信頼性は交換不可能です。

よくある質問

MiniMax M3をわかりやすく説明すると?
MiniMax M3は、中国のAI研究所MiniMaxが2026年6月1日にリリースしたオープンウェイトの大規模言語モデルです。コーディングとエージェント作業向けに設計されており、最大100万トークンのコンテキストウィンドウを扱い、ネイティブマルチモーダル(テキスト、画像、動画)対応です。MiniMaxのAPIから呼び出すか、ウェイトをダウンロードして自分で実行できます。業界の全体像については、Qwen概要Kimi K2.5レビューもご覧ください。
MiniMax M3は本当にオープンソースですか?
厳密には違います。MiniMax M3はオープンウェイトであり、オープンソースではありません。ウェイトはダウンロード可能でMiniMax Community Licenseの下で提供され、非商用利用は無料ですが、商用利用には「Built with MiniMax M3」のクレジット表記が必要で、年間収益2,000万ドル超の場合は事前承認が必要です。真のMITリリースというよりも、他のオープンウェイトモデルのライセンスに近い形式です。
MiniMax M3の料金は?
MiniMaxはM3をToken Planとして月額$20(Plus)、$50(Max)、$120(Ultra)から提供しており、テキスト・画像・音声・音楽モデルが共通の使用プールを共有します。APIは入力長による課金で、512Kトークン超の呼び出しは高めの長文コンテキスト料金が適用されます。詳細は上記の料金セクションをご覧いただき、Claude Proの料金とも比較してください。
MiniMax M3はコーディングに向いていますか?
コーディングとエージェント作業においてオープンウェイトモデルの中で最も強力な選択肢の一つです。SWE-Bench Proで59.0%、Terminal-Bench 2.1で66.0%を達成し、Claude Code、Cline、OpenCodeなどのツールと連携できます。開発者からは価格帯に対してSonnetクラス程度との評価が多いです。コーディングアシスタントを選ぶ際は、AIコーディングアシスタントツールのまとめも参考にしてください。
MiniMax M3をカスタマーサポートに使えますか?
基盤モデルとして使用することはできますが、生のモデルだけではサポートエージェントにはなりません。実際のチケットを安全に回答するには、過去のチケットやドキュメントを追加するレイヤー、履歴に基づくシミュレーション、信頼度ベースのガードレールが必要です。それがeesselのAIヘルプデスクエージェントが提供するもので、どのモデルが動いていても関係ありません。失敗パターンについてはチャットボットが正しく回答しない理由をご覧ください。
MiniMax M3は100万トークンのコンテキストをどう処理しますか?
M3はMiniMax Sparse Attention(MSA)と呼ばれる新しいアテンション設計を使用しており、全体を一度に処理するのではなく、コンテキストの関連ブロックにのみ注目します。MiniMaxによると、これによりトークンあたりの計算量が約1/20に削減され、前モデルと比較して1Mトークン時のプリフィルが約9倍、デコードが約15倍高速化されるとのことです。技術的な詳細はM3技術レポートに記載されています。

Share this article

Alicia Kirana Utomo

Article by

Alicia Kirana Utomo

Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.

Related Posts

All posts →
Anthropic の最も強力な AI モデルである Claude Fable 5 で何ができるかを解説するガイドのための編集イラスト
AI models

Claude Fable 5 で何ができるのか?機能別の徹底ガイド

Claude Fable 5 で何ができるのか?数日間にわたり無人で稼働し、コードを書いてリリースし、100万トークンのドキュメントを読み、自分の成果を検証する。それが実務で何を意味するのかを解説します。

Riellvriany IndriawanRiellvriany IndriawanJun 17, 2026
Anthropicの最も強力なAIモデルであるClaude Fable 5の解説記事のための編集イラスト
AI models

Claude Fable 5とは?Anthropicの最も強力なモデルを解説

Claude Fable 5は、Opus 4.8の一段上に位置するAnthropicのMythosクラスのフラッグシップで、何日にもわたる自律的な作業のために作られています。何ができるのか、いくらかかるのか、そして落とし穴を解説します。

Alicia Kirana UtomoAlicia Kirana UtomoJun 17, 2026
MaxClawとは? MiniMaxのクラウドAIエージェントを解説のバナー画像
Blog Writer AI

MaxClawとは? MiniMaxのクラウドAIエージェントを解説

MiniMaxのクラウドホスト型AIエージェント、MaxClawをご紹介します。インフラストラクチャなしで10秒でデプロイできます。その機能、M2.5モデル、およびセルフホストの代替手段との比較について学びましょう。

Stevia PutriStevia PutriMar 6, 2026
Sakana Fugu:他のAIモデルのプールをオーケストレーションするAIモデル
AI

Sakana Fuguとは?他のAIモデルを指揮するAIモデル

Sakana Fuguは、単一のAPIを通じて他のAIモデルをオーケストレーションするAIモデルです。仕組み、コスト、そしてそのハイプが本物かどうかを解説します。

Alicia Kirana UtomoAlicia Kirana UtomoJun 23, 2026
開いたブリーフケースからドキュメント、スプレッドシート、メール、チャットメッセージがあふれ出し、AI のキャラクターがスコアカードでそれらを採点している
AI

AA-Briefcaseとは?実際のナレッジワーク向けAIベンチマークを解説

AA-BriefcaseはArtificial Analysisが開発した新しいベンチマークで、数週間にわたる実際のオフィスプロジェクトでAIをテストします。何を測定するのか、誰がトップなのか、そして仕事でのAI活用にとって何を意味するのかを解説します。

Alicia Kirana UtomoAlicia Kirana UtomoJun 22, 2026
ソーシャルメディアチャンネルがAI搭載のサポート受信トレイに統合されるイラスト
helpdesk

2026年のソーシャルメディアカスタマーサポートに最適なAIツール8選

Instagram、Facebook、X、WhatsApp、TikTok DMでソーシャルメディアサポートに最適なAIをテストしました。実際にチケットを解決するものと、返信を提案するだけのものを比較します。

Riellvriany IndriawanRiellvriany IndriawanJun 23, 2026
MacでワークフローをCodexに実演しながら、AIエージェントが再利用可能なスキルとして記録・再生している様子
AI news

OpenAI Codexの記録と再生機能、徹底解説

OpenAI Codexの記録と再生機能が実際に何をするのか:Macでワークフローを一度実演するだけで、Codexがそれを再利用可能なスキルに変換します。仕組み、制限事項、そして活用場面を解説します。

Alicia Kirana UtomoAlicia Kirana UtomoJun 22, 2026
2026年ITサポート向けAIツールベスト7まとめのイラストバナー
Customer Service

2026年のITサポート向けAIツール ベスト7

2026年のITサポート向けAIツール ベスト7を徹底調査しました。ServiceNow Now Assistからeeselまでを取り上げ、各ツールの実際のコストと適しているユーザー層を詳しく解説します。

Riellvriany IndriawanRiellvriany IndriawanJun 20, 2026
ラップトップとローカルサーバーで動作するGoogleのオープンウェイトAIモデルファミリー、Gemma 4のイラスト
AI

Gemma 4とは?GoogleのオープンAIモデルファミリーを解説

Gemma 4とは何か?GoogleのオープンウェイトAIモデルファミリーを解説:5つのサイズ、Apache 2.0ライセンス、ベンチマーク、そしてサポートチームへの意味。

Alicia Kirana UtomoAlicia Kirana UtomoJun 20, 2026

AIチームメイトを採用する準備はできましたか?

数分でセットアップ。クレジットカード不要。

無料で始める