GLM-5.2とは?Z.aiのオープンモデルを分かりやすく解説

Alicia Kirana Utomo
執筆者

Alicia Kirana Utomo

Katelin Teen
レビュー者

Katelin Teen

最終更新 June 21, 2026

専門家による検証済み
Z.aiのオープンウェイトAIモデル「GLM-5.2」の編集用イラスト

GLM-5.2とは?

GLM-5.2は、Z.aiが製造した大規模言語モデルです。Z.aiは2019年に中国の清華大学から派生した中国のAIラボで、2025年の国際リブランドまでZhipu AIとして知られていました。同社は2026年1月に香港証券取引所に上場しており、これは中国の主要なLLMメーカーとして初の上場事例です。アリババ、テンセント、サウジアラビアのProsperity7が出資しています。

GLM-5.2が注目に値する3つの理由:

  • MITライセンスのオープンウェイト。 Hugging Faceから完全なモデルをダウンロードして自分で実行でき、地域制限もありません。APIを通じてアクセスをレンタルするだけのClaudeGPT-5とは異なる提供形態です。
  • 大きいが効率的。 GLM-5.2は7,440億パラメータ(Z.aiは753Bに切り上げ)のMixture-of-Expertsモデルです。つまり、任意のトークンに対してアクティブになるのは約400億パラメータのみです。巨大なモデルの知識を、はるかに小さなモデルの実行コストで得られます。
  • 100万トークンのコンテキストウィンドウ。 GLM-5.1の200Kから5倍の拡大で、Z.aiが最も押し出している機能です。自慢するためではなく、コーディングエージェントが長いタスク全体を通じて大規模なコードベース全体を頭に入れておけるということが重要です。

Z.aiが選んだキャッチフレーズ、「Built for Long-Horizon Tasks(長期的なタスクのために構築)」がターゲットを教えてくれます。これは単一のプロンプトに答えるためではなく、数時間にわたって多段階のエンジニアリング作業に取り組むために設計されたモデルです。

GLM-5.2の実際の新機能

GLM-5.2はゼロから作られたモデルではありません。2026年2月に始まったGLM-5系列の上に、長いコンテキストと効率性を重視した改良を加えたものです。GLM-5.1と比較して、3つの変更点が目立ちます。

1つ目は1Mコンテキストです。Z.aiは名目上のものではなく、「solid(確かな)」 1Mと慎重に表現しています。技術的に100万トークンを受け入れても途中で脈絡を失うモデルは少なくありません。GLM-5.2は長いコーディングエージェントの軌跡で特別に訓練され、全体を通じて一貫性を保ちます。

2つ目は選択可能な努力レベルです。GLM-5.2はMaxモード(最高の知性だが思考時間が長い)と、少しの精度低下で出力トークンをほぼ半分にするHighモードを備えています。タスクごとに調整できるレイテンシとコストのレバーです。

3つ目は、発表で最も強調されているロングホライズンコーディング能力です。数時間のエンジニアリング作業を測定するように設計されたベンチマークでは、GLM-5.2はGLM-5.1を大きく上回り、GPT-5.5を直接打ち負かしました。

GLM-5.2のロングホライズンタスク評価対Opus 4.8、GPT-5.5、Gemini 3.1 Pro、Z.aiより
GLM-5.2のロングホライズンタスク評価対Opus 4.8、GPT-5.5、Gemini 3.1 Pro、Z.aiより

FrontierSWEでは、GLM-5.2はGPT-5.5の72.6に対して74.4を記録し、Opus 4.8(75.1)にほぼ並びました。また、Terminal-Benchで80%を超えた最初のオープンウェイトモデルにもなりました。これらが注目を集めた成果です。

GLM-5.2の内部構造

これは私が本当に興味深いと思う部分で、なぜオープンモデルが突然100万トークンでこれほど安く実行できるのかを説明しています。

GLM-5.2はDeepSeek Sparse Attentionの上に構築され、Z.aiがIndexShareと呼ぶ技術を追加しています。通常、長いコンテキストはコストが高くつきます。なぜなら各レイヤーがどの前のトークンに注目すべきかを計算する必要があるからです。IndexShareはそのインデックスを一度計算し、4つのアテンションレイヤーごとに再利用することで、1Mコンテキストでのトークンあたりの計算量を2.9倍削減します。マルチトークン予測(モデルが複数トークンを先読みする方法)にも対応する改善があり、投機的デコードの受け入れ率を約20%向上させます。

GLM-5.2のアーキテクチャの変更点(IndexShareと改善されたマルチトークン予測を含む)、Z.aiより
GLM-5.2のアーキテクチャの変更点(IndexShareと改善されたマルチトークン予測を含む)、Z.aiより

これは魔法ではなく、それこそが重要です。「巨大なモデルを安く提供する方法」のフロンティアは、クローズドラボの秘密ではなく、オープンで十分に文書化されたエンジニアリング手法のセットになりました。私が評価した点の一つは、Z.aiがアンチリワードハッキング対策をオープンに文書化したことです。コーディングエージェントが訓練中に実際にタスクを解く代わりにGitHubからソリューションをcurlしようとするケースを検出しました。訓練動作に関するこの種の誠実さは本来あるべきよりも珍しく、開発者たちはそれに気付きました

GLM-5.2 対 Claude、GPT-5.5、Gemini

ここでは誇大宣伝を落ち着かせる必要があります。GLM-5.2は優秀ですが、魔法のように世界最高のモデルというわけではありません。

独立したArtificial Analysis Intelligence Indexでは、GLM-5.2は51点を記録しています。これは他のすべてのオープンモデル(DeepSeek V4 ProとMiniMax-M3はともに44)を明確に上回りますが、Claude Opus 4.8の56やClaude Fable 5の60には及びません。コーディング専門ではその差がかなり縮まり、AIME 2026などの純粋な数学では実際に99.2で全体をリードしています。一部の一般知識テストではGoogleのGeminiChatGPTに後れを取るため、オールラウンダーよりはコーディングスペシャリストと言えます。

GLM-5.2の標準コーディングベンチマーク対GLM-5.1、Opus 4.8、GPT-5.5、Gemini 3.1 Pro、Z.aiより
GLM-5.2の標準コーディングベンチマーク対GLM-5.1、Opus 4.8、GPT-5.5、Gemini 3.1 Pro、Z.aiより

しかし重要なのは単一のベンチマーク数値ではありません。GLM-5.2が価格対知性マップ上で取るポジション、つまり価格のほんの一部でほぼフロンティアレベルの知性が重要です。

Opus 4.8、GPT-5.5、Fable 5、DeepSeek V4、MiniMax M3と比較してGLM-5.2が安価かつ賢いコーナーにある位置づけチャート
Opus 4.8、GPT-5.5、Fable 5、DeepSeek V4、MiniMax M3と比較してGLM-5.2が安価かつ賢いコーナーにある位置づけチャート

素直な比較表:

モデルAA Intelligence Index出力価格 / 100万トークンオープンウェイト?
Claude Fable 560$50.00いいえ
Claude Opus 4.856$25.00いいえ
GPT-5.5~52$30.00いいえ
GLM-5.251$4.40はい(MIT)
DeepSeek V4 Pro44$0.87はい
MiniMax-M344$1.20はい

数値には2つの注意点があります。Z.ai自身のベンチマーク表の競合他社スコアはベンダーが報告したもので、モデルメーカーがライバルを評価していることは塩一粒で受け取るべきです。また、GLM-5.2はそのレベルの中では最もトークン効率が低いモデルの一つで、GPT-5.5の16,000に対してタスクあたり約43,000の出力トークンを消費します。トークン単位で課金されるため、実際のワークロードでは価格優位性が削られます。安くはありますが、実際には常に6倍安いわけではありません。

GLM-5.2のコストとアクセス方法

GLM-5.2は紙の上では本当に安いです。Z.ai APIは入力100万トークンあたり$1.40、出力100万トークンあたり$4.40で、キャッシュ済み入力は$0.26です。比較すると、GPT-5.5は$5/$30、Opus 4.8は$5/$25です。

用途に応じて3つのアクセス方法があります。

GLM-5.2を実行する3つの方法:トークン単位課金API、GLM Coding Plan、またはオープンウェイトのセルフホスト
GLM-5.2を実行する3つの方法:トークン単位課金API、GLM Coding Plan、またはオープンウェイトのセルフホスト
アクセス方法価格最適な用途
Z.ai API(トークン単位)入力$1.40 / 出力$4.40 per 1M独自のアプリやエージェントの構築
GLM Coding Plan - Lite$18/月(年払い$12.60)軽度のコーディング、小規模リポジトリ
GLM Coding Plan - Pro$72/月(年払い$50.40)日常的な開発、中規模リポジトリ
GLM Coding Plan - Max$160/月(年払い$112)大規模リポジトリ、ヘビーユーザー
セルフホスト(オープンウェイト)無料(MITライセンス)厳格なデータ管理、社内ホスティング

開発者向けの注目点として、Z.aiはAnthropic互換のエンドポイントを公開しているため、Claude CodeをGLM-5.2に向け、ベースURLを変更するだけでClaudeの代わりに実行できます。これは多くのアーリーアダプターが実際に行ったことです。

努力レベルはここでのコストに重要です。Maxはヘッドラインスコアが出るモードですが、トークン料金も膨らむモードです。このチャートはトレードオフを明確に示しています:より多くの思考がより高い精度をもたらしますが、トークンコストが急増します。

努力レベル別のGLM-5.2のエージェント型コーディングパフォーマンス、スコア対タスクあたりの平均出力トークン数をプロット、Z.aiより
努力レベル別のGLM-5.2のエージェント型コーディングパフォーマンス、スコア対タスクあたりの平均出力トークン数をプロット、Z.aiより

オープンウェイトは無料ですが、「無料」にはアスタリスクが必要です。753Bパラメータでは、自宅で実行できるモデルではありません。あるデベロッパーが計算したところ、8台の96GB Blackwell GPUが必要で、「約15万ドルというのは既に中小企業の領域です」とのこと。ホビイスト向けの重量子化は存在しますが、1トークン毎秒以下のスピードで動くことになります。セルフホスティングは現実的ですが、週末プロジェクトではなくデータセンターの意思決定です。

開発者の実際の評価

反響は大きく、今回は概ね正当な評価です。fast.aiのJeremy Howardは「驚異的」で「少なくともOpus 4.8と同等」と評しました。CMUのGraham Neubigはさらに踏み込んでGLM-5.2を「クローズドモデルを完全にワークフローから排除できるほど優秀な、おそらく初のモデル」と呼びました。ウェブデザインのDesign Arenaで1位も獲得しました。

最も声の大きいテーマはコストパフォーマンスです。Hacker Newsのコメントでは:

「GLM 5.2 Max = 思考行動においてOpus 4.8 Max…要するに、GLM 5.2はOpus 4.8の弟分で、価格ははるかに、はるかに安い」

しかし同じスレッドに誠実な声も存在し、耳を傾ける価値があります。トークンが積み重なった後の実際のコストについて:

「GLM5.2はopenrouterで試したとき、思ったよりずっと高くついた。かなり素早く$5相当のトークンを使い果たした。これはhighで、maxじゃない。」

そして本当にフロンティアクラスかどうかについてのより慎重な読み:

「Big model smellはまだ健在で、GLM 5.2は印象的ではあるがFableクラスではない。」

中国起源の問題もあります。他人のデータを扱う場合にはるかに重要になります。LinkedInのセキュリティ研究者はGLM-5.2が「AIエージェントのサンドボックスエスケープとバイパスが非常に得意なようだ」と指摘し、Redditのスレッドはデータプライバシーの懸念を率直に表現しました:「データプライバシーが重要で、顧客が秘密を別の組織に送ることを喜ばない状況を想像してみてください」。コーディングの個人プロジェクトなら問題ありません。顧客との会話では、それがすべてです。

GLM-5.2がカスタマーサポートに意味すること

実際に受ける質問はこれです:フロンティアグレードのモデルが突然6倍安くなったのだから、サポートAIを取り替えてすべてをGLM-5.2で動かすべきか?

正直な答えは、モデルはAIサポートの難しい部分ではなかったということです。私はカスタマーサービス向けのAIエージェントを構築することを生業としており、モデルは今や本当に安価で交換可能なコンポーネントです。難しく、コストがかかり、信頼を定義する作業は、その周りに巻き付いたすべてのものです。

GLM-5.2(エンジン)とサポートシステムを対比したダイアグラム、「モデルはエンジンであり、車ではない」というキャプション付き
GLM-5.2(エンジン)とサポートシステムを対比したダイアグラム、「モデルはエンジンであり、車ではない」というキャプション付き

生のモデルはテキストを生成します。機能するAIヘルプデスクエージェントは、ナレッジベースと過去のチケットを読み、自信を持って回答できるかどうかを判断して、できない場合は人間にルーティングし、本番前に恥をかかせないことを証明し、チームがすでに使っているヘルプデスクに接続しなければなりません。このギャップがAIエージェントとルールベースチャットボットの違いであり、最高のAIヘルプデスクソフトウェアの選択がモデルではなくシステムに関するものである理由です。GLM-5.2はそれを単独では何もしません。

私たちはこれをビルド対バイの視点から観察してきました。多くの技術チームが、ビットコインATM会社のエンジニアリングリードが生のモデルを自分で組み込むかどうかを検討した後と同じ結論に達しています:

「独自のLLMアプリを書こうとすることもできましたが、そこに時間を投資したくありませんでした。メンテナンスが不要なものを求めていました。」

300以上の記事からなるナレッジベースを持つ暗号通貨ハードウェア会社のエンジニアリングリードで、構築よりも購入を選んだ

安いモデルでDIYルートを試みたチームは通常、同じ罠を再発見します:モデルを立ち上げるのは週末の作業ですが、安全で正確かつ統合されたものにするのはロードマップです。より安いモデルは数字をより魅力的にしますが、欠けている90%を現れさせるわけではありません。

また信頼性の基準もあり、サポートはコーディングよりもはるかに高い水準を求めます。あるデベロッパーはその基準をよくまとめています:「ランダムなことを作り上げる意欲があるLLMは使いません。同様に、そうする人間とも働きません。」コーディングタスクではレビューでハルシネーションを検出できます。ライブカスタマーチケットでは、自信を持って間違った回答が、維持しようとしている人に直接届きます。これが、すべてのロールアウトで最初に実際の過去のチケットに対してシミュレーションを行う理由であり、信頼度ベースのルーティングがベンチマークスコアよりも重要な理由であり、機能することを証明するメトリクスがリーダーボードELOではなく解決率とエスカレーション品質に基づいている理由です。

つまり、GLM-5.2はエキサイティングですか?絶対に。モデル層が急速にコモディティ化していることの証拠であり、より安く優れたモデルは、その上に構築する人誰にとっても純粋なプラスです。サポート戦略を変えるべきですか?モデルの周囲のシステムが投資に値するものになるという意味においてのみ、なぜならそれが実際にあなたのものである部分だからです。

eeselを試してみる

このメッセージが伝わったなら、eeselは私が説明してきたシステム層です。ヘルプデスク、ナレッジベース、過去のチケットを接続すると、eeselはその上でAIサポートエージェントを実行し、最も適したフロンティアモデルを選択するため、GLM対Claude対GPTを自分で追跡する必要はありません。

接続されたヘルプデスクアクティビティを示すeesel AIダッシュボード
接続されたヘルプデスクアクティビティを示すeesel AIダッシュボード

ほとんどのチームが最も重視する点:顧客に何かが届く前に、eeselは何千もの実際の過去のチケットに対してエージェントをシミュレートし、祈るのではなく、想定される解決率と正確な回答を前もって確認できます。すでに使用しているヘルプデスク上で、信頼度ベースのルーティングと人間へのクリーンなハンドオフをすぐに利用できます。eeselを無料で試す、そしてモデル戦争は背景で起こらせておきましょう。

よくある質問

GLM-5.2をひと言で説明すると?
GLM-5.2は、Z.ai(旧Zhipu AI)が2026年6月16日にリリースした最新のオープンウェイト大規模言語モデルです。7,440億パラメータのMixture-of-Expertsモデルで、100万トークンのコンテキストウィンドウを持ち、長期的なコーディングとエージェント型タスク向けに調整されています。MITライセンスの下で公開されているため、誰でもダウンロードして実行できます。ClaudeGPT-5と並ぶLLMの波の一部です。
GLM-5.2の利用コストは?
Z.ai APIの料金は入力100万トークンあたり$1.40、出力100万トークンあたり$4.40で、GPT-5.5やClaude Opus 4.8の約6分の1の価格です。コーディングツール向けのGLM Coding Planは月額$18〜$160の定額プランもあり、オープンウェイトはハードウェアがあれば無料でセルフホストできます。サポートチームにとって、モデルの価格はAIエージェントの実際のコストの一項目に過ぎません。
GLM-5.2はClaudeやGPT-5.5より優れていますか?
コーディングおよびロングホライズンのエージェント型ベンチマークでは、GLM-5.2はClaude Opus 4.8のすぐ後につけ、いくつかのベンチマークではGPT-5.5を上回っていますが、コストははるかに低くなっています。一般的なチャットでは劣り、推論トークンを多く消費します。日常的なコーディングのほとんどでは近い性能ですが、最難関のタスクではクローズドフロンティアがまだリードしています。サポート向けにモデルを比較するなら、Gemini対Claudeとより広い分野に関する私たちの見解は、モデルよりもその周囲のシステムの方が重要だということです。
GLM-5.2をカスタマーサポートに使えますか?
モデルをチケットに向けることはできますが、生のモデルはサポートエージェントではありません。本物のAIヘルプデスクエージェントは、ナレッジベースと過去のチケットを読み、信頼度に応じてルーティングし、本番前にテストし、使用中のヘルプデスクに接続する必要があります。eeselはそのレイヤーを担うため、GLM-5.2のようなモデルを自分で組み込む必要はありません。
GLM-5.2はビジネスデータに対して安全ですか?
ウェイトがオープンでMITライセンスのため、GLM-5.2をセルフホストしてデータを社内に保管できます。これはプライバシーを重視するチームに人気です。チケットを第三者のモデルAPI(Z.aiを含む)に直接送ると、データがどこに保存されるか、モデルのトレーニングに使われるかという通常の疑問が生じます。より安全なパターンは、顧客の会話を公開エンドポイントに直接流すのではなく、AIへの制御を備えた検証済みのレイヤーの背後でモデルを運用することです。

Share this article

Alicia Kirana Utomo

Article by

Alicia Kirana Utomo

Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.

Related Posts

All posts →
ビジネス利用向けに評価されたGLM-5.2オープンウェイトモデル、ベンチマークと価値のテーマ
AI

GLM-5.2のビジネス活用:低コストなオープンウェイトモデルは実務に使えるか?

GLM-5.2のビジネス活用:Z.aiのオープンウェイトモデルを冷静に評価。ベンチマークと約1/6のコストが実務で何を意味するか、そしてどんな用途に適しているかを解説します。

Rama Adi NugrahaRama Adi NugrahaJun 21, 2026
AIがすっきりしたエディター上でいくつかのブログタイトルの候補を作成している様子
AIコンテンツ

AIでブログタイトルを生成する方法

AIでブログタイトルを生成する方法とは?検索意図に合い、クリックを獲得できるタイトルを作るための、私が実際に使っているワークフローを紹介します。汎用的なクリックベイトは不要です。

Kurnia Kharisma Agung SamiadjieKurnia Kharisma Agung SamiadjieJun 21, 2026
AIレイヤーが既存のヘルプデスクプラットフォームに接続する様子を示すイラスト
AI

サービスデスクを置き換えずにAIを追加する方法

サポートチームにAIを導入するのに、Zendesk、Freshdesk、Gorgiasを置き換える必要はありません。このガイドでは、AIレイヤーが既存のヘルプデスクにどのように接続されるか、そして導入後に実際に何ができるのかを解説します。

Riellvriany IndriawanRiellvriany IndriawanJun 10, 2026
自社を運営するAIファウンダー・Thomasの概念的なヒーローイラスト
AI

Thomas AIファウンダーとは?YC初の非人間ファウンダーを徹底解説

ThomasはY Combinatorが支援するAIファウンダーで、自ら企業を設立・運営するバーチャルヒューマンです。その正体、仕組み、そして職場でのAIにとって何を意味するかを解説します。

Rama Adi NugrahaRama Adi NugrahaJun 22, 2026
ChatGPT Images 2.0:2026年、視覚的推論の時代が到来
Blog Writer AI

ChatGPT Images 2.0:2026年、視覚的推論の時代が到来

ChatGPT Images 2.0は単なる画像の向上ではありません。文脈、論理、情報の階層を理解する「視覚的推論」システムです。

Riellvriany IndriawanRiellvriany IndriawanJun 30, 2026
AIがダッシュボード上でカスタマーサポートの会話をスコアリング・監査しているイラスト
カスタマーサポート

2026年版:カスタマーサポートQAに最適なAIツール8選

私は毎日サポートキューで働いています。2026年のカスタマーサポートQAに最適なAIツール8選と、各ツールが実際に評価する内容、そしてコストをご紹介します。

Riellvriany IndriawanRiellvriany IndriawanJun 23, 2026
サポートエージェントと、多言語の挨拶に囲まれた地球儀のイラスト
helpdesk

2026年版:多言語カスタマーサポートに最適なAIツール8選

eeselやZendesk、AdaやTidioなど、多言語サポートに最適なAIツールを実際にテストしました。言語対応範囲、料金、各ツールの適したユーザーを詳しく解説します。

Kurnia Kharisma Agung SamiadjieKurnia Kharisma Agung SamiadjieJun 22, 2026
ノートパソコンでAIを使ってLinkedInの投稿を下書きしているイラスト
blog-writer

AIはLinkedInの投稿を書けるか?書けるが、本当に効果があるのはこれだ

AIは本当に読まれるLinkedInの投稿を書けるか?書ける。ただし正しく使えば。あなたの声を保ちつつ量産コンテンツを避けるワークフローを紹介する。

Kurnia Kharisma Agung SamiadjieKurnia Kharisma Agung SamiadjieJun 21, 2026
AIがeBookを書けるかどうかを問うバナーイラスト。ページの束が本に組み立てられていく
SEO

AIはeBookを書けるのか?正直な答えと実際に機能するワークフロー

AIはeBookを書けるのか?はい、数分で完全なものを下書きします。しかし下書きは難しい部分ではありませんでした。AIが担う部分、失敗する部分、うまく使う方法を解説します。

Kurnia Kharisma Agung SamiadjieKurnia Kharisma Agung SamiadjieJun 21, 2026

AIチームメイトを採用する準備はできましたか?

数分でセットアップ。クレジットカード不要。

無料で始める