インターコムのマルチモーダルAI、サポートにおける音声と画像:実践的な概要

Stevia Putri
Written by

Stevia Putri

Stanley Nicholas
Reviewed by

Stanley Nicholas

Last edited 2025 10月 28

Expert Verified

正直なところ、もはやカスタマーサポートはタイピングだけの仕事ではありません。AIの次なるステップは、スクリーンショットを通して問題を実際に見て理解したり、電話越しに顧客の問題解決をサポートしたりすることです。つまり、より迅速かつ自然に問題を解決することが求められています。

Intercomは最近、同社のAIエージェントであるFinに、まさにこれらの機能を備えた大幅なアップグレードを実施し、画像の理解や音声通話への対応を可能にしました。これは非常に画期的で、大きな前進です。しかし、これがサポートチームの日々の業務に具体的にどのような影響を与えるのでしょうか?

この記事では、誇大な宣伝文句を排し、Intercomの新機能について実践的な視点から解説します。新機能の内容を分析し、価格設定やセットアップといった現実的な課題を掘り下げ、さらに高度なAIを余計な制約なしに導入したいと考えている方向けに、より柔軟な代替案もご紹介します。

Intercomの音声・画像対応マルチモーダルAIサポートとは?

IntercomのAIの中核をなすのが、カスタマーサービス向けに構築されたエージェント、Finです。「マルチモーダル」という専門用語は、AIがテキストだけでなく、画像や音声といった複数の種類の情報を理解できることを意味します。これにより、より豊かな会話が可能になり、問題の根本原因をはるかに迅速に突き止められるようになります。

Fin Vision:顧客が見ているものをAIも見る

Fin Visionは、AIが画像を認識する機能だと考えてください。顧客がスクリーンショットや写真をアップロードすると、Finがそれを分析します。これにより、顧客は奇妙なエラーメッセージや壊れた部品について言葉で説明しようと苦労するかわりに、写真を撮って送るだけでよくなります。

例えば、顧客がアプリでエラーのポップアップに遭遇した場合、スクリーンショットを送ることができます。Fin Visionはその画像内のテキストを読み取り、参照番号を抽出し、何が問題なのかを特定します。顧客がすべてを再入力するという面倒なやり取りは不要になり、誰もがより早く解決策にたどり着けるのです。

Fin Voice:AIを電話応対へ

Fin Voiceは、同じAIの頭脳を電話応対に応用する機能です。その目標は、Finエージェントが自然で会話のような流れでサポートコールを処理できるようにすることです。会話の割り込みを理解し、複数の言語を話せるように設計されており、Intercomが市場の他のAI音声ツールと直接競合する位置づけにあることを示しています。

ただし、Fin Voiceはごく一部の顧客を対象としたまだ初期テスト段階にあるという点は注目に値します。つまり、まだ広く利用できる状態ではなく、完全に洗練されているわけでもない可能性があります。今日すぐにでも導入できる信頼性の高いソリューションを必要とするチームにとっては、これは導入の大きな障壁となり得ます。

隠れた課題

テクノロジー自体は素晴らしいものですが、それを実際にセットアップして運用するまでには、いくつかの大きな障害が伴います。導入を検討する前に、これらの点について知っておくべきです。

予測不能なコスト:重要な課題

IntercomのAIについてまず気づくことの一つが、価格設定でしょう。料金は**解決1件あたり0.99ドル**です。一見すると大した金額には見えないかもしれませんが、最終的な請求額はまったく予測できません。

考えてみてください。新製品を発売したり、大規模なマーケティングキャンペーンを実施したり、予期せぬサービス停止が発生したりしたらどうなるでしょうか?サポートの問い合わせ件数は急増し、それに伴って請求額も跳ね上がります。忙しい月には驚くほど高額な請求書が届く可能性があり、効果的な予算計画を立てることがほぼ不可能になります。これは、自社の成功が裏目に出てしまうような料金モデルなのです。

複雑なセットアップ:ナレッジベースへの依存

ここが落とし穴です。Finはナレッジベースの質に大きく依存します。ヘルプ記事が古かったり、重要な情報が欠けていたり、あるいは単に分かりにくかったりすると、AIはうまく機能しません。間違った回答をしたり、結局はチームにチケットをエスカレーションしたりすることになり、本来の目的が達成できなくなります。これにより、完璧なドキュメントを常に維持しなければならないという大きなプレッシャーがかかります。

さらに、導入はクリック一つで完了するような簡単なプロセスではありません。IntercomはZendeskやSalesforceのようなプラットフォームと連携できますが、適切に設定するには時間と労力がかかります。また、Confluenceの社内wikiやGoogleドキュメントに保管されている業務マニュアルなど、チームの実際の知識が存在する他のすべての場所と簡単には連携できません。

Intercomの音声・画像対応マルチモーダルAIサポートに様々なナレッジソースを接続するためのインターフェースのスクリーンショット。セットアップの複雑さが強調されている。
Intercomの音声・画像対応マルチモーダルAIサポートに様々なナレッジソースを接続するためのインターフェースのスクリーンショット。セットアップの複雑さが強調されている。

限定的なコントロールとリスクの高い導入

前述の通り、Fin Voiceのような主要機能はまだクローズドベータ段階にあります。これは、今すぐに安定して信頼できるツールを必要とする企業にとって、多くの不確実性を生み出します。

さらに悪いことに、AIを顧客対応に導入する前に、自社のデータでAIがどのように機能するかを簡単にテストする方法がありません。先月のチケットをどのように処理したかを確認して、その精度を測ることはできないのです。基本的には、スイッチを入れてうまくいくことを祈るようなもので、これはかなり大きな賭けです。このようなオールオアナッシングのアプローチでは、AIに業務を任せる前に、徐々にシステムに慣れて信頼を築いていくということができません。

価格モデルの解説

コストを正しく理解するためには、具体的な数字を見てみるのが一番です。Intercomの価格設定は、Intercomのプラットフォーム全体を利用しているか、既存のヘルプデスクにFin AIだけを追加しているかによって異なります。

IntercomプラットフォームでFinを利用する場合、プランに応じてエージェントごとに月額料金を支払う必要があります。それに加えて、AIが処理したすべての解決案件ごとに0.99ドルを支払います。

既存のヘルプデスク(Zendeskなど)でFinを利用する場合は、シート料金はかかりませんが、やはり解決1件あたり0.99ドルの料金が発生します。そして、利用の有無にかかわらず、毎月最低50件分の解決料金を支払う必要があります。

以下は、Intercomの主なプラットフォームプランの概要です。

プランシートあたりの月額料金(年払い)解決ごとの料金主な機能
Essential29ドル0.99ドル個人および小規模ビジネス向け
Advanced85ドル0.99ドルワークフロー自動化を含む
Expert132ドル0.99ドルSSOおよびマルチブランド対応を含む

また、アドオンの可能性も忘れてはいけません。人間のエージェント向けのIntercom Copilotは、エージェント1人あたり月額29ドルの追加料金がかかり、Proactive Support Plusアドオンはさらに月額99ドルです。これらのコストはあっという間に積み重なり、当初はシンプルに見えたソリューションが大きな出費に変わる可能性があります。

詳細については、公式のIntercom価格ページをご覧ください。

eesel AI:よりシンプルで強力な代替案

これらが少し面倒に聞こえるなら、その感覚は間違いではありません。予測不能なコストや複雑なセットアップなしでAIのメリットを享受したいチームのために、別の考え方があります。そこで登場するのがeesel AIです。IntercomのFinのようなツールが抱える課題を解決するために特別に構築されています。

自分でできるセットアップで数分で利用開始

Intercomが必要とする複雑で時間のかかるセットアップとは異なり、eesel AIは最初から直感的に使えるように設計されています。ZendeskFreshdesk、あるいはIntercom自体であっても、既存のヘルプデスクをワンクリックで接続できます。

プロセス全体がセルフサービスです。自社に合うかどうかを判断するためだけに、必須の営業電話や長時間のオンボーディングセッションを受ける必要はありません。サインアップし、ツールを接続し、AIエージェントをほんの数分で、すべて自分自身で稼働させることができます。これは、あなたの時間を尊重し、最初から主導権をあなたに与えるアプローチです。

リスクフリーのシミュレーションで安心してテスト

Intercomの「オールオアナッシング」のリスクの高い導入方法を覚えていますか?eesel AIは、強力なシミュレーションモードでその問題を解決します。AIが一人でも顧客と話す前に、安全な環境で自社の過去のチケット何千件分もを使ってテストすることができます。

これにより、AIがどのように機能するか、どのような質問に対応できるか、そしてナレッジベースにどこにギャップがあるかを正確に把握できます。シミュレーションは、解決率と潜在的なコスト削減額の正確な予測を提供し、憶測を一切排除するため、完全な自信を持って導入を開始できます。

ヘルプセンターだけでなく、すべてのナレッジを統合

IntercomのAIが完璧なヘルプセンターにほぼ全面的に依存しているのに対し、eesel AIは、企業の本当の知識は様々な場所に散在していることを理解しています。そして、そのすべてに即座に接続し、学習することができます。

ConfluenceGoogleドキュメントNotionなどから簡単に知識を取り込むことができます。しかし、本当の魔法は、eesel AIが過去のチケットから自動的に学習できる点にあります。つまり、初日からあなたのAIエージェントは、よくある問題をすでに理解し、ブランドのトーンを把握し、あなたのチームがこれまで何千回も提供してきた成功した解決策から学んでいるのです。

予測可能で透明性の高い価格設定で常に管理

そして、価格設定です。Intercomの予測不能な解決1件あたり0.99ドルという料金ではなく、eesel AI月額固定料金を採用しています。解決ごとの料金は一切ありません。

請求額は毎月同じなので、忙しい週があったからといってペナルティを受けることはありません。この予測可能性により、予算の暴走を心配することなくサポートを拡大できます。また、eesel AIはいつでもキャンセル可能な柔軟な月額プランを提供しており、多くの競合他社が求める長期の年間契約よりもはるかに低いコミットメントで始められます。

Pro Tip
eesel AIのようなツールを使えば、スモールスタートが可能です。まずは「注文はどこにありますか?」といった、単純で反復的なチケットタイプを1つ選んで自動化してみましょう。その効果を確認し、影響を測定し、快適になってきたら徐々にAIの責任範囲を広げていきます。しかも、その間、請求額は1セントも変わりません。

アプローチが重要な理由

Intercomが音声と画像の機能を追加したことは、業界にとって大きな出来事です。これは、AIがより複雑な会話を処理し、サポートをより速く、より人間らしく感じさせる未来を示唆しています。

しかし、これらの華やかな機能の実際の価値は、コスト、セットアップ、コントロールといった実用的な要素に左右されます。予測不能な価格モデルは予算を破綻させる可能性があり、難しいセットアップはチームの時間を消耗させ、適切なテストなしでの導入は単にリスクが高いだけです。

ほとんどのチームにとっては、より堅実で実践的なアプローチのほうが理にかなっています。eesel AIのようなプラットフォームは、まさにそれを提供します。すでに使用しているツールと連携する強力で最新のAIを提供し、自動化の主導権をあなたに与え、チケット数ではなくビジネスの成長に合わせてスケールする予測可能な価格を提供します。

既存のヘルプデスクで高度なAIエージェントを稼働させることがいかに簡単か、見てみませんか?**eesel AIを無料でお試しいただくか、デモを予約**して、シミュレーションモードを実際に体験してください。

よくある質問

IntercomのFin AIは、テキストだけでなく、画像(Fin Vision)や音声(Fin Voice)といった複数の種類の入力を処理・理解できるようになりました。「マルチモーダル」とは、このAIが複数の形式のデータに対応し、より豊かで迅速なカスタマーサービス対話を実現できることを意味します。

Fin Visionコンポーネントが、アップロードされた画像やスクリーンショットを分析します。これにより、AIはエラーメッセージを読み取ったり、製品の問題を特定したり、視覚的な手がかりを写真から直接理解したりできるため、顧客がテキストで問題を説明する必要性が減ります。

Fin Voiceは現在、ごく一部の顧客のみが利用できる初期テスト段階にあります。これは、まだ一般向けに広く提供されておらず、完全に洗練された状態ではないことを意味し、即時かつ安定したソリューションを必要とするチームにとっては懸念材料となる可能性があります。

IntercomのAIは解決1件あたり0.99ドルが課金されるため、サポート量に応じて月々の請求額が予測不能になります。これは多くの場合、Intercomプラットフォームの月額シート料金に上乗せされるため、予算編成が困難になります。

このAIは、包括的でよく整備されたナレッジベースに大きく依存します。ヘルプ記事が古かったり不明確だったりすると、Finはうまく機能せず、誤った回答をしたり、人間のエージェントへのエスカレーションを増加させたりする可能性があります。

ブログ記事によると、本番環境に導入する前に、自社の過去のデータでAIのパフォーマンスを徹底的にテストする簡単な方法はありません。これは、チームがAIを直接導入しなければならないことが多く、内在的なリスクを伴う「オールオアナッシング」の展開になることを意味します。

この記事を共有

Stevia undefined

Article by

Stevia Putri

Stevia Putri is a marketing generalist at eesel AI, where she helps turn powerful AI tools into stories that resonate. She’s driven by curiosity, clarity, and the human side of technology.

今すぐ無料で
始めましょう。