
もしあなたがAIエージェントを構築しているなら、OpenAIのChatKitが目に留まったことでしょう。これは、フロントエンドの開発作業を大幅に削減してくれるはずの、あらかじめ構築されたチャットUIです。そして、表面的には素晴らしく見えます。
問題点は?これを安全に機能させるには、ChatKit Session APIを使ったバックエンドでの面倒な作業が大量に発生するということです。
このガイドでは、ChatKitとは何か、そのセッションAPIが実際にどのように機能するのかを解き明かし、導入を決定する前に知っておくべき隠れた複雑さを掘り下げます。また、特にカスタマーサポートのような用途において、より統合されたプラットフォームがビジネスにとってより適している理由も見ていきます。
OpenAIのChatKitとChatKit Session APIとは?
では、ChatKitとは一体何なのでしょうか?AIエージェントのフレンドリーな「顔」と考えてください。これはOpenAIが提供するJavaScriptライブラリで、あなたのアプリに直接埋め込むことができるカスタマイズ可能なチャットウィンドウを提供します。
チャットインターフェースをゼロから構築する(そしてメッセージ履歴、ストリーミング応答、ファイルアップロードといったあらゆる頭痛の種に対処する)代わりに、彼らのウェブコンポーネントを使うだけで済みます。これは、OpenAIのAgent Builderで構築したAIワークフローに接続するように設計されています。
ここでのポイントは、エージェントの「顔」(UI)ではなく「頭脳」(ロジック)に集中できるようにすることです。社内のヘルプボットから顧客向けのサポートまで、あらゆる種類の用途に便利です。しかし、これから見ていくように、その美しいUIをアプリに安全に接続するところからが本当の作業の始まりであり、それはすべてChatKit Session APIによって処理されます。
ChatKit Session APIの仕組み
さて、核心に迫りましょう。ChatKit Session APIは、基本的にあなたのチャットウィジェットのセキュリティガードです。もちろん、秘密のOpenAI APIキーをフロントエンドのコードに貼り付けるわけにはいきません。それは大惨事を招くだけです。代わりに、ChatKitはサーバーサイドの認証フローを使用して一時的なトークンを作成することを強制します。これにより、あなたのウェブサイト上の本物の、承認されたユーザーだけがAIエージェントと話せるようになります。
ChatKit Session APIの認証フロー解説
チャットバブルが画面に表示される前に、ユーザーのブラウザ、あなたのサーバー、そしてOpenAIのサーバー間でちょっとしたやり取りが行われる必要があります。以下にそのステップバイステップの内訳を示します。
-
ブラウザが許可を求める: あなたのウェブサイトのフロントエンドがバックエンドサーバーに「チャットを開始するためのトークンが必要です」とリクエストを送ります。
-
あなたのサーバーがOpenAIと通信: バックエンドがリクエストを受け取ります。次に、秘密のAPIキーを使用して、OpenAI APIに対してセキュアなサーバー間呼び出しを行い、新しいChatKitセッションを作成します。
-
OpenAIが一時キーを返す: OpenAIのAPIは、短命の「client_secret」を生成し、あなたのサーバーに返送します。
-
キーがブラウザへ渡される: バックエンドは、この一時キーをユーザーのブラウザに渡します。ブラウザはそれを使ってChatKitコンポーネントを起動し、チャットウィンドウが表示されます。
このプロセス全体は、あなたの主要なOpenAI APIキーをサーバー上で安全に保つために設計されています。
ChatKit Session APIのために構築する必要がある主要コンポーネント
これを実現するためには、単にスニペットをコピー&ペーストするだけでは済みません。3つの別々のインフラストラクチャを構築し、管理する必要があります。
-
エージェントワークフロー: まず、実際のエージェントが必要です。OpenAIのAgent Builderでワークフローを設計し、公開する必要があります。これにより、後で必要になる一意のID(「wf_...」のような形式)が得られます。
-
バックエンドエンドポイント: これが最も重要です。独自のバックエンドAPIエンドポイント(「/api/chatkit/session」のようなもの)を構築し、ホストする責任があります。このサーバーにOpenAI APIキーを安全に保存し、トークン交換を処理するロジックを記述します。
-
フロントエンド実装: 最後に、ChatKitのJavaScriptをサイトに追加し、新しいバックエンドエンドポイントを呼び出すコードを書き、それが送り返すトークンを使って実際にチャットウィジェットを表示する必要があります。
この設定は、「単純な」チャットウィジェットのためでさえ、あなたがフロントエンドとバックエンドの両方のコードを管理・デプロイするフルスタック開発者になることを意味します。これは、オールインワンのソリューションにはない複雑さの層を追加します。
ChatKit Session APIの課題と限界
ChatKitはフロントエンドのコーディングの手間を省いてくれるかもしれませんが、特にビジネス向けに信頼性の高いAIサポートエージェントを構築しようとしている場合には、全く新しい頭痛の種をもたらします。その柔軟性は諸刃の剣であり、完全なソリューションではなく、あくまでコンポーネントなのです。
セットアップとメンテナンスに多大な労力がかかる
先ほど見たように、これは簡単なコピー&ペースト作業ではありません。以下のことを行う必要があります。
-
セッショントークンの作成と更新のためだけにサーバーを構築し、ホストする。
-
ドメインの許可リストのようなセキュリティ設定と格闘する。これはよくある落とし穴で、ウィジェットが読み込まれず、多くの場合、役立つエラーメッセージも表示されません。
-
フロントエンドと新しいバックエンドの両方のための統合コードを書く。
これらすべてが開発者の時間を消費し、維持管理しなければならない別のシステムを生み出します。それに対し、eesel AIのようなプラットフォームはセルフサービスで構築されています。ワンクリックのヘルプデスク統合により、カスタムのバックエンド開発を一切必要とせず、数分で稼働させることができます。
ナレッジがOpenAIの世界に閉じ込められる
ChatKitはOpenAIのAgent Builderから作られたエージェントと連携するように構築されています。エージェントが必要とするナレッジがOpenAI内にのみ存在するなら、それで問題ありません。しかし、ほとんどの企業はそうではありませんよね?
あなたの会社のナレッジはおそらく至る所に散らばっています。
-
ヘルプ記事はZendeskにある。
-
社内ドキュメントはConfluenceやGoogle Docsにある。
-
チームはSlackで質問に答えている。
-
サポートエージェントはIntercomの会話に長年のコンテキストを持っている。
ChatKitとAgent Builderは、これらすべてをきれいにまとめる方法を提供していません。本当に役立つAIエージェントは、それがどこにあろうと、会社のすべてのナレッジにアクセスする必要があります。これが、eesel AIがすぐに使える100以上のソースに接続できる理由です。大規模なデータ移行プロジェクトを必要とせずに、ナレッジを即座に統合できます。
サポートチームが本当に必要とする機能が欠けている
結局のところ、ChatKitは単なるチャットウィンドウです。本格的なカスタマーサポートプラットフォームではありません。サポートチームがAIを効果的かつ安全に利用するために頼りにしている多くの機能が欠けています。
-
テストする方法がない: 過去の会話に対してエージェントがどのように対応したかを確認するシミュレーションモードがありません。顧客に公開する前にその精度を予測する実質的な方法がなく、基本的に手探りで進むことになります。
-
人間のエージェントへの助けがない: オールオアナッシングです。会話をエスカレーションする必要がある場合に、人間のエージェントがより速く返信を書くのを助けるコパイロット機能がありません。
-
バックエンドの自動化がない: チケットを自動的にタグ付けしたり、会話を適切なチームにルーティングしたり、その他多くの時間を節約する舞台裏のタスクを処理することができません。
eesel AIは、サポートチームのために特別に構築されました。その強力なシミュレーションモードを使用して、何千もの実際の過去のチケットでAIをテストし、そのパフォーマンスに関する明確なレポートを取得し、自信を持って自動化を展開することができます。
OpenAIエージェントワークフローの価格設定
では、これらすべてにどれくらいの費用がかかるのでしょうか?ChatKitライブラリは無料ですが、実際のエージェントの実行は無料ではありません。コストは、エージェントが使用するモデルやツールへのAPI呼び出しから発生します。これにより、月々の請求額はかなり予測不可能になる可能性があります。
ほとんどのビジネス用途では、必要なセキュリティと管理機能を得るためにChatGPT BusinessまたはEnterpriseプランが必要になります。以下に、彼らの標準プランの簡単な概要を示します。
機能 | ChatGPT Business | ChatGPT Enterprise |
---|---|---|
価格 | $25/ユーザー/月(年間請求) | 営業担当者にお問い合わせください |
モデルアクセス | 無制限のGPT-4oメッセージ(GPT-4o思考とGPT-4o proへの寛大なアクセス付き) | Businessのすべてに加え、拡張されたコンテキストウィンドウ |
セキュリティ | 安全なワークスペース、SAML SSO、デフォルトでトレーニングから除外されるデータ | エンタープライズグレードのセキュリティ、SCIM、ユーザー分析、カスタムデータ保持 |
統合 | Google Drive、SharePoint、Notionなどのコネクタ | Businessのすべて |
主要機能 | データ分析、共有プロジェクト、カスタムワークスペースGPT | 24時間365日の優先サポート、SLA、AIアドバイザーへのアクセス |
この情報は公開されている価格設定に基づいており、変更される可能性があります。最新の詳細については、公式のChatGPT価格設定ページで確認することをお勧めします。
サポートチームのためのよりシンプルな道:eesel AI
どのビジネスにとっても、特にサポートチームにとっては、ChatKitははるかに大きなパズルの一片にすぎません。チャットウィンドウは提供してくれますが、バックエンドを構築し、統合を考え出し、実際に違いを生むすべての機能を追加する必要があります。
eesel AIは、それらすべてを代行するオールインワンのプラットフォームであり、真に役立つAIエージェントを数分で立ち上げることができます。以下にその違いを示します。
-
数ヶ月ではなく数分で稼働開始:トークンを管理するためにバックエンドを構築する代わりに、ZendeskやFreshdeskのようなヘルプデスクをワンクリックで接続するだけです。このプラットフォームは真にセルフサービスであり、営業担当者と話すことなく始めることができます。
-
すべてのナレッジを接続:AIを囲い込む必要はありません。eesel AIは、ヘルプデスク、ConfluenceやGoogle Docsのような社内Wiki、さらにはSlackのようなコラボレーションツールから情報を引き出します。また、過去のサポートチケットから学習し、初日からブランドのトーンを把握することもできます。
-
サポート自動化のための完全なツールキット:eesel AIは単なるチャットボットではありません。このプラットフォームは、完全な自動化のためのAIエージェント、人間のチームを支援するAIコパイロット、サポートキューを自動的に整理するAIトリアージを提供します。
-
自信を持ってテストし、真の洞察を得る:シミュレーションモードを使用して、AIを有効にする前に、過去のチケットでAIがどのようにパフォーマンスを発揮したかを正確に確認できます。レポートは単なる見栄えの良い指標を提示するだけでなく、ナレッジのギャップがどこにあるかを示し、改善への明確な道筋を提供します。
ChatKit Session APIを使用すべきか?
OpenAIのChatKitは、カスタマイズ可能なチャットUIを求めており、それをサポートするためのバックエンドを構築する準備ができている開発者にとっては堅実なツールです。ChatKit Session APIは認証を処理する安全な方法を提供しますが、それは手軽な解決策ではなく、本格的な開発プロジェクトです。
高速で強力、そして完全なAIサポートソリューションを求めているビジネスにとって、専用のプラットフォームがほとんどの場合、より良い選択肢です。すべてを自分でつなぎ合わせる代わりに、ナレッジ管理からデプロイまでを処理し、予測可能な価格設定と結果への明確な焦点を備えた統合システムを手に入れることができます。
完全に統合されたAIサポートプラットフォームが何をもたらすか見てみませんか? eesel AIを無料で始める。
よくある質問
ChatKit Session APIの主な目的は、ChatKitウィジェットの認証を安全に管理することです。機密性の高いOpenAI APIキーがクライアントサイドのコードに決して公開されないようにし、代わりにユーザーセッション用の一時的なトークンを作成します。
ChatKit Session APIはサーバーサイドの認証フローを使用します。あなたの秘密のAPIキーを保持するバックエンドサーバーが、OpenAIと直接通信して短命の「client_secret」を生成し、それがユーザーのブラウザに渡されます。
ChatKit Session APIを適切に実装するためには、開発者は専用のバックエンドAPIエンドポイントを構築し、ホストする必要があります。このエンドポイントはトークン交換プロセスを安全に処理し、カスタムのサーバーサイドロジックとフロントエンドの統合コードが必要です。
ChatKit Session APIで構築されたソリューションの維持には、カスタムバックエンドの継続的なサーバー管理とセキュリティ更新が含まれます。また、ドメインの許可リストを管理し、フロントエンドの変更を継続的に統合する必要もあります。
ChatKit Session API自体は、外部ナレッジベースとの直接的な統合機能を提供していません。その主な機能はOpenAIのAgent Builder内で構築されたエージェントの認証であり、多様なエンタープライズデータソースへのアクセスが容易ではない場合があります。
ChatKit Session APIライブラリ自体は無料ですが、それが認証するエージェントによって行われる基礎となるAPI呼び出しはOpenAIからのコストが発生します。これらのコストは、エージェントが会話中に利用するモデルやツールに依存します。
サポートチームにとって、ChatKit Session APIとAgent Builderだけに依存するということは、テスト用のシミュレーションモード、人間のエージェントのためのAIコパイロット機能、チケットのルーティングやタグ付けのためのバックエンド自動化などの機能が欠けていることを意味します。それは完全なサポートプラットフォームではなく、チャットウィンドウを提供するだけです。