
要約
Puddin AIは、AI検出問題を巧みに逆転させた日本のスタートアップです。他の全員が完成したエッセイを見て機械が書いたかどうかを推測しようとしています。Puddinは推測しません。文書がどのように書かれたかを記録します。キーストローク、編集、一時停止、貼り付け操作を記録し、人間が実際にそこに座って作業を行ったという署名付きタイムスタンプ証明書を発行します。
これは大阪拠点のValar Intelligenceが開発し、まず大学を対象としており、九州大学の授業ですでに試験的に使用されています。公開料金はまだなく、デモ申し込み型の企業向け製品です。
学術界を超えて重要な理由:全体のピッチは「証明せよ、推測するな」です。これはAIがあらゆる場所で起きている変化そのものであり、サポートの分野でも同様です。私は長年、自信ありげなボットが静かに間違った回答を提供するのを見てきました。人々が最終的に信頼するツールは、正しいと約束するものではなく、賭ける前に検証できるものです。
Puddin AIとは何か?
Puddin AIは自らを「執筆プロセス検証プラットフォーム」と呼んでいます。一言で言えば:文章が人間によって書かれたことを証明するものであり、「推測ではなく、証拠によって」行います。
セットアップはこうです。学生はPuddinの独自エディター内でレポートや論文を書きます。入力中、Puddinはバックグラウンドでプロセスを記録します。タイピングの流れ、編集履歴、一時停止、貼り付け操作、修正が行われた順序、全体にかかった時間。作業が提出されると、教員は完成したテキストだけでなく、執筆プロセスレポートと、その人物がその時点でその作業を著作したことを証明する証明書を見ることができます。
背後にある企業はValar Intelligenceで、カリフォルニア生まれで2020年に日本国籍を取得した須高能和が設立しました。起源の物語はディープテックのピッチにしては珍しく具体的です。須高氏は脚本家・小説家として働いており、アニメの英語脚本を翻訳していました。彼らが語るように(日本語から翻訳):
「何時間もかけて一行一行翻訳・推敲していたのですが…正直なところ、こんな考えも浮かびました:『原稿をChatGPTに貼り付けるだけで、10分でそれらしい英語版が出てくるよな』と。でも、その2つの原稿を比べても、自分で時間をかけて書いたのか、AIに任せたのかを、第三者に証明する術がないんです。」
須高能和、創業者、Osaka Entrepreneursのプロフィールにて
そのギャップ:私は作業をした、でも証明できないが会社全体の根拠です。須高氏は「人間がこれを書いたと証明できるサービス」を探し、見つからなかったので自ら作りました。
問題:AI検出はちょっと壊れている
Puddinのアプローチが興味深い理由を理解するには、現在のアプローチがなぜ全員を苛立たせるかから始める必要があります。
ほとんどの学校はTurnitinやGPTZeroのようなAI文章検出ツールに頼っています。これらは完成したテキストを読み、どのくらい「AIらしい」かを推定します。問題はこれらの検出器が推論によって機能することで、完成したテキストへの推論は不安定です。学生はAIに何かを下書きさせ、それを大幅に編集することができます。自分の文章と生成された文章を混ぜることもできます。そして、実際に人を傷つける部分として、完全に人間の文章がAIとして頻繁にフラグされるのです。
これと共存している教育者たちはそれについて率直です。誤検知率に関するr/academiaのスレッドより:
「有効なAI検出ツールはありません。そのような技術は存在しません。どのツールも、調査はもちろん、告発のための証拠を信頼性を持って提示することはできません。」- theArtOfProgramming, r/academia
そして数学は本当に厳しいです。別のコメント投稿者は、1%の誤検知率でも、学位の~100の課題に適用すると、少なくとも一度は誤ってフラグされる確率が約63%になると指摘しており、現実の率は1%より高いと広く報告されています。英語を母国語としない話者は不均衡に大きな打撃を受けます。学術的誠実性を守るためのツール自体が信頼できないなら、問題を単に移動させただけです。
これは学術界だけではありません。スケールでAIコンテンツをファクトチェックしようとする人は誰でも同じ壁にぶつかり、それを発見すると主張するツールは誠実な書き手でつまずき続けています。
Puddinのフレーミングは、より良い推測者を作ることでこれを修正することはできないということです。推測しないことで修正するのです。

Puddin AIが実際にどのように機能するか
これは私が本当に巧妙だと思う部分なので、マーケティングではなくメカニズムについて説明させてください。
執筆がPuddinのエディター内で行われるため、システムには検出器が決して得られないものがあります:テキストがどのように存在するようになったかの完全なイベントストリーム。検証ボタンを押すと、日本科学技術振興機構の英語ニュースサービスScience Japanの報道によると、約200の「人間らしさ」指標に対して作業をスコア付けします。報道で挙げられた例は、機械が逆方向に簡単に偽造できないようなものです:よくある人間のスペルミス、人が考えの途中でとる一時停止、そしてその長さの作品を生み出すのに通常かかる時間。
ホームページのデモでは、Puddinはこれらのいくつかをプロセスパネルとして表示します。タイピングの流れ、編集履歴、修正パターン、一時停止、貼り付け操作、それぞれがパーセンテージとしてスコア付けされ、総作成時間と編集数などのセッションメタデータも表示されます。結果は3つのバケット:人間、AI支援、またはAIのいずれかに分類されます。日本語と英語を含む6つの言語に対応しています。
コピーペーストの場合が最も明確な例示です。AI生成の回答を貼り付けると、執筆タイムラインが崩壊します。段階的な構築はなく、テキストのブロックが一度に現れるだけで、Puddinはそれらのパッセージを紫色でハイライトします。

そして、単なる洗練されたキーロガー以上のものにする部分が来ます:暗号証明書。Puddinは行動データと暗号タイムスタンプおよびハッシュチェーンを組み合わせて、ドキュメントごとの検証可能なトレイルを生成します。つまり出力は「これは82%人間だと思います」ではありません。この人物がこれをこの時点で書いたという署名されたアーティファクトであり、第三者が後で確認できます。これは確率スコアよりも採点委員会に渡すものとして意味のある違いがあります。

大学がすでに利用しているものに組み込まれるように作られています。PuddinはLMS(Moodle、Canvas、Blackboard、Google Classroom)と統合し、大学アカウントでのシングルサインオンを使用するため、誰も新しいログインを作成する必要がありません。教員はすでに使用しているLMSから課題を作成し、学生はそこからPuddinを開きます。ユースケースはレポートや短い論文からラボ記録、オンライン試験、卒業論文まで及びます。
使用されている場所
Puddinは九州大学で実際のレポート課題に対して試験的に使用されており、同社は数十の大学が採用を検討していると言っています。ここでの教員のフレーミングが興味深いシグナルです。監視ではなく公平性についてです:
「学生に時間をかけて自分で作業を書いてもらいたい。このシステムは独自性を検証でき、公平な評価を可能にします。」- Andrew John Chapman、九州大学エネルギー経済学准教授
Puddinは、試験の学生たちが普段通りの書き方ができると言い、バックグラウンド記録が監視ではなく学習支援として受け取られたと報告しています。この区別は、このようなツールが実際の学生集団との接触を生き延びられるかどうかに大きく関わります。
正直な落とし穴
私は書くものすべてに公平であろうとしており、プロセス検証には、誰かが過度に興奮する前に名前を付ける価値がある本物の鋭い弱点があります。
最も鋭い批判は日本の学者奥村晴彦から来ており、それは良いものです(翻訳):
「ウェブフォームに長いテキストを手で入力するとタイムアウトしたりブラウザがクラッシュして失うので、いつもテキストエディターで書いてから貼り付けています。それでAIと判定されるの?」
これが核心です。完全に正当な人間のワークフロー(信頼するテキストエディターで下書きし、送信ボックスに貼り付ける)は、Puddinが検出するために作られたAIからの貼り付けパターンに非常に似ています。「プロセスを証明する」アプローチは一つの誤検知リスクを別のものと交換し、全員が壁で囲まれたガーデン内で書くことに同意した場合にのみ機能します。また、すでに他の場所で書かれた大量の文書を遡及的に検証することはできないという明らかな制限もあります。プラットフォーム上で作成された作業の著作権のみを証明します。
そして実際的な注意点:Puddinは非常に初期段階で、日本語優先で、公開料金がありません。これは機関向けのセールス主導のデモ申し込み製品です。つまりこれは「この分野に注目」であり、「今日の午後にサインアップ」ではありません。
Puddinの功績として、AIが禁止されるべきだとは主張していません。自らのフレーミングは電卓の比喩です。電卓が登場したとき、数学を教えるのをやめたのではなく、作業を示すことをより重要にしました。会社がXで述べているように:「事後にAIテキストを100%の精度で検出することはできません。私たちは作成中に人間の著作権を検証します。」これはAIコンテンツ全般で広まっている同じ再フレーミングです:出力を監視するのをやめて、プロセスを保証し始める。
本当の教訓:証明せよ、推測するな
教室から離れると、Puddinははるかに大きな何かの一例です。AIライティングツールがより多くのことを処理するようになると、希少で価値のあるものは出力ではなく、出力を信頼できるという証拠です。同じ質問が全ての机に届いています:「AIはこれができるか?」ではなく「正しくやったことを証明できるか?」これがベンダーが大きなモデルを出荷するだけでなく信頼レイヤーのようなものを追加し続けている理由です。
私はカスタマーサポートのAIに取り組んでおり、これが学ぶのに最も時間がかかった教訓です。ギャップは能力ではありませんでした。現代のモデルはこの文を読むのと同じくらい速くサポート返信を下書きできます。ギャップは信頼であり、それを破壊する最速の方法は自信を持って間違ったことをするAIです。私が見てきた最悪の失敗モードは「わかりません」と言うボットではありません。実際にやっていない作業を自信たっぷりに10ステップで語ったり、知識ベースに一致がないときに回答を幻覚するボットです。

だから答えはPuddinのものに非常に似ており、ただ異なる問題を向いています。デプロイして祈るのではありません。賭ける前に検証するのです。私が一緒に仕事をしているサポートリーダーは基準をうまく言い表しました:
「自信を持って答えてくれるけど、過信はせず、トレーニングもとても簡単でした。」
月間約260件のAIインタラクションを処理するSMS/メッセージングプラットフォームのサポートリーダー
その信頼はどこかで獲得される必要があり、獲得する場所は本番稼働前であり、顧客の前ではありません。Puddinは執筆がどのように起きたかを記録することでそれを獲得します。サポートでの並行関係は、AIエージェントを何千もの自分の過去チケットに対してシミュレートすることで、単一の実際の顧客がそれを見る前に、どのように答えていたかを正確に確認できます。同じ本能:最初に証拠、次に信頼。
eeselを試してみる
Puddinの「信頼する前に証明する」というアイデアが響いて、問題がエッセイではなくサポートであれば、それがeesel AIがクリアするために構築されたバーです。ヘルプセンターと過去のチケットに接続すると、顧客に返信する前に実際のチケット履歴に対してシミュレーションで実行でき、本番稼働後に動作することを期待するのではなく、実際の回答と解決率を事前に確認できます。すでに使用しているヘルプデスクに接続し、すでに持っている知識から学び、無料で試すことができます。

Puddinが異なる部屋で賭けているのと同じ変化です:AIが何でも生み出せる世界では、信頼する価値のあるツールは最初に検証できるものです。
よくある質問
Puddin AIとは何ですか?
Puddin AIはどのように人間が書いたことを証明しますか?
Puddin AIは単なるAI検出器ですか?
Puddin AIの料金はいくらですか?
Puddin AIはAIを活用する企業にとって何を意味しますか?

Article by
Alicia Kirana Utomo
Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.





