
Kurzzusammenfassung
Puddin AI ist ein japanisches Startup mit einer cleveren Umkehrung des KI-Erkennungsproblems. Alle anderen versuchen, einen fertigen Aufsatz anzusehen und zu erraten, ob eine Maschine ihn geschrieben hat. Puddin rät nicht. Es zeichnet auf, wie das Dokument geschrieben wurde – die Tastenanschläge, die Bearbeitungen, die Pausen, die Einfügeaktionen – und stellt ein signiertes, zeitgestempeltes Zertifikat aus, dass ein Mensch tatsächlich dort saß und die Arbeit erledigte.
Es wird vom Osaka-basierten Valar Intelligence entwickelt, richtet sich zunächst an Universitäten und wurde bereits in Kursen an der Kyushu-Universität erprobt. Es gibt noch keine öffentlichen Preise; es ist ein Unternehmensprodukt mit Demo-Anfrage.
Warum es über die Wissenschaft hinaus wichtig ist: Der gesamte Ansatz lautet „Beweise es, rate nicht." Das ist genau der Wandel, der mit KI überall stattfindet, auch im Support, wo ich jahrelang dabei war, wie zuversichtlich klingende Bots still falsche Antworten gaben. Die Tools, denen Menschen am Ende vertrauen, sind nicht die, die versprechen, dass sie recht haben; es sind die, mit denen man verifizieren kann, bevor man auf sie setzt.
Was ist Puddin AI?
Puddin AI bezeichnet sich selbst als „Schreibprozess-Verifikationsplattform." Die Kurzversion: Es beweist, dass ein Text von einem Menschen geschrieben wurde, „nicht durch Raten, sondern durch Beweise."
So funktioniert es: Ein Student schreibt seinen Bericht oder seine Abschlussarbeit im eigenen Editor von Puddin. Während er tippt, zeichnet Puddin den Prozess im Hintergrund auf – Tippfluss, Bearbeitungsverlauf, Pausen, Einfügeoperationen, die Reihenfolge der Überarbeitungen, wie lange das Ganze dauerte. Wenn die Arbeit eingereicht wird, sieht der Dozent nicht nur den fertigen Text; er sieht einen Schreibprozessbericht und ein Zertifikat, das belegt, dass die Arbeit von dieser Person zu diesem Zeitpunkt verfasst wurde.
Das dahinterstehende Unternehmen ist Valar Intelligence, gegründet von Nowa Sutaka, der in Kalifornien geboren wurde und 2020 die japanische Staatsbürgerschaft annahm. Die Entstehungsgeschichte ist für einen Deep-Tech-Pitch ungewöhnlich konkret. Sutaka arbeitet als Drehbuchautor und Romancier und übersetzte ein englisches Skript für einen Anime. Wie sie erzählen (aus dem Japanischen übersetzt):
„Während ich viele Stunden damit verbrachte, es Zeile für Zeile zu übersetzen und zu verfeinern… kam mir auch die Realität in den Sinn: 'Ehrlich gesagt, wenn man das Manuskript einfach in ChatGPT einfügt, würde in 10 Minuten eine plausible englische Version erscheinen.' Aber selbst beim Vergleich dieser beiden Manuskripte gibt es keine Möglichkeit, einem Dritten gegenüber zu beweisen, ob ich die Zeit damit verbracht habe, es selbst zu schreiben oder es der KI überlassen habe."
Nowa Sutaka, Gründer, in einem Osaka Entrepreneurs-Profil
Diese Lücke – ich habe die Arbeit geleistet, und ich kann es nicht beweisen – ist das gesamte Unternehmen. Sutaka suchte nach „einem Dienst, der beweisen kann, dass ein Mensch das geschrieben hat", fand keinen und baute ihn.
Das Problem: KI-Erkennung ist irgendwie kaputt
Um zu verstehen, warum Puddins Ansatz interessant ist, muss man damit beginnen, warum der aktuelle Ansatz alle frustriert.
Die meisten Schulen greifen auf ein KI-Schreiberkennungs-Tool wie Turnitin oder GPTZero zurück. Diese lesen den fertigen Text und schätzen, wie „KI-ähnlich" er aussieht. Das Problem ist, dass diese Detektoren durch Schlussfolgerungen arbeiten, und Schlussfolgerungen aus fertigem Text sind wackelig. Ein Student kann eine KI etwas entwerfen lassen und es dann stark bearbeiten. Ein Student kann eigene Sätze mit generierten mischen. Und – der Teil, der Menschen tatsächlich schadet – perfekt menschliches Schreiben wird ständig als KI eingestuft.
Die Pädagogen, die damit leben müssen, sind deutlich. Aus einem r/academia-Thread über falsch-positive Raten:
„Es gibt KEIN gültiges KI-Erkennungs-Tool. Es gibt keine solche Technologie. Kein Tool kann glaubwürdig Beweise für eine Untersuchung liefern, geschweige denn für Anschuldigungen." - theArtOfProgramming, r/academia
Und die Mathematik ist wirklich schlimm. Ein anderer Kommentator wies darauf hin, dass selbst eine falsch-positive Rate von 1 %, angewendet auf die ~100 Aufgaben eines Studiums, eine Wahrscheinlichkeit von etwa 63 % ergibt, mindestens einmal fälschlicherweise markiert zu werden – und die realen Raten werden weithin als höher als 1 % berichtet. Nicht-muttersprachliche Englischsprecher werden überproportional hart getroffen. Wenn das Tool zur Wahrung der akademischen Integrität selbst unzuverlässig ist, hat man das Problem nur verschoben.
Das ist auch nicht einzigartig für die Wissenschaft; jeder, der versucht, KI-Inhalte zu überprüfen, stößt auf dieselbe Wand, und die Tools, die behaupten, es zu erkennen, stolpern immer wieder über ehrliche Schreiber.
Puddins Sichtweise ist, dass man das nicht durch den Bau eines besseren Raters beheben kann. Man behebt es, indem man nicht rät.

Wie Puddin AI tatsächlich funktioniert
Das ist der Teil, den ich wirklich clever finde, also lassen Sie mich den Mechanismus durchgehen, nicht das Marketing.
Da das Schreiben innerhalb des Editors von Puddin stattfindet, hat das System etwas, das Detektoren nie bekommen: den vollständigen Ereignisstrom, wie der Text entstanden ist. Wenn man auf die Verifizierungsschaltfläche drückt, bewertet es die Arbeit anhand von rund 200 „Menschlichkeits"-Indikatoren, laut Berichten von Science Japan, dem englischsprachigen Nachrichtendienst der Japan Science and Technology Agency. Die in Berichten genannten Beispiele sind die Art von Dingen, die eine Maschine nicht leicht rückwirkend fälschen kann: häufige menschliche Rechtschreibfehler, die Pausen, die Menschen mitten in einem Gedanken machen, und die Zeit, die ein Stück dieser Länge normalerweise zur Erstellung braucht.
In der Startseiten-Demo zeigt Puddin einige davon als Prozessfeld – Tippfluss, Bearbeitungsverlauf, Überarbeitungsmuster, Pausen und Einfügeoperationen, jeweils als Prozentsatz bewertet, plus Sitzungsmetadaten wie die gesamte Erstellungszeit und die Anzahl der Bearbeitungen. Das Ergebnis wird in einen von drei Bereichen: Mensch, KI-unterstützt oder KI einsortiert. Es unterstützt sechs Sprachen, darunter Japanisch und Englisch.
Der Kopieren-Einfügen-Fall ist die deutlichste Illustration. Wenn man eine KI-generierte Antwort einfügt, kollabiert die Schreibzeitlinie – es gibt keine schrittweise Konstruktion, nur ein auf einmal auftauchender Textblock – und Puddin hebt diese Passagen in Lila hervor.

Dann kommt der Teil, der es mehr als einen ausgeklügelten Keylogger macht: ein kryptografisches Zertifikat. Puddin kombiniert die Verhaltensdaten mit kryptografischen Zeitstempeln und einer Hash-Kette, um einen pro-Dokument-verifizierbaren Pfad zu generieren. Das Ergebnis ist also nicht „wir glauben, das ist zu 82 % menschlich." Es ist ein signiertes Artefakt, das besagt, diese Person schrieb das, zu diesem Zeitpunkt, das ein Dritter später überprüfen kann. Das ist etwas bedeutend anderes, was man einem Prüfungskomitee überreicht, als eine Wahrscheinlichkeitsbewertung.

Es ist auch darauf ausgelegt, sich in das einzufügen, was Universitäten bereits betreiben. Puddin integriert sich mit dem LMS – Moodle, Canvas, Blackboard, Google Classroom – und verwendet Single Sign-On mit Universitätskonten, sodass niemand ein neues Login erstellen muss. Dozenten erstellen Aufgaben aus dem LMS, das sie bereits verwenden; Studenten öffnen Puddin von dort aus. Die Anwendungsfälle reichen von Berichten und kurzen Abschlussarbeiten bis hin zu Laborprotokollen, Online-Prüfungen und Abschlussarbeiten.
Wo es eingesetzt wird
Puddin wurde an der Kyushu-Universität erprobt bei echten Berichtsaufgaben, und das Unternehmen sagt, dass mehrere Dutzend Universitäten eine Einführung erwägen. Der Rahmen der Fakultät ist hier das interessante Signal – es geht um Fairness, nicht um Überwachung:
„Ich möchte, dass Studenten sich Zeit nehmen und ihre Arbeit selbst schreiben. Dieses System kann die Originalität verifizieren und eine faire Bewertung ermöglichen." - Andrew John Chapman, außerordentlicher Professor für Energieökonomie an der Kyushu-Universität
Puddin berichtet, dass Studenten im Versuch sagten, sie könnten so schreiben, wie sie es normalerweise tun, und dass die Hintergrundaufzeichnung eher als Lernunterstützung denn als Überwachung wahrgenommen wurde. Diese Unterscheidung ist sehr wichtig dafür, ob ein solches Tool den Kontakt mit einem echten Studierenden-Körper überlebt.
Der ehrliche Vorbehalt
Ich versuche, allem, worüber ich schreibe, fair gegenüberzustehen, und Prozessverifikation hat eine echte, pointierte Schwäche, die es wert ist, benannt zu werden, bevor jemand zu begeistert wird.
Die schärfste Kritik kam von einem japanischen Akademiker, Hiroyuki Okumura, und es ist eine gute (übersetzt):
„Wenn man langen Text in ein Webformular tippt, kann es zu einem Timeout kommen oder der Browser stürzt ab und man verliert alles, also schreibe ich immer in einem Texteditor und füge es dann ein. Werde ich dann als KI bewertet?"
Das ist der Kern. Ein völlig legitimer menschlicher Arbeitsablauf – in einem Texteditor entwerfen, dem man vertraut, dann in das Einreichungsfeld einfügen – sieht dem Muster aus-KI-einfügen sehr ähnlich, das Puddin zu erkennen gebaut wurde. Der Ansatz „Beweise den Prozess" tauscht ein falsch-positives Risiko gegen ein anderes aus, und er funktioniert nur, wenn alle einverstanden sind, innerhalb des ummauerten Gartens zu schreiben. Es gibt auch die offensichtliche Einschränkung, dass er den Berg von Dokumenten, die bereits überall anders geschrieben wurden, nicht rückwirkend verifizieren kann; er beweist die Urheberschaft nur für Arbeiten, die auf der Plattform erstellt wurden.
Und die praktischen Vorbehalte: Puddin ist sehr jung, japanisch-zuerst und hat keine öffentlichen Preise – es ist ein vertriebsgeführtes, Demo-Anfrage-Produkt für Institutionen. Das ist also ein „Behalte das im Blick", kein „Melde dich heute Nachmittag an".
Puddin muss man zugutehalten, dass es nicht vorgibt, KI sollte verboten werden. Sein eigener Rahmen ist die Taschenrechner-Analogie – als Taschenrechner aufkamen, haben wir nicht aufgehört, Mathematik zu unterrichten, wir haben das Zeigen der Arbeit wichtiger gemacht. Wie das Unternehmen auf X formuliert: „Man kann KI-Text nicht rückwirkend mit 100-prozentiger Genauigkeit erkennen. Wir verifizieren menschliche Urheberschaft während der Erstellung." Es ist die gleiche Neuausrichtung, die bei KI-Inhalten breiter auftaucht: Hör auf, das Ergebnis zu überwachen, fang an, für den Prozess zu bürgen.
Die eigentliche Lektion: Beweise es, rate nicht
Wenn man aus Klassenzimmern herausschaut, ist Puddin ein Beispiel für etwas viel Größeres. Während KI-Schreibtools mehr und mehr übernehmen, ist das Seltene, Wertvolle nicht der Output – es ist der Beweis, dass man dem Output vertrauen kann. Dieselbe Frage landet auf jedem Schreibtisch: nicht „Kann die KI das tun?" sondern „Kann ich beweisen, dass sie es richtig getan hat?" Deshalb fügen Anbieter ständig Dinge wie eine Vertrauensschicht hinzu, anstatt einfach ein größeres Modell zu liefern.
Ich arbeite an KI für den Kundensupport, und das ist die Lektion, die am längsten zu lernen dauerte. Die Lücke war nie die Fähigkeit. Moderne Modelle können eine Support-Antwort entwerfen so schnell, wie man diesen Satz lesen kann. Die Lücke ist Vertrauen – und der schnellste Weg, es zu zerstören, ist eine KI, die mit Zuversicht das Falsche tut. Das schlimmste Versagensmuster, das ich beobachtet habe, ist kein Bot, der sagt „Ich weiß nicht." Es ist ein Bot, der zehn zuversichtliche Schritte einer Arbeit erzählt, die er nie tatsächlich getan hat, oder eine Antwort halluziniert, wenn die Wissensdatenbank keinen Treffer hat.

Also sieht die Antwort am Ende sehr ähnlich wie Puddins aus, nur auf ein anderes Problem gerichtet. Man deployt nicht und hofft. Man verifiziert, bevor man darauf setzt. Ein Support-Lead, mit dem ich zusammenarbeite, hat die Messlatte gut formuliert:
„Es antwortet zuversichtlich, aber nicht zu zuversichtlich, und es zu trainieren war super einfach."
ein Support-Lead bei einer SMS/Messaging-Plattform mit ~260 KI-Interaktionen pro Monat
Dieses Vertrauen muss irgendwo verdient werden, und der Ort, es zu verdienen, ist vor dem Go-Live, nicht vor einem Kunden. Puddin verdient es, indem es aufzeichnet, wie das Schreiben stattgefunden hat. Das Pendant im Support ist, einen KI-Agenten gegen Tausende eigener vergangener Tickets zu simulieren, damit man genau sehen kann, wie er geantwortet hätte – und wo er Fehler gemacht hätte – bevor ein einziger echter Kunde es sieht. Gleicher Instinkt: zuerst Beweise, dann Vertrauen.
eesel ausprobieren
Wenn Puddins „Beweise es, bevor du es vertraust"-Idee etwas auslöst und dein Problem Support statt Aufsätze ist, ist das die Messlatte, die eesel AI zu überwinden baut. Du verbindest es mit deinem Hilfezentrum und vergangenen Tickets, und bevor es jemals einem Kunden antwortet, kannst du es in der Simulation gegen dein echtes Ticket-Verlauf laufen lassen – damit du seine tatsächlichen Antworten und die Lösungsrate im Voraus siehst, anstatt zu hoffen, dass es sich verhält, sobald es live ist. Es passt sich in den Helpdesk ein, den du bereits verwendest, lernt aus dem Wissen, das du bereits hast, und ist kostenlos auszuprobieren.

Es ist der gleiche Wandel, auf den Puddin in einem anderen Raum setzt: In einer Welt, in der KI alles produzieren kann, sind die Tools, denen es sich lohnt zu vertrauen, die, mit denen man zuerst verifizieren kann.
Häufig gestellte Fragen
Was ist Puddin AI?
Wie beweist Puddin AI, dass ein Mensch etwas geschrieben hat?
Ist Puddin AI nur ein weiterer KI-Detektor?
Was kostet Puddin AI?
Was bedeutet Puddin AI für Unternehmen, die KI einsetzen?

Article by
Alicia Kirana Utomo
Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.


