
Resumen
Puddin AI es una startup japonesa con una inversión ingeniosa del problema de detección de IA. Todos los demás intentan ver un ensayo terminado y adivinar si una máquina lo escribió. Puddin no adivina. Registra cómo se escribió el documento: las pulsaciones de teclas, las ediciones, las pausas, las acciones de pegado, y emite un certificado firmado y con marca de tiempo de que un humano se sentó allí y realizó el trabajo.
Está desarrollado por Valar Intelligence, con sede en Osaka, dirigido primero a las universidades, y ya se ha probado en clases de la Universidad de Kyushu. Aún no hay precios públicos; es un producto empresarial con solicitud de demo.
Por qué importa más allá de la academia: todo el argumento es "demuéstralo, no adivines." Ese es exactamente el cambio que está ocurriendo con la IA en todas partes, incluido el soporte, donde he pasado años viendo cómo bots que suenan seguros dan calladamente respuestas incorrectas. Las herramientas en las que la gente termina confiando no son las que prometen que tienen razón; son las que te permiten verificar antes de apostar por ellas.
¿Qué es Puddin AI?
Puddin AI se llama a sí mismo una "plataforma de verificación del proceso de escritura." La versión resumida: demuestra que un texto fue escrito por un humano, "no adivinando, sino con evidencia."
Así funciona. Un estudiante escribe su informe o tesis dentro del propio editor de Puddin. Mientras escribe, Puddin registra el proceso en segundo plano: flujo de escritura, historial de ediciones, pausas, operaciones de pegado, el orden en que se realizaron las revisiones, cuánto tiempo tardó todo. Cuando se envía el trabajo, el instructor no solo ve el texto final; ve un informe del proceso de escritura y un certificado que prueba que el trabajo fue redactado por esa persona, en ese momento.
La empresa detrás es Valar Intelligence, fundada por Nowa Sutaka, que nació en California y adquirió la ciudadanía japonesa en 2020. La historia de origen es inusualmente concreta para un pitch de deep-tech. Sutaka trabaja como guionista y novelista, y estaba traduciendo un guion en inglés para un anime. Como ellos lo cuentan (traducido del japonés):
"Mientras pasaba muchas horas traduciendo y refinándolo línea por línea… también me cruzó por la mente la realidad: 'Honestamente, si simplemente pegas el manuscrito en ChatGPT, una versión plausible en inglés aparecería en 10 minutos.' Pero incluso comparando esos dos manuscritos, no hay manera de demostrar a un tercero si pasé el tiempo escribiéndolo yo mismo o lo dejé en manos de la IA."
Nowa Sutaka, fundador, en un perfil de Osaka Entrepreneurs
Esa brecha: hice el trabajo y no puedo probarlo, es toda la empresa. Sutaka buscó "un servicio que pueda demostrar que un humano escribió esto", no encontró ninguno y lo construyó.
El problema: la detección de IA está algo rota
Para entender por qué el enfoque de Puddin es interesante, hay que empezar por entender por qué el enfoque actual frustra a todos.
La mayoría de las escuelas recurren a una herramienta de detección de escritura IA como Turnitin o GPTZero. Estos leen el texto terminado y estiman cuán "similar a IA" parece. El problema es que estos detectores funcionan por inferencia, y la inferencia sobre texto terminado es inestable. Un estudiante puede hacer que la IA redacte algo y luego editarlo mucho. Un estudiante puede mezclar sus propias oraciones con las generadas. Y, la parte que realmente perjudica a las personas, la escritura perfectamente humana se marca como IA todo el tiempo.
Los educadores que viven con esto son directos al respecto. De un hilo de r/academia sobre tasas de falsos positivos:
"NO existe ninguna herramienta de detección de IA válida. No existe tal tecnología. Ninguna herramienta puede producir crediblemente evidencia para una investigación, y mucho menos acusaciones."
Y las matemáticas son genuinamente malas. Otro comentarista señaló que incluso una tasa de falsos positivos del 1%, aplicada a las ~100 tareas de un título, da una probabilidad de aproximadamente el 63% de ser marcado incorrectamente al menos una vez, y las tasas del mundo real se informan ampliamente como superiores al 1%. Los hablantes no nativos de inglés son afectados desproporcionadamente. Cuando la herramienta destinada a proteger la integridad académica es en sí misma poco confiable, solo has desplazado el problema.
No es único de la academia tampoco; cualquiera que intente verificar contenido de IA a escala choca con la misma pared, y las herramientas que afirman detectarlo siguen tropezando con escritores honestos.
El planteamiento de Puddin es que no puedes arreglar esto construyendo un mejor adivinador. Lo arreglas no adivinando.

Cómo funciona realmente Puddin AI
Esta es la parte que encuentro genuinamente inteligente, así que déjame repasar el mecanismo en lugar del marketing.
Dado que la escritura ocurre dentro del editor de Puddin, el sistema tiene algo que los detectores nunca obtienen: el flujo completo de eventos de cómo llegó a existir el texto. Cuando presionas el botón de verificación, puntúa el trabajo contra alrededor de 200 indicadores de "humanidad", según cobertura de Science Japan, el servicio de noticias en inglés de la Agencia Japonesa de Ciencia y Tecnología. Los ejemplos mencionados en los informes son el tipo de cosas que una máquina no puede falsificar fácilmente en reversa: errores ortográficos humanos comunes, las pausas que las personas hacen en medio de un pensamiento, y el tiempo que normalmente lleva producir una pieza de esa longitud.
En la demo de la página de inicio, Puddin muestra algunos de estos como un panel de proceso: flujo de escritura, historial de ediciones, patrones de revisión, pausas y operaciones de pegado, cada uno puntuado como porcentaje, más metadatos de sesión como el tiempo total de creación y el número de ediciones. El resultado se clasifica en uno de tres grupos: Humano, Con apoyo de IA o IA. Maneja seis idiomas, incluidos japonés e inglés.
El caso de copiar y pegar es la ilustración más clara. Si pegas una respuesta generada por IA, la línea de tiempo de escritura colapsa: no hay construcción gradual, solo un bloque de texto que aparece de una vez, y Puddin resalta esos pasajes en morado.

Luego viene la parte que lo convierte en más que un keylogger sofisticado: un certificado criptográfico. Puddin combina los datos de comportamiento con marcas de tiempo criptográficas y una cadena hash para generar un rastro verificable por documento. Así que el resultado no es "creemos que esto es 82% humano." Es un artefacto firmado que dice esta persona escribió esto, en este momento, que un tercero puede verificar más tarde. Eso es algo significativamente diferente de presentar a un comité de calificación que una puntuación de probabilidad.

También está diseñado para integrarse en lo que las universidades ya utilizan. Puddin se integra con el LMS: Moodle, Canvas, Blackboard, Google Classroom, y utiliza inicio de sesión único con cuentas universitarias, para que nadie cree un nuevo inicio de sesión. Los instructores crean tareas desde el LMS que ya usan; los estudiantes abren Puddin desde allí. Los casos de uso van desde informes y tesis cortas hasta registros de laboratorio, exámenes en línea y tesis de graduación.
Dónde se está usando
Puddin ha sido probado en la Universidad de Kyushu en asignaciones de informes reales, y la empresa dice que varias docenas de universidades están considerando adoptarlo. El marco de la facultad es la señal interesante aquí: se trata de equidad, no de vigilancia:
"Quiero que los estudiantes se tomen su tiempo y escriban su trabajo por su cuenta. Este sistema puede verificar la originalidad, haciendo posible una evaluación justa."
Andrew John Chapman, profesor asociado de economía de la energía en la Universidad de Kyushu
Puddin informa que los estudiantes en el ensayo dijeron que podían escribir de la manera en que normalmente lo hacen, y que la grabación en segundo plano fue recibida como apoyo de aprendizaje más que como vigilancia. Esa distinción importa mucho para si una herramienta como esta sobrevive el contacto con un cuerpo estudiantil real.
La advertencia honesta
Intento ser justo con todo lo que escribo, y la verificación de procesos tiene una debilidad real y precisa que vale la pena nombrar antes de que alguien se entusiasme demasiado.
La crítica más aguda vino de un académico japonés, Hiroyuki Okumura, y es buena (traducida):
"Cuando escribes texto largo en un formulario web, puede dar timeout o el navegador se cuelga y lo pierdes todo, así que siempre escribo en un editor de texto y luego lo pego. ¿Eso me hace quedar como IA?"
Ese es el meollo del asunto. Un flujo de trabajo humano completamente legítimo: redactar en un editor de texto en el que confías y luego pegar en el cuadro de envío, se parece mucho al patrón de pegar-desde-IA que Puddin está construido para detectar. El enfoque "demuestra el proceso" intercambia un riesgo de falso positivo por otro diferente, y solo funciona si todos acuerdan escribir dentro del jardín amurallado. También está la limitación obvia de que no puede verificar retroactivamente la montaña de documentos ya escritos en otros lugares; solo prueba la autoría para el trabajo creado en la plataforma a partir de ahora.
Y los advertencias prácticas: Puddin es muy joven, con prioridad en Japón, y no tiene precios públicos: es un producto con ventas directas y solicitud de demo para instituciones. Así que esto es un "observa este espacio", no un "regístrate esta tarde".
Hay que reconocerle a Puddin que no pretende que la IA deba estar prohibida. Su propio marco es la analogía de la calculadora: cuando llegaron las calculadoras, no dejamos de enseñar matemáticas, hicimos que mostrar el trabajo importara más. Como la empresa dice en X: "No puedes detectar texto de IA después del hecho con 100% de precisión. Verificamos la autoría humana durante la creación." Es el mismo replanteamiento que aparece en el contenido de IA más ampliamente: deja de controlar el resultado, empieza a respaldar el proceso.
La lección real: demuéstralo, no adivines
Alejándonos de las aulas, Puddin es un ejemplo de algo mucho más grande. A medida que las herramientas de escritura de IA manejan más de todo, la cosa escasa y valiosa no es el resultado, es la prueba de que puedes confiar en el resultado. La misma pregunta está aterrizando en cada escritorio: no "¿puede la IA hacer esto?" sino "¿puedo demostrar que lo hizo bien?" Es por eso que los proveedores siguen añadiendo cosas como una capa de confianza en lugar de simplemente enviar un modelo más grande.
Trabajo en IA para soporte al cliente, y esta es la lección que más tiempo nos llevó aprender. La brecha nunca fue la capacidad. Los modelos modernos pueden redactar una respuesta de soporte tan rápido como puedes leer esta oración. La brecha es la confianza, y la forma más rápida de destruirla es una IA que hace lo incorrecto con confianza. El peor modo de fallo que he visto no es un bot que dice "No sé." Es un bot que narra diez pasos confiados de trabajo que nunca hizo realmente, o alucina una respuesta cuando la base de conocimientos no tiene coincidencia.

Así que la respuesta termina pareciéndose mucho a la de Puddin, solo apuntada a un problema diferente. No despliegas y rezas. Verificas antes de apostar por ello. Un responsable de soporte con el que trabajo puso el listón bien:
"Responde con confianza pero no demasiado confianza, y entrenarlo ha sido súper fácil."
un responsable de soporte en una plataforma de SMS/mensajería con ~260 interacciones de IA al mes
Esa confianza tiene que ganarse en algún lugar, y el lugar para ganarla es antes del lanzamiento, no frente a un cliente. Puddin la gana grabando cómo ocurrió la escritura. El paralelo en soporte es simular un agente de IA contra miles de tus propios tickets anteriores, para que puedas ver exactamente cómo habría respondido, y dónde habría cometido errores, antes de que un solo cliente real lo vea. Mismo instinto: primero evidencia, luego confianza.
Prueba eesel
Si la idea de Puddin de "demuéstralo antes de confiar en ello" resuena y tu problema es el soporte más que los ensayos, ese es el listón que eesel AI está construido para superar. Lo conectas a tu centro de ayuda y tickets anteriores, y antes de que responda a un cliente puedes ejecutarlo en simulación contra tu historial de tickets real, para que veas sus respuestas reales y la tasa de resolución por adelantado, en lugar de esperar que se comporte una vez que esté en vivo. Se conecta al helpdesk que ya usas, aprende del conocimiento que ya tienes, y es gratis de probar.

Es el mismo cambio en el que Puddin está apostando, en una habitación diferente: en un mundo donde la IA puede producir cualquier cosa, las herramientas que vale la pena confiar son las que te permiten verificar primero.
Preguntas frecuentes
¿Qué es Puddin AI?
¿Cómo demuestra Puddin AI que un humano escribió algo?
¿Es Puddin AI solo otro detector de IA?
¿Cuánto cuesta Puddin AI?
¿Qué significa Puddin AI para las empresas que usan IA?

Article by
Alicia Kirana Utomo
Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.



