IA multimodal de Intercom para voz e imágenes en soporte: Una visión práctica

Stevia Putri
Written by

Stevia Putri

Stanley Nicholas
Reviewed by

Stanley Nicholas

Last edited 28 octubre 2025

Expert Verified

Seamos realistas, el soporte al cliente ya no es solo teclear. El siguiente paso para la IA es poder ver un problema a través de una captura de pantalla o guiar a un cliente por teléfono para resolverlo. Se trata de solucionar las cosas de forma más rápida y natural.

Intercom actualizó recientemente su agente de IA, Fin, con una mejora importante que incluye precisamente estas capacidades, permitiéndole entender imágenes y gestionar llamadas de voz. Suena impresionante, y es un gran paso adelante. Pero, ¿qué significa esto realmente para tu equipo de soporte en el día a día?

Este artículo dejará de lado la palabrería para ofrecerte una visión práctica de las nuevas funciones de Intercom. Analizaremos qué hacen, profundizaremos en los obstáculos del mundo real como los precios y la configuración, y te mostraremos una alternativa más flexible si buscas una IA avanzada sin todas las complicaciones.

¿Qué es la IA multimodal de Intercom para voz e imágenes en soporte?

En esencia, la IA de Intercom es Fin, un agente creado para el servicio al cliente. El término sofisticado "multimodal" simplemente significa que la IA ahora puede entender más que solo texto. Puede procesar imágenes y voz, lo que le permite tener conversaciones más enriquecedoras y llegar al fondo de los problemas mucho más rápido.

Fin Vision: Ver lo que ve el cliente

Piensa en Fin Vision como la parte de la IA que puede analizar imágenes. Cuando un cliente sube una captura de pantalla o una foto, Fin puede analizarla. Así, en lugar de que un cliente intente describir un mensaje de error extraño o una pieza rota, simplemente puede tomar una foto y enviarla.

Por ejemplo, si a un cliente le aparece un error emergente en tu aplicación, puede enviar una captura de pantalla. Fin Vision puede leer el texto de esa imagen, extraer números de referencia y averiguar qué está mal sin el tedioso ir y venir de pedirle al cliente que lo escriba todo de nuevo. Simplemente lleva a todos a la solución más rápido.

Fin Voice: Llevando la IA a las llamadas telefónicas

Fin Voice aplica ese mismo cerebro de IA a las llamadas telefónicas. El objetivo es que el agente Fin gestione las llamadas de soporte con un flujo natural y conversacional. Está diseñado para entender interrupciones y hablar varios idiomas, lo que pone a Intercom en competencia directa con otras herramientas de voz con IA del mercado.

Sin embargo, vale la pena señalar que Fin Voice todavía está en fase de pruebas inicial con un grupo muy reducido de clientes. Esto significa que puede que aún no esté ampliamente disponible o completamente pulido, lo que podría ser un factor decisivo para los equipos que necesitan una solución fiable que puedan implementar hoy mismo.

Los desafíos ocultos

Aunque la tecnología en sí es genial, la realidad de configurarla y ponerla en marcha viene con algunos obstáculos importantes que deberías conocer antes de lanzarte.

Costes impredecibles: Un desafío clave

Una de las primeras cosas que probablemente notarás sobre la IA de Intercom es el precio. Te cobran 0,99 $ por resolución. Puede que no parezca mucho a primera vista, pero la factura final es completamente impredecible.

Piénsalo: ¿qué sucede cuando lanzas un nuevo producto, ejecutas una gran campaña de marketing o tienes una interrupción inesperada del servicio? Tu volumen de soporte se disparará, y tu factura lo hará junto con él. Un mes ajetreado podría dejarte con una factura sorprendentemente alta, haciendo que sea casi imposible presupuestar de manera efectiva. Es un modelo que puede terminar castigándote por tu propio éxito.

Configuración complicada: La dependencia de la base de conocimientos

Aquí está el truco: Fin es tan bueno como lo sea tu base de conocimientos. Si tus artículos de ayuda están desactualizados, les falta información clave o simplemente no están escritos con claridad, la IA tendrá dificultades. O dará respuestas incorrectas o terminará escalando los tickets a tu equipo, lo que va en contra del propósito principal. Esto ejerce una enorme presión sobre ti para mantener una documentación perfecta constantemente.

Además, empezar no es un proceso simple de hacer clic y listo. Aunque Intercom se conecta con plataformas como Zendesk y Salesforce, configurarlo correctamente requiere tiempo y esfuerzo. No se integra fácilmente con todos los demás lugares donde reside el conocimiento real de tu equipo, como las wikis internas en Confluence o los documentos de procesos guardados en Google Docs.

Una captura de pantalla que muestra la interfaz para conectar varias fuentes de conocimiento a la IA multimodal de Intercom para voz e imágenes en soporte, destacando la complejidad de la configuración.
Una captura de pantalla que muestra la interfaz para conectar varias fuentes de conocimiento a la IA multimodal de Intercom para voz e imágenes en soporte, destacando la complejidad de la configuración.

Control limitado y un lanzamiento arriesgado

Como mencionamos, funciones clave como Fin Voice todavía están en una beta cerrada. Esto crea mucha incertidumbre para las empresas que necesitan una herramienta estable y fiable en la que puedan confiar ahora mismo.

Peor aún, no hay una forma fácil de probar cómo funcionará la IA con tus propios datos antes de soltarla con tus clientes. No puedes ver cómo habría gestionado los tickets del mes pasado para medir su precisión. Básicamente, estás activando un interruptor y esperando lo mejor, lo cual es una apuesta bastante grande. Este enfoque de todo o nada no te permite ir poco a poco y generar confianza en el sistema antes de entregarle las llaves.

El modelo de precios, explicado

Para entender realmente el coste, ayuda ver los números desglosados. El precio de Intercom varía dependiendo de si estás usando su plataforma completa o simplemente añadiendo la IA de Fin a tu helpdesk actual.

Si usas Fin en la plataforma de Intercom, tienes que pagar una cuota mensual por cada agente, que cambia según tu plan. Y, además de eso, pagas 0,99 $ por cada resolución que la IA gestiona.

Si usas Fin con un helpdesk existente como Zendesk, te ahorras la tarifa por puesto, pero sigues pagando la tarifa de 0,99 $ por resolución. Y tienes que pagar por un mínimo de 50 resoluciones al mes, las uses o no.

Aquí tienes un vistazo rápido a sus principales planes de plataforma:

PlanPrecio por puesto/mes (facturación anual)Tarifa por resoluciónCaracterísticas clave
Essential29 $0,99 $Para particulares y pequeñas empresas
Advanced85 $0,99 $Incluye automatización de flujos de trabajo
Expert132 $0,99 $Incluye SSO y soporte multimarca

Y no te olvides de los posibles complementos. El Copilot de Intercom para agentes humanos cuesta 29 $ adicionales por agente cada mes, y su complemento Proactive Support Plus añade otros 99 $ al mes. Estos costes pueden acumularse rápidamente, convirtiendo lo que parecía una solución simple en un gasto importante.

Para todos los detalles, puedes consultar la página de precios oficial de Intercom.

eesel AI: Una alternativa más simple y potente

Si todo esto te suena a un dolor de cabeza, no te equivocas. Para los equipos que quieren los beneficios de la IA sin los costes impredecibles y la configuración complicada, hay una forma diferente de verlo. Aquí es donde entra en juego eesel AI, creada específicamente para resolver los problemas que hacen que herramientas como Fin de Intercom sean tan desafiantes.

Ponte en marcha en minutos con una configuración que puedes hacer tú mismo

A diferencia de la configuración compleja y laboriosa que requiere Intercom, eesel AI está diseñada para ser sencilla desde el principio. Puedes conectar tu helpdesk existente, ya sea Zendesk, Freshdesk o incluso el propio Intercom, con un solo clic.

Todo el proceso es de autoservicio. Sin llamadas de ventas obligatorias ni largas sesiones de incorporación solo para averiguar si es una buena opción. Puedes registrarte, conectar tus herramientas y poner en marcha tu agente de IA por tu cuenta, en cuestión de minutos. Es un enfoque que respeta tu tiempo y te da el control desde el principio.

Prueba con confianza en una simulación sin riesgos

¿Recuerdas ese arriesgado lanzamiento de "todo o nada" con Intercom? eesel AI soluciona eso con un potente modo de simulación. Antes de que tu IA hable con un solo cliente, puedes probarla con miles de tus tickets pasados en un entorno seguro.

Esto te permite ver exactamente cómo se desempeñará, qué tipo de preguntas puede manejar y dónde podrías tener lagunas en tu base de conocimientos. La simulación te da una previsión precisa de tu tasa de resolución y de los posibles ahorros de costes, eliminando todas las conjeturas de la ecuación para que puedas lanzarla con total confianza.

Unifica todo tu conocimiento, no solo el centro de ayuda

Mientras que la IA de Intercom se apoya casi por completo en un centro de ayuda perfecto, eesel AI sabe que el conocimiento real de tu empresa está disperso por todas partes. Puede conectarse instantáneamente y aprender de todo ello.

Puedes importar fácilmente conocimiento de Confluence, Google Docs, Notion y más. La verdadera magia, sin embargo, es que eesel AI puede entrenarse automáticamente con tus tickets pasados. Esto significa que, desde el primer día, tu agente de IA ya entiende tus problemas comunes, conoce la voz de tu marca y ha aprendido de las soluciones exitosas que tu equipo ha proporcionado miles de veces antes.

Mantén el control con precios predecibles y transparentes

Y luego está el precio. En lugar de la impredecible tarifa de 0,99 $ por resolución de Intercom, eesel AI utiliza un precio mensual fijo. No hay tarifas por resolución, nunca.

Tu factura es la misma cada mes, así que nunca te penalizan por tener una semana ajetreada. Esta previsibilidad te permite escalar tu soporte sin estresarte por un presupuesto descontrolado. eesel AI también ofrece planes mensuales flexibles que puedes cancelar en cualquier momento, lo que supone un compromiso mucho menor que los contratos anuales a largo plazo que muchos competidores imponen.

Pro Tip
Con una herramienta como eesel AI, puedes empezar poco a poco. Elige un tipo de ticket simple y repetitivo para automatizar, como las consultas de '¿dónde está mi pedido?'. Observa cómo funciona, mide el impacto y luego, gradualmente, dale más responsabilidad a la IA a medida que te sientas más cómodo, todo sin que tu factura cambie ni un céntimo.

Por qué importa el enfoque

Mira, que Intercom añada funciones de voz e imagen es un gran avance para el sector. Apunta a un futuro en el que la IA pueda gestionar conversaciones más complejas, haciendo que el soporte se sienta más rápido y humano.

Pero el valor real de estas llamativas funciones depende de cosas prácticas como el coste, la configuración y el control. Un modelo de precios impredecible puede arruinar un presupuesto, una configuración difícil puede agotar el tiempo de tu equipo y un lanzamiento sin las pruebas adecuadas es simplemente arriesgado.

Para la mayoría de los equipos, un enfoque más práctico y con los pies en la tierra tiene más sentido. Plataformas como eesel AI ofrecen precisamente eso. Te proporcionan una IA potente y moderna que funciona con las herramientas que ya tienes, te ponen al mando de la automatización y ofrecen un precio predecible que crece con tu negocio, no con tu número de tickets.

¿Listo para ver lo fácil que es poner a trabajar un agente de IA avanzado con tu helpdesk actual? Prueba eesel AI gratis o reserva una demo para ver nuestro modo de simulación en acción.

Preguntas frecuentes

La IA Fin de Intercom ahora puede procesar más que solo texto. "Multimodal" significa que entiende y responde a entradas como imágenes (Fin Vision) y voz (Fin Voice), lo que permite interacciones de servicio al cliente más ricas y rápidas.

El componente Fin Vision analiza las imágenes o capturas de pantalla subidas. Esto permite a la IA leer mensajes de error, identificar problemas de productos o entender pistas visuales, directamente desde la imagen, reduciendo la necesidad de que los clientes describan los problemas por escrito.

Fin Voice se encuentra actualmente en una fase de pruebas inicial, accesible solo para un pequeño grupo de clientes. Esto significa que aún no está ampliamente disponible ni completamente pulido para uso general, lo que podría ser una preocupación para los equipos que necesitan soluciones estables e inmediatas.

La IA de Intercom cobra 0,99 $ por resolución, lo que lleva a facturas mensuales impredecibles basadas en el volumen de soporte. Esto a menudo se suma a las tarifas mensuales por puesto de la plataforma de Intercom, lo que dificulta la presupuestación.

La IA depende en gran medida de una base de conocimientos completa y bien mantenida. Si tus artículos de ayuda están desactualizados o no son claros, Fin tendrá dificultades, lo que podría llevar a respuestas incorrectas o a un aumento de las escalaciones a agentes humanos.

El blog indica que no hay una forma fácil de probar a fondo el rendimiento de la IA con tus propios datos históricos antes de lanzarla. Esto significa que los equipos a menudo tienen que implementarla directamente, lo que la convierte en un lanzamiento de "todo o nada" con riesgos inherentes.

Compartir esta entrada

Stevia undefined

Article by

Stevia Putri

Stevia Putri is a marketing generalist at eesel AI, where she helps turn powerful AI tools into stories that resonate. She’s driven by curiosity, clarity, and the human side of technology.