Guía para desarrolladores de la API de variaciones de imagen de OpenAI

Kenneth Pangan
Written by

Kenneth Pangan

Amogh Sarda
Reviewed by

Amogh Sarda

Last edited 12 octubre 2025

Expert Verified

¿Alguna vez has tenido una imagen que es casi perfecta? Te gusta el sujeto, la composición es sólida, pero desearías poder ver algunas versiones estilísticas diferentes. Aunque la mayoría de las herramientas de IA se centran en crear imágenes a partir de texto, a veces solo necesitas improvisar sobre un elemento visual que ya tienes.

Ese es precisamente el trabajo de la API de variaciones de imágenes de OpenAI. Es una pequeña herramienta muy útil para generar alternativas estilísticas a partir de una única imagen de origen.

Esta guía te explicará qué es la API, cómo hacerla funcionar con un poco de Python, y algunas de las peculiaridades y costes importantes que deberías conocer. También hablaremos de por qué construir una herramienta empresarial completa a menudo requiere más que una simple API en bruto.

¿Qué es la API de variaciones de imágenes de OpenAI?

La API de variaciones de imágenes de OpenAI es un endpoint específico ("POST /v1/images/variations") que toma una imagen que subes y genera nuevas versiones con diferentes estilos artísticos. Piénsalo como un asistente creativo que puede tomar tu concepto inicial y mostrarte varias formas diferentes en las que podría verse, todo mientras mantiene intactos el sujeto principal y la composición.

Es fácil confundirla con las otras API de imágenes de OpenAI, así que aclaremos las cosas:

  • Generación de imágenes ("/v1/images/generations"): Esta es la que probablemente te resulte más familiar. Crea imágenes completamente nuevas a partir de un prompt de texto. Tú escribes palabras, ella crea imágenes.

  • Edición de imágenes ("/v1/images/edits"): Esta te permite cambiar partes de una imagen existente. Le das una imagen, una máscara que muestra el área a cambiar y un prompt de texto que explica qué hacer.

La API de variaciones es diferente porque solo está pensada para crear nuevas versiones de una imagen completa, y lo hace sin ninguna entrada de texto por tu parte. Actualmente funciona con el modelo DALL-E 2, lo cual es importante recordar porque tiene reglas y resultados diferentes a los del más reciente DALL-E 3.

Cómo usar la API de variaciones de imágenes de OpenAI

Si ya has escrito algo de Python antes, poner en marcha esta API es bastante sencillo. Aquí tienes un recorrido rápido.

Preparación para usar la API de variaciones de imágenes de OpenAI

Primero, necesitarás una cuenta de OpenAI y una clave de API. ¿La tienes? Genial. Ahora, tendrás que instalar la biblioteca oficial de Python "openai". Simplemente abre tu terminal y ejecuta esto:


pip install openai  

Siempre es una buena idea establecer tu clave de API como una variable de entorno en lugar de pegarla directamente en tu código. Esto te ayuda a evitar subirla accidentalmente a un repositorio público de GitHub (a todos nos ha pasado).

En macOS o Linux:


export OPENAI_API_KEY="tu_clave_de_api_aquí"  

En Windows (PowerShell):


$ENV:OPENAI_API_KEY = "tu_clave_de_api_aquí"  

Entendiendo los parámetros de la API de variaciones de imágenes de OpenAI

La llamada a la API en sí es limpia y sencilla, con solo unos pocos parámetros que necesitas conocer:

  • "image": Esta es tu imagen de partida. Tiene algunas reglas estrictas: debe ser un archivo PNG cuadrado y pesar menos de 4 MB.

  • "n": Esto le dice a la API cuántas variaciones debe crear para ti. Puedes solicitar entre 1 y 10.

  • "size": Esto establece las dimensiones de las imágenes de salida. Con DALL-E 2, tus opciones son "256x256", "512x512" o "1024x1024".

  • "response_format": Puedes solicitar una "url" (que es temporal y caduca en una hora) o "b64_json" si quieres los datos de la imagen codificados en Base64 directamente.

Un ejemplo rápido en Python para la API de variaciones de imágenes de OpenAI

Muy bien, vamos a unirlo todo. El siguiente script abrirá una imagen de tu ordenador, le pedirá a la API que genere dos variaciones y luego imprimirá la URL de la primera.


import os  

from openai import OpenAI  

# El cliente encontrará automáticamente tu OPENAI_API_KEY en las variables de entorno  

client = OpenAI()  

try:  

    # Abre tu archivo de imagen en modo de lectura binaria  

    with open("source-image.png", "rb") as image_file:  

        response = client.images.create_variation(  

            image=image_file,  

            n=2,  

            size="1024x1024"  

        )  

    # Imprime la URL de la primera imagen generada  

    print(response.data[0].url)  

except openai.APIError as e:  

    # Maneja los errores de la API aquí, quizás reintentando o registrándolos  

    print(f"La API de OpenAI devolvió un error: {e}")  

except Exception as e:  

    print(f"Algo inesperado salió mal: {e}")  

Cuando ejecutas esto, la API devuelve un objeto JSON. Si pediste una "url", se verá algo así:


{  

  "created": 1677610602,  

  "data": [  

    {  

      "url": "https://..."  

    },  

    {  

      "url": "https://..."  

    }  

  ]  

}  

Puedes tomar esa URL y ver tus imágenes recién generadas.

Características clave y limitaciones de la API de variaciones de imágenes de OpenAI

La API de variaciones es útil, pero definitivamente es una herramienta para una sola tarea. Conocer sus límites es tan importante como saber para qué sirve.

La principal fortaleza de la API de variaciones de imágenes de OpenAI: la exploración estilística

Lo mejor de esta API es su capacidad para crear imágenes que mantienen el alma de tu original pero exploran diferentes vías artísticas. Es genial para cosas como:

  • Generar rápidamente algunos conceptos de logotipo a partir de un boceto inicial.

  • Crear diferentes versiones de un personaje para un juego.

  • Generar maquetas de productos variadas para pruebas A/B.

Es una forma rápida de hacer una lluvia de ideas visual sin tener que volver a empezar cada vez.

Limitación 1: No puedes usar un prompt de texto

Este es el punto que confunde a la mayoría de los desarrolladores. El endpoint "v1/images/variations" no acepta un parámetro "prompt". Es una suposición común, especialmente si estás acostumbrado a la interfaz de ChatGPT donde puedes subir una imagen y escribir instrucciones. La API mantiene estas funciones separadas.

Esto significa que no puedes decirle "haz que esto parezca más una pintura de acuarela" o "cambia el fondo a un día soleado". El modelo genera variaciones basándose únicamente en su propia interpretación de la imagen que proporcionaste.

Pro Tip
Si necesitas sí o sí guiar los cambios con texto, tendrás que usar el endpoint v1/images/edits. Pero ten en cuenta que es un poco más de trabajo, ya que tienes que crear una máscara transparente para decirle a la API qué parte de la imagen editar.

Limitación 2: Está anclada en DALL-E 2

Actualmente, la API de variaciones solo utiliza el modelo DALL-E 2. DALL-E 2 sigue siendo impresionante, pero es un modelo más antiguo que DALL-E 3. Esto significa que la calidad de la imagen, el nivel de detalle y la coherencia general podrían no ser tan nítidos como los que obtendrías generando una nueva imagen con DALL-E 3. Es un clásico equilibrio: obtienes una iteración rápida a costa de una calidad de primer nivel.

Limitación 3: Los requisitos de entrada son exigentes

La API es muy quisquillosa con la imagen que le proporcionas. Debe ser obligatoriamente un archivo PNG cuadrado de menos de 4 MB. Esto generalmente significa que tienes que preprocesar tus imágenes antes de poder hacer una llamada a la API. Te encontrarás escribiendo código para redimensionar, recortar, convertir formatos y quizás incluso comprimir imágenes solo para que funcionen. No es un factor decisivo, pero es una fricción adicional y una cosa más que gestionar en tu aplicación.

Entendiendo los precios de la API de variaciones de imágenes de OpenAI

Los precios de la API de OpenAI son de pago por uso, y los modelos de imagen tienen un precio bastante simple. Para el modelo DALL-E 2 que utiliza la API de variaciones, el coste depende del tamaño de imagen que solicites.

Aquí está el desglose de la página oficial de precios de OpenAI:

ResoluciónPrecio por imagen
1024×10240,020 $
512×5120,018 $
256×2560,016 $

El coste por imagen es bajo, pero si estás generando cientos o miles de variaciones, definitivamente puede empezar a acumularse. También vale la pena señalar que DALL-E 3 es más caro, lo que hace que la API de variaciones sea una opción más económica para la exploración estilística simple, aunque sea menos potente.

El quebradero de cabeza de crear herramientas empresariales con la API de variaciones de imágenes de OpenAI

Jugar con la API de variaciones de imágenes de OpenAI es divertido, pero también arroja luz sobre una realidad más grande: los modelos de IA fundacionales son geniales, pero no son soluciones empresariales listas para usar.

Como acabamos de ver, rápidamente te encuentras con pequeñas molestias que se convierten en grandes problemas a escala:

  • Límites del modelo: Estás atado a un modelo más antiguo y no tienes un control real sobre el resultado final.

  • Entradas exigentes: Tienes que construir todo un sistema de preprocesamiento solo para poder hacer una llamada válida a la API.

  • Manejo de múltiples endpoints: ¿Necesitas generar, variar y editar imágenes? Prepárate para gestionar tres API diferentes, cada una con su propio conjunto de reglas.

  • Costes impredecibles: Es difícil presupuestar con precios basados en el uso, especialmente cuando intentas dirigir un negocio.

Estas API en bruto son fantásticas para experimentar o para tareas muy específicas y limitadas. Pero si intentas construir un producto pulido y fiable sobre ellas, te estás comprometiendo a una gran cantidad de trabajo de desarrollo y mantenimiento continuo.

Para la automatización empresarial, querrás una plataforma

Digamos que no solo estás creando imágenes, sino que intentas construir una herramienta inteligente para tu negocio, como una IA para atención al cliente. Te enfrentarías a obstáculos similares. Tendrías que integrarte con tu centro de ayuda, definir flujos de trabajo, entrenar a la IA en el tono de tu empresa y probarlo todo sin cesar.

Aquí es donde una plataforma dedicada como eesel AI tiene mucho más sentido. Está construida específicamente para manejar estos desafíos para la atención al cliente y la gestión del conocimiento interno.

  • Puesta en marcha en minutos: En lugar de pasar tus días lidiando con integraciones de API, eesel AI se conecta a tu centro de ayuda (como Zendesk o Freshdesk) y fuentes de conocimiento (como Confluence o Google Docs) con un solo clic. Puedes tener un agente de IA funcionando en lo que tardas en tomar un café.

  • Control y personalización reales: Una API en bruto te da muy poco poder de decisión sobre el resultado. Con eesel AI, obtienes un motor de flujos de trabajo completo. Puedes establecer la personalidad de la IA, decidir exactamente a qué tickets responde y crear acciones personalizadas, como buscar información de pedidos en Shopify.

  • Precios predecibles: Los precios de OpenAI pueden hacer que te preguntes cuál será tu factura. Los planes de eesel AI se basan en un número fijo de interacciones de IA, por lo que no te llevas una sorpresa desagradable al final de un mes ajetreado.

¿Cuál es el veredicto sobre la API de variaciones de imágenes de OpenAI?

La API de variaciones de imágenes de OpenAI es una herramienta interesante para un trabajo muy específico: crear derivaciones estilísticas de una imagen que ya tienes. Es una excelente manera de explorar ideas creativas rápidamente, siempre y cuando recuerdes sus límites: estás trabajando con DALL-E 2 y no puedes darle ninguna instrucción de texto.

Y aunque experimentar con API en bruto es una gran manera de aprender, construir herramientas empresariales serias para algo como la automatización del soporte es un juego completamente diferente. Los quebraderos de cabeza de gestionar integraciones, flujos de trabajo y costes impredecibles son exactamente la razón por la que existen plataformas como eesel AI. Te permiten centrarte en resolver tu problema de negocio en lugar de quedarte atascado en la documentación de la API.

¿Listo para ver lo que una plataforma de IA diseñada específicamente puede hacer por tu equipo? Puedes saltarte la molestia de construir desde cero. Prueba eesel AI gratis y despliega un agente de IA real en minutos.

Preguntas frecuentes

La API de variaciones de imágenes de OpenAI está diseñada para generar alternativas estilísticas a partir de una única imagen de origen. Toma una imagen existente y crea nuevas versiones que mantienen el sujeto principal y la composición, pero exploran diferentes estilos artísticos.

No, una limitación clave de la API de variaciones de imágenes de OpenAI es que no acepta un prompt de texto. Genera variaciones basándose únicamente en su interpretación de la imagen proporcionada, sin ninguna guía textual del usuario.

Al utilizar la API de variaciones de imágenes de OpenAI, tu imagen de entrada debe ser un archivo PNG cuadrado. Además, su tamaño de archivo debe ser inferior a 4 MB. A menudo, las imágenes necesitan un preprocesamiento para cumplir con estos estrictos requisitos antes de realizar una llamada a la API.

Actualmente, la API de variaciones de imágenes de OpenAI funciona con el modelo DALL-E 2. Aunque sigue siendo potente, DALL-E 2 es un modelo más antiguo que DALL-E 3, lo que significa que la calidad y el detalle de los resultados pueden diferir de lo que obtendrías con los modelos de última generación.

El precio de la API de variaciones de imágenes de OpenAI se basa en la resolución de las imágenes de salida que solicites. Los costes suelen ser por imagen generada, siendo las resoluciones más altas (como 1024x1024) ligeramente más caras que las más bajas (como 256x256).

La API de variaciones de imágenes de OpenAI crea nuevas versiones estilísticas de una imagen completa sin prompts de texto. En cambio, la API de edición de imágenes te permite cambiar partes específicas de una imagen existente proporcionando una máscara transparente y un prompt de texto para guiar la edición.

Compartir esta entrada

Kenneth undefined

Article by

Kenneth Pangan

Writer and marketer for over ten years, Kenneth Pangan splits his time between history, politics, and art with plenty of interruptions from his dogs demanding attention.