Guide du développeur pour l'API de variations d'images d'OpenAI

Kenneth Pangan
Written by

Kenneth Pangan

Amogh Sarda
Reviewed by

Amogh Sarda

Last edited 12 octobre 2025

Expert Verified

Avez-vous déjà eu une image presque parfaite ? Vous aimez le sujet, la composition est solide, mais vous aimeriez simplement pouvoir en voir quelques interprétations stylistiques différentes. Alors que la plupart des outils d'IA se concentrent sur la création d'images à partir de texte, il arrive que vous ayez simplement besoin d'improviser à partir d'un visuel que vous possédez déjà.

C'est à peu près exactement le rôle de l'API Image Variations d'OpenAI. C'est un petit outil pratique pour générer des alternatives stylistiques à partir d'une seule image source.

Ce guide vous expliquera ce qu'est l'API, comment la faire fonctionner avec un peu de Python, ainsi que certaines des particularités et des coûts importants que vous devriez connaître. Nous aborderons également la raison pour laquelle la création d'un outil professionnel complet nécessite souvent plus qu'une simple API brute.

Qu'est-ce que l'API Image Variations d'OpenAI ?

L'API Image Variations d'OpenAI est un endpoint spécifique ("POST /v1/images/variations") qui prend une image que vous téléchargez et produit de nouvelles versions avec différents styles artistiques. Considérez-la comme un assistant créatif capable de prendre votre concept de départ et de vous montrer différentes manières dont il pourrait être rendu, tout en conservant le sujet principal et la mise en page intacts.

Il est facile de la confondre avec les autres API d'images d'OpenAI, alors clarifions cela :

  • Génération d'images ("/v1/images/generations") : C'est celle que vous connaissez probablement le mieux. Elle crée des images entièrement nouvelles à partir d'un prompt textuel. Vous tapez des mots, elle crée des images.

  • Édition d'images ("/v1/images/edits") : Celle-ci vous permet de modifier des parties d'une image existante. Vous lui fournissez une image, un masque indiquant la zone à modifier et un prompt textuel expliquant quoi faire.

L'API Variations est différente car elle est uniquement destinée à créer de nouvelles versions d'une image entière, et ce, sans aucune saisie de texte de votre part. Elle fonctionne actuellement avec le modèle DALL-E 2, ce qui est important à retenir car il a des règles et des résultats différents du plus récent DALL-E 3.

Comment utiliser l'API Image Variations d'OpenAI

Si vous avez déjà écrit un peu de Python, faire fonctionner cette API est assez simple. Voici un guide rapide.

Se préparer à utiliser l'API Image Variations d'OpenAI

Tout d'abord, vous aurez besoin d'un compte OpenAI et d'une clé API. C'est bon ? Parfait. Maintenant, vous devez installer la bibliothèque Python officielle "openai". Ouvrez simplement votre terminal et exécutez ceci :


pip install openai  

Il est toujours préférable de définir votre clé API comme une variable d'environnement plutôt que de la coller directement dans votre code. Cela vous aide à éviter de la commettre accidentellement dans un dépôt GitHub public (on est tous passés par là).

Sur macOS ou Linux :


export OPENAI_API_KEY="votre_clé_api_ici"  

Sur Windows (PowerShell) :


$ENV:OPENAI_API_KEY = "votre_clé_api_ici"  

Comprendre les paramètres de l'API Image Variations d'OpenAI

L'appel API lui-même est propre et simple, avec seulement quelques paramètres que vous devez connaître :

  • "image" : C'est votre image de départ. Elle a des règles strictes : ce doit être un PNG carré et peser moins de 4 Mo.

  • "n" : Indique à l'API combien de variations créer pour vous. Vous pouvez en demander entre 1 et 10.

  • "size" : Définit les dimensions des images de sortie. Avec DALL-E 2, vos choix sont "256x256", "512x512" ou "1024x1024".

  • "response_format" : Vous pouvez demander une "url" (qui est temporaire et expire dans une heure) ou "b64_json" si vous voulez les données de l'image encodées en Base64 directement.

Un exemple rapide en Python pour l'API Image Variations d'OpenAI

Bien, mettons tout cela en place. Le script ci-dessous ouvrira une image depuis votre ordinateur, demandera à l'API de générer deux variations, puis affichera l'URL de la première.


import os  

from openai import OpenAI  

# Le client trouvera automatiquement votre OPENAI_API_KEY dans les variables d'environnement  

client = OpenAI()  

try:  

    # Ouvrez votre fichier image en mode lecture binaire  

    with open("source-image.png", "rb") as image_file:  

        response = client.images.create_variation(  

            image=image_file,  

            n=2,  

            size="1024x1024"  

        )  

    # Affichez l'URL de la première image générée  

    print(response.data[0].url)  

except openai.APIError as e:  

    # Gérez les erreurs de l'API ici, peut-être en réessayant ou en les consignant  

    print(f"L'API OpenAI a retourné une erreur : {e}")  

except Exception as e:  

    print(f"Quelque chose d'inattendu s'est produit : {e}")  

Lorsque vous exécutez ce script, l'API renvoie un objet JSON. Si vous avez demandé une "url", il ressemblera à quelque chose comme ceci :


{  

  "created": 1677610602,  

  "data": [  

    {  

      "url": "https://..."  

    },  

    {  

      "url": "https://..."  

    }  

  ]  

}  

Vous pouvez ensuite récupérer cette URL et découvrir vos nouvelles images générées.

Principales fonctionnalités et limitations de l'API Image Variations d'OpenAI

L'API Variations est utile, mais elle est définitivement spécialisée. Connaître ses limites est tout aussi important que de savoir à quoi elle sert.

La principale force de l'API Image Variations d'OpenAI : l'exploration stylistique

La meilleure chose à propos de cette API est sa capacité à créer des images qui conservent l'âme de votre original tout en explorant différentes voies artistiques. C'est excellent pour des choses comme :

  • Créer quelques concepts de logo à partir d'une esquisse initiale.

  • Créer différentes versions d'un personnage pour un jeu.

  • Générer des maquettes de produits variées pour des tests A/B.

C'est un moyen rapide de brainstormer visuellement sans avoir à repartir de zéro à chaque fois.

Limitation 1 : Vous ne pouvez pas utiliser de prompt textuel

C'est ce qui déroute la plupart des développeurs. Le endpoint "v1/images/variations" n'accepte pas de paramètre "prompt". C'est une supposition courante, surtout si vous êtes habitué à l'interface de ChatGPT où vous pouvez télécharger une image et taper des instructions. L'API maintient ces fonctions séparées.

Cela signifie que vous ne pouvez pas lui dire « fais en sorte que ça ressemble plus à une aquarelle » ou « change l'arrière-plan pour une journée ensoleillée ». Le modèle génère des variations basées uniquement sur sa propre interprétation de l'image que vous avez fournie.

Pro Tip
Si vous avez absolument besoin de guider les changements avec du texte, vous devrez utiliser le endpoint v1/images/edits à la place. Mais attention, c'est un peu plus de travail car vous devez créer un masque transparent pour indiquer à l'API quelle partie de l'image modifier.

Limitation 2 : Elle est bloquée sur DALL-E 2

L'API Variations n'utilise actuellement que le modèle DALL-E 2. DALL-E 2 est toujours impressionnant, mais c'est un modèle plus ancien que DALL-E 3. Cela signifie que la qualité de l'image, le niveau de détail et la cohérence générale pourraient ne pas être aussi nets que ce que vous obtiendriez en générant une nouvelle image avec DALL-E 3. C'est un compromis classique : vous obtenez une itération rapide au détriment d'une qualité de premier ordre.

Limitation 3 : Les exigences d'entrée sont pointilleuses

L'API est très exigeante quant à l'image que vous lui fournissez. Elle doit absolument être un fichier PNG carré de moins de 4 Mo. Cela signifie généralement que vous devez prétraiter vos images avant même de pouvoir effectuer un appel API. Vous vous retrouverez à écrire du code pour gérer le redimensionnement, le recadrage, la conversion de formats et peut-être même la compression des images juste pour qu'elles fonctionnent. Ce n'est pas un obstacle insurmontable, mais c'est une friction supplémentaire et une chose de plus à gérer dans votre application.

Comprendre la tarification de l'API Image Variations d'OpenAI

La tarification de l'API d'OpenAI est basée sur l'utilisation, et les modèles d'images sont tarifés assez simplement. Pour le modèle DALL-E 2 que l'API Variations utilise, le coût dépend de la taille de l'image que vous demandez.

Voici le détail de la page de tarification officielle d'OpenAI :

RésolutionPrix par image
1024×10240,020 $
512×5120,018 $
256×2560,016 $

Le coût par image est faible, mais si vous générez des centaines ou des milliers de variations, cela peut certainement commencer à s'accumuler. Il convient également de noter que DALL-E 3 est plus cher, ce qui fait de l'API Variations une option plus économique pour une simple exploration stylistique, même si elle est moins puissante.

Le casse-tête de la création d'outils professionnels avec l'API Image Variations d'OpenAI

Jouer avec l'API Image Variations d'OpenAI est amusant, mais cela met également en lumière une réalité plus large : les modèles d'IA fondamentaux sont cool, mais ils ne sont pas des solutions professionnelles prêtes à l'emploi.

Comme nous venons de le voir, vous rencontrez rapidement de petits désagréments qui deviennent de gros problèmes à grande échelle :

  • Limites du modèle : Vous êtes cantonné à un modèle plus ancien et n'avez aucun contrôle réel sur le résultat final.

  • Entrées pointilleuses : Vous devez construire tout un pipeline de prétraitement juste pour effectuer un appel API valide.

  • Jongler avec les endpoints : Besoin de générer, de varier et d'éditer des images ? Préparez-vous à gérer trois API différentes, chacune avec son propre ensemble de règles.

  • Coûts imprévisibles : La tarification basée sur l'utilisation est difficile à budgétiser, surtout lorsque vous essayez de gérer une entreprise.

Ces API brutes sont fantastiques pour bricoler ou pour des tâches très spécifiques et limitées. Mais si vous essayez de construire un produit peaufiné et fiable par-dessus, vous vous engagez dans beaucoup de travail de développement et de maintenance continue.

Pour l'automatisation en entreprise, vous voudrez une plateforme

Disons que vous ne créez pas seulement des images, mais que vous essayez de construire un outil intelligent pour votre entreprise, comme une IA pour le support client. Vous seriez confronté à des obstacles similaires. Vous devriez vous intégrer à votre service d'assistance, définir des flux de travail, entraîner l'IA sur le ton de votre entreprise et tout tester à l'infini.

C'est là qu'une plateforme dédiée comme eesel AI a beaucoup plus de sens. Elle est conçue spécifiquement pour relever ces défis pour le support client et la gestion des connaissances internes.

  • Mise en service en quelques minutes : Au lieu de passer vos journées à vous battre avec des intégrations d'API, eesel AI se connecte à votre service d'assistance (comme Zendesk ou Freshdesk) et à vos sources de connaissances (comme Confluence ou Google Docs) en un clic. Vous pouvez avoir un agent IA fonctionnel le temps de prendre un café.

  • Contrôle et personnalisation réels : Une API brute vous donne très peu de contrôle sur le résultat. Avec eesel AI, vous disposez d'un moteur de workflow complet. Vous pouvez définir la personnalité de l'IA, décider exactement à quels tickets elle répond et créer des actions personnalisées, comme rechercher des informations de commande dans Shopify.

  • Tarification prévisible : La tarification d'OpenAI peut vous laisser dans le flou quant au montant de votre facture. Les plans d'eesel AI sont basés sur un nombre défini d'interactions avec l'IA, vous n'avez donc pas de mauvaise surprise à la fin d'un mois chargé.

Quel est le verdict sur l'API Image Variations d'OpenAI ?

L'API Image Variations d'OpenAI est un outil astucieux pour une tâche très spécifique : créer des déclinaisons stylistiques d'une image que vous possédez déjà. C'est un excellent moyen d'explorer rapidement des idées créatives, tant que vous vous souvenez de ses limites : vous travaillez avec DALL-E 2 et vous ne pouvez lui donner aucune instruction textuelle.

Et bien que bricoler avec des API brutes soit un excellent moyen d'apprendre, construire des outils professionnels sérieux pour quelque chose comme l'automatisation du support est une autre paire de manches. Les maux de tête liés à la gestion des intégrations, des flux de travail et des coûts imprévisibles sont exactement la raison pour laquelle des plateformes comme eesel AI existent. Elles vous permettent de vous concentrer sur la résolution de votre problème métier au lieu de vous embourber dans la documentation de l'API.

Prêt à voir ce qu'une plateforme d'IA conçue sur mesure peut faire pour votre équipe ? Vous pouvez éviter les tracas de la construction à partir de zéro. Essayez eesel AI gratuitement et déployez un véritable agent IA en quelques minutes.

Foire aux questions

L'API Image Variations d'OpenAI est conçue pour générer des alternatives stylistiques à partir d'une seule image source. Elle prend une image existante et crée de nouvelles versions qui conservent le sujet principal et la composition mais explorent différents styles artistiques.

Non, une limitation clé de l'API Image Variations d'OpenAI est qu'elle n'accepte pas de prompt textuel. Elle génère des variations uniquement basées sur son interprétation de l'image fournie, sans aucune directive textuelle de l'utilisateur.

Lorsque vous utilisez l'API Image Variations d'OpenAI, votre image d'entrée doit être un fichier PNG carré. De plus, sa taille de fichier doit être inférieure à 4 Mo. Les images nécessitent souvent un prétraitement pour répondre à ces exigences strictes avant de pouvoir effectuer un appel API.

L'API Image Variations d'OpenAI fonctionne actuellement avec le modèle DALL-E 2. Bien que toujours puissant, DALL-E 2 est un modèle plus ancien que DALL-E 3, ce qui signifie que la qualité et le détail du résultat peuvent différer de ce que vous obtiendriez avec les modèles de dernière génération.

La tarification de l'API Image Variations d'OpenAI est basée sur la résolution des images de sortie que vous demandez. Les coûts sont généralement par image générée, les résolutions plus élevées (comme 1024x1024) étant légèrement plus chères que les plus basses (comme 256x256).

L'API Image Variations d'OpenAI crée de nouvelles versions stylistiques d'une image entière sans prompts textuels. En revanche, l'API Image Editing vous permet de modifier des parties spécifiques d'une image existante en fournissant un masque transparent et un prompt textuel pour guider la modification.

Partager cet article

Kenneth undefined

Article by

Kenneth Pangan

Writer and marketer for over ten years, Kenneth Pangan splits his time between history, politics, and art with plenty of interruptions from his dogs demanding attention.