Ein Entwicklerleitfaden für die OpenAI Image Variations API

Kenneth Pangan
Written by

Kenneth Pangan

Amogh Sarda
Reviewed by

Amogh Sarda

Last edited October 12, 2025

Expert Verified

Hatten Sie schon einmal ein Bild, das fast perfekt war? Ihnen gefällt das Motiv, die Komposition ist solide, aber Sie wünschten sich einfach, Sie könnten ein paar verschiedene stilistische Varianten davon sehen. Während sich die meisten KI-Tools darauf konzentrieren, Bilder aus Text zu erstellen, müssen Sie manchmal einfach nur mit einem bereits vorhandenen visuellen Element experimentieren.

Genau das ist die Aufgabe der OpenAI Image Variations API. Es ist ein praktisches kleines Werkzeug, um aus einem einzigen Quellbild stilistische Alternativen zu generieren.

Dieser Leitfaden erklärt Ihnen, was die API ist, wie Sie sie mit ein wenig Python zum Laufen bringen und welche wichtigen Eigenheiten und Kosten Sie kennen sollten. Wir werden auch darauf eingehen, warum der Aufbau eines vollwertigen Business-Tools oft mehr erfordert als nur eine rohe API.

Was ist die OpenAI Image Variations API?

Die OpenAI Image Variations API ist ein spezifischer Endpunkt („POST /v1/images/variations“), der ein von Ihnen hochgeladenes Bild entgegennimmt und neue Versionen mit unterschiedlichen künstlerischen Stilen ausgibt. Stellen Sie es sich wie einen kreativen Assistenten vor, der Ihr Ausgangskonzept nehmen und Ihnen verschiedene Möglichkeiten zeigen kann, wie es aussehen könnte, während das Hauptmotiv und das Layout erhalten bleiben.

Man kann dies leicht mit den anderen Bild-APIs von OpenAI verwechseln, also klären wir das auf:

  • Bilderzeugung („/v1/images/generations“): Das ist die, mit der Sie wahrscheinlich am vertrautesten sind. Sie erstellt brandneue Bilder basierend auf einer Texteingabe. Sie geben Wörter ein, sie macht Bilder.

  • Bildbearbeitung („/v1/images/edits“): Mit dieser können Sie Teile eines bestehenden Bildes ändern. Sie geben ihr ein Bild, eine Maske, die den zu ändernden Bereich zeigt, und eine Texteingabe, die erklärt, was zu tun ist.

Die Variations API ist anders, weil sie nur dazu gedacht ist, neue Versionen eines ganzen Bildes zu erstellen, und das ohne Texteingabe von Ihnen. Sie läuft derzeit auf dem DALL-E 2-Modell, was wichtig zu wissen ist, da es andere Regeln und Ergebnisse als das neuere DALL-E 3 hat.

Wie man die OpenAI Image Variations API verwendet

Wenn Sie schon ein wenig Python geschrieben haben, ist die Inbetriebnahme dieser API ziemlich einfach. Hier ist eine kurze Anleitung.

Einrichtung der OpenAI Image Variations API

Zuerst benötigen Sie ein OpenAI-Konto und einen API-Schlüssel. Haben Sie das? Großartig. Jetzt müssen Sie die offizielle Python-Bibliothek „openai“ installieren. Öffnen Sie einfach Ihr Terminal und führen Sie dies aus:


pip install openai  

Es ist immer eine gute Idee, Ihren API-Schlüssel als Umgebungsvariable festzulegen, anstatt ihn direkt in Ihren Code zu kopieren. Dies hilft Ihnen zu vermeiden, ihn versehentlich in ein öffentliches GitHub-Repo zu committen (das ist uns allen schon passiert).

Auf macOS oder Linux:


export OPENAI_API_KEY="your_api_key_here"  

Unter Windows (PowerShell):


$ENV:OPENAI_API_KEY = "your_api_key_here"  

Die Parameter der OpenAI Image Variations API verstehen

Der API-Aufruf selbst ist sauber und einfach, mit nur wenigen Parametern, die Sie kennen müssen:

  • „image“: Dies ist Ihr Ausgangsbild. Es hat einige strenge Regeln: Es muss ein quadratisches PNG sein und weniger als 4 MB wiegen.

  • „n“: Dies teilt der API mit, wie viele Variationen sie für Sie erstellen soll. Sie können zwischen 1 und 10 anfordern.

  • „size“: Dies legt die Abmessungen für die Ausgabebilder fest. Mit DALL-E 2 haben Sie die Wahl zwischen „256x256“, „512x512“ oder „1024x1024“.

  • „response_format“: Sie können eine „url“ (die temporär ist und in einer Stunde abläuft) oder „b64_json“ anfordern, wenn Sie die Base64-kodierten Bilddaten direkt haben möchten.

Ein kurzes Python-Beispiel für die OpenAI Image Variations API

Alles klar, bringen wir alles zusammen. Das folgende Skript öffnet ein Bild von Ihrem Computer, fordert die API auf, zwei Variationen zu generieren, und gibt dann die URL für die erste aus.


import os  

from openai import OpenAI  

# The client will automatically find your OPENAI_API_KEY from the environment variables  

client = OpenAI()  

try:  

    # Open your image file in binary read mode  

    with open("source-image.png", "rb") as image_file:  

        response = client.images.create_variation(  

            image=image_file,  

            n=2,  

            size="1024x1024"  

        )  

    # Print the URL of the first generated image  

    print(response.data[0].url)  

except openai.APIError as e:  

    # Handle API errors here, maybe retry or log it  

    print(f"The OpenAI API returned an error: {e}")  

except Exception as e:  

    print(f"Something unexpected went wrong: {e}")  

Wenn Sie dies ausführen, sendet die API ein JSON-Objekt zurück. Wenn Sie nach einer „url“ gefragt haben, wird es ungefähr so aussehen:


{  

  "created": 1677610602,  

  "data": [  

    {  

      "url": "https://..."  

    },  

    {  

      "url": "https://..."  

    }  

  ]  

}  

Sie können dann diese URL nehmen und sich Ihre neu generierten Bilder ansehen.

Hauptmerkmale und Einschränkungen der OpenAI Image Variations API

Die Variations API ist nützlich, aber sie ist definitiv ein One-Trick-Pony. Ihre Grenzen zu kennen ist genauso wichtig wie zu wissen, wofür sie gut ist.

Die Hauptstärke der OpenAI Image Variations API: Stilistische Erkundung

Das Beste an dieser API ist ihre Fähigkeit, Bilder zu erstellen, die die Seele Ihres Originals bewahren, aber verschiedene künstlerische Wege erkunden. Sie eignet sich hervorragend für Dinge wie:

  • Einige Logokonzepte aus einer ersten Skizze entwickeln.

  • Verschiedene Versionen eines Charakters für ein Spiel erstellen.

  • Verschiedene Produkt-Mockups für A/B-Tests generieren.

Es ist eine schnelle Möglichkeit, visuell zu brainstormen, ohne jedes Mal wieder von vorne anfangen zu müssen.

Einschränkung 1: Sie können keinen Text-Prompt verwenden

Das ist der Punkt, der die meisten Entwickler stolpern lässt. Der Endpunkt „v1/images/variations“ akzeptiert keinen „prompt“-Parameter. Dies ist eine verbreitete Annahme, besonders wenn Sie an die ChatGPT-Oberfläche gewöhnt sind, wo Sie ein Bild hochladen und Anweisungen eingeben können. Die API hält diese Funktionen getrennt.

Das bedeutet, Sie können ihr nicht sagen, „lass das mehr wie ein Aquarellgemälde aussehen“ oder „ändere den Hintergrund in einen sonnigen Tag“. Das Modell generiert Variationen nur auf der Grundlage seiner eigenen Interpretation des von Ihnen bereitgestellten Bildes.

Pro Tip
Wenn Sie die Änderungen unbedingt mit Text steuern müssen, müssen Sie stattdessen den Endpunkt v1/images/edits verwenden. Seien Sie jedoch gewarnt, es ist etwas mehr Arbeit, da Sie eine transparente Maske erstellen müssen, um der API mitzuteilen, welcher Teil des Bildes bearbeitet werden soll.

Einschränkung 2: Sie ist auf DALL-E 2 beschränkt

Die Variations API verwendet derzeit nur das DALL-E 2-Modell. DALL-E 2 ist immer noch beeindruckend, aber es ist ein älteres Modell als DALL-E 3. Das bedeutet, die Bildqualität, der Detaillierungsgrad und die allgemeine Kohärenz sind möglicherweise nicht so scharf wie bei der Generierung eines neuen Bildes mit DALL-E 3. Es ist ein klassischer Kompromiss: Sie erhalten schnelle Iteration auf Kosten von erstklassiger Qualität.

Einschränkung 3: Die Eingabeanforderungen sind pingelig

Die API ist sehr wählerisch, was das Bild angeht, das Sie ihr geben. Es muss absolut eine quadratische PNG-Datei sein, die unter 4 MB groß ist. Das bedeutet normalerweise, dass Sie Ihre Bilder vorverarbeiten müssen, bevor Sie überhaupt einen API-Aufruf machen können. Sie werden feststellen, dass Sie Code schreiben müssen, um die Größenänderung, das Zuschneiden, die Konvertierung von Formaten und vielleicht sogar die Komprimierung von Bildern zu handhaben, nur damit sie funktionieren. Es ist kein Dealbreaker, aber es ist zusätzlicher Aufwand und eine weitere Sache, die Sie in Ihrer Anwendung verwalten müssen.

Preisgestaltung der OpenAI Image Variations API verstehen

Die API-Preise von OpenAI sind Pay-as-you-go, und die Bildmodelle sind ziemlich einfach bepreist. Für das DALL-E 2-Modell, das die Variations API verwendet, hängen die Kosten von der von Ihnen angeforderten Bildgröße ab.

Hier ist die Aufschlüsselung von der offiziellen Preisseite von OpenAI:

AuflösungPreis pro Bild
1024×1024$0.020
512×512$0.018
256×256$0.016

Die Kosten pro Bild sind niedrig, aber wenn Sie Hunderte oder Tausende von Variationen generieren, kann sich das definitiv summieren. Es ist auch erwähnenswert, dass DALL-E 3 teurer ist, was die Variations API zu einer budgetfreundlicheren Option für einfache stilistische Erkundungen macht, auch wenn sie weniger leistungsstark ist.

Der Kopfschmerz beim Erstellen von Business-Tools mit der OpenAI Image Variations API

Mit der OpenAI Image Variations API zu spielen macht Spaß, aber es wirft auch ein Licht auf eine größere Realität: Grundlegende KI-Modelle sind cool, aber sie sind keine fertigen Geschäftslösungen.

Wie wir gerade gesehen haben, stoßen Sie schnell auf kleine Ärgernisse, die bei größerem Maßstab zu großen Problemen werden:

  • Modellgrenzen: Sie sind an ein älteres Modell gebunden und haben keine wirkliche Kontrolle über das Endergebnis.

  • Pingelige Eingaben: Sie müssen eine ganze Vorverarbeitungspipeline aufbauen, nur um einen gültigen API-Aufruf zu machen.

  • Jonglieren mit Endpunkten: Müssen Sie Bilder generieren, variieren und bearbeiten? Machen Sie sich bereit, drei verschiedene APIs zu verwalten, jede mit ihren eigenen Regeln.

  • Unvorhersehbare Kosten: Nutzungsbasierte Preise sind schwer zu budgetieren, besonders wenn Sie ein Unternehmen führen.

Diese rohen APIs sind fantastisch zum Herumspielen oder für sehr spezifische, eng gefasste Aufgaben. Aber wenn Sie versuchen, ein ausgefeiltes, zuverlässiges Produkt darauf aufzubauen, verpflichten Sie sich zu viel Entwicklungsarbeit und laufender Wartung.

Für die Geschäftsautomatisierung benötigen Sie eine Plattform

Angenommen, Sie erstellen nicht nur Bilder, sondern versuchen, ein intelligentes Werkzeug für Ihr Unternehmen zu bauen, wie eine KI für den Kundensupport. Sie würden vor ähnlichen Hürden stehen. Sie müssten sich mit Ihrem Helpdesk integrieren, Arbeitsabläufe herausfinden, die KI auf die Stimme Ihres Unternehmens trainieren und alles endlos testen.

Hier macht eine dedizierte Plattform wie eesel AI viel mehr Sinn. Sie ist speziell dafür gebaut, diese Herausforderungen für den Kundensupport und das interne Wissensmanagement zu bewältigen.

  • In Minuten live gehen: Anstatt Ihre Tage damit zu verbringen, sich mit API-Integrationen herumzuschlagen, verbindet sich eesel AI mit Ihrem Helpdesk (wie Zendesk oder Freshdesk) und Wissensquellen (wie Confluence oder Google Docs) mit einem Klick. Sie können einen funktionierenden KI-Agenten in der Zeit haben, die Sie für einen Kaffee brauchen.

  • Tatsächliche Kontrolle und Anpassung: Eine rohe API gibt Ihnen sehr wenig Mitspracherecht beim Ergebnis. Mit eesel AI erhalten Sie eine vollständige Workflow-Engine. Sie können die Persönlichkeit der KI festlegen, genau entscheiden, auf welche Tickets sie reagiert, und benutzerdefinierte Aktionen erstellen, wie das Nachschlagen von Bestellinformationen in Shopify.

  • Vorhersehbare Preise: Die Preisgestaltung von OpenAI kann Sie im Ungewissen darüber lassen, wie hoch Ihre Rechnung sein wird. Die Pläne von eesel AI basieren auf einer festen Anzahl von KI-Interaktionen, sodass Sie am Ende eines geschäftigen Monats keine böse Überraschung erleben.

Was ist das Fazit zur OpenAI Image Variations API?

Die OpenAI Image Variations API ist ein nettes Werkzeug für eine sehr spezifische Aufgabe: das Erstellen von stilistischen Ablegern eines Bildes, das Sie bereits haben. Es ist eine großartige Möglichkeit, kreative Ideen schnell zu erkunden, solange Sie sich an ihre Grenzen erinnern: Sie arbeiten mit DALL-E 2 und können keine Textanweisungen geben.

Und obwohl das Herumspielen mit rohen APIs eine großartige Möglichkeit zum Lernen ist, ist der Bau ernsthafter Business-Tools für etwas wie die Support-Automatisierung ein ganz anderes Spiel. Die Kopfschmerzen bei der Verwaltung von Integrationen, Workflows und unvorhersehbaren Kosten sind genau der Grund, warum Plattformen wie eesel AI existieren. Sie ermöglichen es Ihnen, sich auf die Lösung Ihres Geschäftsproblems zu konzentrieren, anstatt sich in API-Dokumentationen zu verzetteln.

Bereit zu sehen, was eine speziell entwickelte KI-Plattform für Ihr Team tun kann? Sie können sich den Aufwand sparen, von Grund auf neu zu bauen. Testen Sie eesel AI kostenlos und setzen Sie einen echten KI-Agenten in wenigen Minuten ein.

Häufig gestellte Fragen

Die OpenAI Image Variations API wurde entwickelt, um stilistische Alternativen aus einem einzigen Quellbild zu generieren. Sie nimmt ein vorhandenes Bild und erstellt neue Versionen, die das Hauptmotiv und die Komposition beibehalten, aber unterschiedliche künstlerische Stile erkunden.

Nein, eine wesentliche Einschränkung der OpenAI Image Variations API ist, dass sie keinen Text-Prompt akzeptiert. Sie generiert Variationen ausschließlich auf der Grundlage ihrer Interpretation des bereitgestellten Bildes, ohne textliche Anleitung vom Benutzer.

Bei der Verwendung der OpenAI Image Variations API muss Ihr Eingangsbild eine quadratische PNG-Datei sein. Zusätzlich muss die Dateigröße unter 4 MB liegen. Bilder müssen oft vorverarbeitet werden, um diese strengen Anforderungen zu erfüllen, bevor ein API-Aufruf gemacht werden kann.

Die OpenAI Image Variations API läuft derzeit auf dem DALL-E 2-Modell. Obwohl DALL-E 2 immer noch leistungsstark ist, ist es ein älteres Modell als DALL-E 3, was bedeutet, dass die Ausgabequalität und der Detailgrad sich von dem unterscheiden können, was Sie mit den neuesten Generationsmodellen erhalten würden.

Die Preisgestaltung für die OpenAI Image Variations API basiert auf der Auflösung der von Ihnen angeforderten Ausgabebilder. Die Kosten werden in der Regel pro generiertem Bild berechnet, wobei höhere Auflösungen (wie 1024x1024) etwas teurer sind als niedrigere (wie 256x256).

Die OpenAI Image Variations API erstellt neue stilistische Versionen eines gesamten Bildes ohne Text-Prompts. Im Gegensatz dazu ermöglicht die Image Editing API das Ändern spezifischer Teile eines vorhandenen Bildes, indem eine transparente Maske und ein Text-Prompt zur Steuerung der Bearbeitung bereitgestellt werden.

Diesen Beitrag teilen

Kenneth undefined

Article by

Kenneth Pangan

Writer and marketer for over ten years, Kenneth Pangan splits his time between history, politics, and art with plenty of interruptions from his dogs demanding attention.