GPT-5.3 Codex: Ein tiefer Einblick in die neue agentenbasierte KI von OpenAI

Written by

Kenneth Pangan

Reviewed by

Stanley Nicholas

Last edited February 6, 2026

Expert Verified

OpenAI hat gerade GPT-5.3 Codex veröffentlicht, und es erregt viel Aufmerksamkeit. Dies ist nicht nur ein kleines Update zum Ausspucken von Code-Schnipseln (code snippets). Es ist ein ziemlich großer Sprung, der die KI von einem einfachen Codegenerator in einen Agenten verwandelt, der komplexe Aufgaben auf einem Computer erledigen kann, ähnlich wie ein menschlicher Partner.

Die große Neuigkeit ist, dass es die Programmierstärke seines Vorgängers, GPT-5.2-Codex, mit den logischen Denkfähigkeiten von GPT-5.2 vereint. Das Ergebnis ist ein einziges, eleganteres Modell, das zudem 25 % schneller ist.

Was bedeutet das also konkret für Sie? Wir werden aufschlüsseln, was GPT-5.3 Codex ist, was es leisten kann und welche Hürden es in der Praxis für Unternehmen gibt, die es einsetzen möchten.

Was ist GPT-5.3 Codex?

Ein Screenshot der offiziellen OpenAI-Ankündigungsseite für GPT-5.3 Codex, ein leistungsstarkes neues KI-Modell für Programmierung und agentenbasierte Aufgaben.

Sie können sich GPT-5.3 Codex als das bisher intelligenteste agentenbasierte Programmiermodell von OpenAI vorstellen. Es wurde entwickelt, um bei allen Arten von professioneller Arbeit zu helfen, nicht nur bei einmaligen Programmierproblemen. OpenAI selbst erklärte, dass sie sich von einem Werkzeug zum Schreiben von Code hin zu „einem Agenten, der fast alles tun kann“, was Entwickler und Fachleute am Computer erledigen, entwickeln.

Vielleicht haben Sie auch gehört, dass das Modell „maßgeblich an seiner eigenen Entstehung beteiligt war“. Das klingt nach Science-Fiction, aber die Realität ist bodenständiger. Die KI ist nicht einfach aufgewacht und hat sich selbst erschaffen. Tatsächlich haben die Teams von OpenAI frühe Versionen des Modells genutzt, um ihre eigene Arbeit zu beschleunigen. Sie verwendeten es zum Debuggen von Trainingsläufen, zur Verwaltung von Deployments und zur Überprüfung von Testergebnissen. Im Grunde nutzten sie die KI, um eine bessere KI zu bauen.

Das erste Modell, das *maßgeblich an seiner eigenen Entstehung beteiligt war.

Fazit ist, dass GPT-5.3 Codex als Partner während des gesamten Software-Entwicklungsprozesses und darüber hinaus gedacht ist. Es ist weniger ein Werkzeug, dem Sie Befehle erteilen, sondern eher ein Teamkollege, mit dem Sie zusammenarbeiten.

Wichtige Funktionen und Leistungs-Benchmarks

Dieses neue Modell ist nicht nur eine kleine Verbesserung; es setzt neue Rekorde. Schauen wir uns an, was es so besonders macht.

Ein neuer Spitzenreiter bei Programmier- und Agentenfähigkeiten

GPT-5.3 Codex führt nun die Ranglisten bei einigen der schwierigsten Branchen-Benchmarks sowohl für das Programmieren als auch für „agentenbasierte Fähigkeiten“ (agentic skills) an – was lediglich ein schicker Begriff dafür ist, dass es mehrstufige Aufgaben eigenständig bewältigen kann.

Es erreichte Spitzenwerte beim SWE-Bench Pro, einem Test, der eine KI mit realen Software-Engineering-Problemen von GitHub konfrontiert. Es dominierte auch den Terminal-Bench 2.0, der prüft, wie gut die KI ein Befehlszeilen-Terminal bedienen kann. Beim OSWorld, einem Test für die Erledigung von Aufgaben in einer Desktop-Umgebung, schoss die Leistung massiv nach oben. Sogar beim GDPval, einem Benchmark für allgemeine Wissensarbeit, hält es mit GPT-5.2 Schritt.

Hier ist ein kurzer Vergleich. In der folgenden Grafik sehen Sie eine visuelle Aufschlüsselung, wie GPT-5.3 Codex im Vergleich zu seinen Vorgängern abschneidet.

Eine Infografik, die ein Balkendiagramm zeigt, das die Leistungs-Benchmarks von GPT-5.3 Codex mit früheren Modellen wie GPT-5.2 vergleicht und seine überlegenen Ergebnisse hervorhebt.

Benchmark	GPT-5.3-Codex	GPT-5.2-Codex	GPT-5.2
SWE-Bench Pro	56,8 %	56,4 %	55,6 %
Terminal-Bench 2.0	77,3 %	64,0 %	62,2 %
OSWorld-Verified	64,7 %	38,2 %	37,9 %
GDPval (Siege oder Gleichstand)	70,9 %	-	70,9 %

Mehr als nur Codegenerierung

Die Fähigkeiten des Modells erstrecken sich nun über den gesamten Software-Entwicklungszyklus. Es kann beim Debuggen, Deployment und Monitoring von Anwendungen helfen. Es kann sogar die Vogelperspektive einnehmen und bei der Planung helfen, indem es Produktspezifikationen (Product Requirement Documents, PRDs) schreibt.

Um zu beweisen, dass es nicht nur für Entwickler gedacht ist, zeigte OpenAI ein Beispiel, bei dem das Modell eine PowerPoint-Präsentation mit 10 Folien für einen Finanzberater erstellte. Dies zeigt, dass seine agentenbasierten Fähigkeiten auf komplexe Wissensarbeit in fast jedem Bereich angewendet werden können.

Ein interaktiver Partner, nicht nur ein Werkzeug

Eine der raffiniertesten neuen Funktionen ist die Interaktivität des Modells. Es fühlt sich eher so an, als würde man mit einer Person zusammenarbeiten als mit einem Programm. Sie können das Modell während der Arbeit anleiten, ihm Fragen stellen und direkt Feedback geben, ohne dass es den Faden verliert. Diese Art der Interaktion lässt die gesamte Erfahrung viel natürlicher und kollaborativer wirken.

Ja. Und das sagt jemand, der Codex immer gehasst und nur 5.2 high und xhigh benutzt hat. Aber 5.3-codex-xhigh ist fantastisch, ich habe in 4 Stunden mehr gebaut als in der letzten Woche.

Praxisnahe Anwendungen und Anwendungsfälle

Was lässt sich also mit all dieser Leistung tatsächlich anfangen? Die praktischen Anwendungen sind beeindruckend und decken einige Schlüsselbereiche ab.

Fortgeschrittene Web- und Anwendungsentwicklung

GPT-5.3 Codex kann nun eigenständig komplexe, funktionale Anwendungen erstellen. OpenAI präsentierte einige beeindruckende Beispiele, darunter ein voll spielbares Rennspiel und ein Tauchspiel, das das Modell über Millionen von Token hinweg entwickelt hat. Dies sind nicht nur einfache Demos; es sind vollständige Anwendungen, die die Fähigkeit des Modells demonstrieren, große, langfristige Projekte zu bewältigen.

Sie können sich die Trailer ansehen und die Spiele sogar selbst im OpenAI-Blogpost ausprobieren. Es ist ein überzeugender Ausblick auf das, was möglich ist.

Cybersicherheit: Ein mächtiger Verbündeter und potenzielles Risiko

Dies ist das erste Modell, das OpenAI im Rahmen seines Preparedness Framework als „hochgradig fähig“ (High capability) für Cybersicherheitsaufgaben eingestuft hat. Das ist von großer Bedeutung. Es ist das erste Modell, das sie direkt darauf trainiert haben, Software-Schwachstellen zu identifizieren, was eine enorme Hilfe für die Cyberabwehr sein könnte.

Natürlich handelt es sich hierbei um eine klassische Dual-Use-Technologie. In den richtigen Händen kann sie helfen, Sicherheitslücken schneller als je zuvor zu finden und zu schließen. In den falschen Händen könnte sie dazu verwendet werden, genau diese Lücken für böswillige Zwecke auszunutzen.

In Anerkennung dessen ergreift OpenAI ernsthafte Sicherheitsmaßnahmen. Sie haben ein Trusted Access for Cyber-Programm gestartet, um das Werkzeug in die Hände von Verteidigern zu geben, und stellen 10 Millionen US-Dollar in Form von API-Guthaben zur Unterstützung der Verteidigungsforschung bereit.

Beschleunigung interner Forschung und Entwicklung (F&E) sowie Geschäftsabläufe

OpenAI war selbst seine beste Fallstudie. Ihre internen Teams haben GPT-5.3 Codex genutzt, um ihre eigene Arbeit auf interessante Weise zu beschleunigen.

Forscher haben es verwendet, um Trainingsläufe in Echtzeit zu überwachen und zu debuggen. Datenwissenschaftler haben neue Daten-Pipelines aufgebaut, um Ergebnisse von Alpha-Testern zu analysieren. Und Ingenieure haben es genutzt, um knifflige Bugs zu finden und ihre GPU-Cluster effizienter zu verwalten. Dies zeigt, wie wertvoll es als internes Werkzeug zur Produktivitätssteigerung in jedem technischen Team sein kann.

Verfügbarkeit, Preise und wichtige Einschränkungen

Kommen wir nun zu den praktischen Details. Wie erhalten Sie Zugriff auf GPT-5.3 Codex und wo liegen die Haken?

So greifen Sie auf das Modell zu

Das Modell ist derzeit für jeden mit einem kostenpflichtigen ChatGPT-Tarif verfügbar. Sie können über die dedizierte Codex-App, das Befehlszeilen-Interface (CLI), IDE-Erweiterungen und die Standard-Weboberfläche darauf zugreifen. Die gute Nachricht ist, dass es keine neue Preisgestaltung speziell für dieses Modell gibt; die Nutzung ist in Ihrem bestehenden kostenpflichtigen Abonnement enthalten.

Die Lücke zwischen roher Leistung und geschäftlichem Nutzen schließen

Obwohl GPT-5.3 Codex unglaublich leistungsstark ist, gibt es einige wichtige Einschränkungen für Unternehmen, die es in ihren täglichen Betrieb integrieren möchten.

Die größte Hürde ist, dass der API-Zugriff noch nicht verfügbar ist. Das bedeutet, dass Sie es nicht einfach in Ihre eigenen Produkte einbinden oder benutzerdefinierte Workflows darum herum aufbauen können. Sie sind darauf beschränkt, es über die bestehenden Schnittstellen von OpenAI zu nutzen.

Das klingt großartig, aber ich mache mir viel weniger Sorgen um die Geschwindigkeit als um Qualität, Genauigkeit und Erfolgsquoten beim ersten Versuch. Ich habe Codex GPT 5.2 High sehr erfolgreich eingesetzt (für Programmierung, Architektur, Strategie, Geschäftsaufbau, Marketing, Branding usw.), war aber mit den *-codex-Varianten sehr unzufrieden. Gilt dieses 5.3-Update sowohl für die normalen als auch für die Codex-Varianten oder nur für die Codex-Variante? Falls Letzteres, wie schneidet 5.3-codex im Vergleich zu 5.2 High normal beim logischen Denken ab?

Zweitens ist dies ein leistungsstarker Motor, aber keine fertige Geschäftslösung. Um echten Nutzen daraus zu ziehen, benötigen Sie erhebliches internes Fachwissen in den Bereichen Prompt Engineering, Workflow-Design und technische Aufsicht. Es ist ein Werkzeug für Experten, keine Plug-and-Play-Lösung.

Hier liegt die eigentliche Herausforderung für die meisten Unternehmen. Diese rohe Kraft in ein zuverlässiges, integriertes Geschäftswerkzeug zu verwandeln, ist ein riesiges Unterfangen. Die meisten Unternehmen benötigen eine Lösung, die bereits mit ihren Tools verbunden und auf ihr spezifisches Wissen trainiert ist.

Eine Plattform wie eesel AI wurde entwickelt, um genau dieses Problem zu lösen. Anstatt eine Lösung um ein rohes Modell herum zu bauen, können Sie eesel als KI-Teamkollegen „einstellen“. Es verbindet sich mit einem Klick mit Ihren Helpdesks und Wissensdatenbanken (wie Zendesk oder Confluence) und lernt Ihr Unternehmen in wenigen Minuten kennen. Sie können es als AI Copilot starten, der Antworten entwirft, die Ihr Team überprüft, und es dann zu einem vollautonomen AI Agent befördern, sobald Sie sich sicher fühlen. So nutzen Sie die Kraft fortschrittlicher KI ohne ein massives Implementierungsprojekt.

Der eesel AI Agent arbeitet als KI-Teamkollege innerhalb von Helpdesks wie Zendesk, um autonomen Support zu leisten.

Die Entwicklung vom Codegenerator zum Computer-Partner

GPT-5.3 Codex markiert eine deutliche Weiterentwicklung der KI. Es ist nicht mehr nur ein Werkzeug, das Code schreibt; es wird zu einem echten Partner, der an Ihrer Seite am Computer arbeiten kann. Seine erstklassige Leistung, die gesteigerte Interaktivität und ein viel breiteres Anwendungsspektrum bieten einen spannenden Ausblick in die Zukunft.

Eine Infografik, die die Entwicklung der KI von einem einfachen Codegenerator zu einem Computer-Partner wie GPT-5.3 Codex illustriert.

Doch für Unternehmen bleibt die Hauptherausforderung bestehen: Wie schließt man die Lücke zwischen dieser unglaublichen Basistechnologie und einer praktischen, integrierten und sicheren Lösung, die Ihre Probleme tatsächlich löst?

Für einen tieferen Einblick, wie die neuesten KI-Modelle wie GPT-5.3 Codex und Claude 3 Opus die Branche aufmischen, schauen Sie sich das Video unten an. Es bietet einen hervorragenden Vergleich und diskutiert die realen Auswirkungen dieser rasanten Fortschritte.


Ein tiefer Einblick in den Vergleich der Funktionen und realen Auswirkungen von OpenAIs GPT-5.3 Codex und Anthropic's Opus-Modellen.

Ihr KI-Teamkollege der nächsten Generation

Die Zukunft der geschäftlichen Produktivität hängt nicht nur davon ab, den leistungsstärksten KI-Motor zu haben. Es geht darum, diese Kraft zugänglich, sicher und einfach dort einzusetzen, wo sie am meisten gebraucht wird. Grundlegende Modelle wie GPT-5.3 Codex liefern die PS, aber der wahre Wert entsteht durch die Anwendung dieser Kraft zur Lösung spezifischer geschäftlicher Herausforderungen.

Wenn Sie bereit sind, die Kraft der KI für Ihren Kundenservice oder Ihre internen Support-Teams zu nutzen, ohne die Komplexität einer Eigenentwicklung, ist es vielleicht an der Zeit, Ihren ersten KI-Teamkollegen einzustellen.

Erleben Sie eesel AI in Aktion und erfahren Sie, wie Sie in wenigen Minuten einen vollständig trainierten KI-Agenten einsetzen können.

Häufig gestellte Fragen

Der Hauptunterschied besteht darin, dass GPT-5.3 Codex die Programmierfähigkeiten von GPT-5.2-Codex und das logische Denkvermögen von GPT-5.2 in einem einzigen, schnelleren Modell vereint. Es ist zudem als „agentenbasierter“ (agentic) Partner konzipiert, was bedeutet, dass es komplexe, mehrstufige Aufgaben auf einem Computer ausführen kann, anstatt nur Code-Schnipsel zu schreiben.

Zum Zeitpunkt der Veröffentlichung hat OpenAI noch keine API für GPT-5.3 Codex zur Verfügung gestellt. Dies ist eine wesentliche Einschränkung für Unternehmen, da der Zugriff nur über die Schnittstellen von OpenAI wie die ChatGPT-App, das CLI und IDE-Erweiterungen möglich ist, anstatt es direkt in eigene Produkte zu integrieren.

GPT-5.3 Codex ist das erste Modell, das von OpenAI als „hochgradig fähig“ (High capability) für Cybersicherheit eingestuft wurde. Es wurde speziell darauf trainiert, Software-Schwachstellen zu identifizieren. Dies macht es zu einem mächtigen Werkzeug für die Verteidigung, birgt aber auch Risiken bei missbräuchlicher Verwendung. OpenAI steuert dies über ein „Trusted Access“-Programm für Verteidiger.

Es demonstriert diese Fähigkeiten durch Aufgaben, die über die einfache Codegenerierung hinausgehen. Beispiele hierfür sind das Erstellen kompletter spielbarer Videospiele, das Erstellen von PowerPoint-Präsentationen, das Debuggen eigener Trainingsläufe und das Verwalten von Deployments. Es kann über einen längeren Zeitraum an einem Projekt arbeiten, was ein zentrales Merkmal eines Agenten ist.

Ja, wenn Sie einen kostenpflichtigen ChatGPT-Tarif haben, können Sie auf GPT-5.3 Codex zugreifen. Die Nutzung ist in Ihrem bestehenden Abonnement enthalten, und es fallen keine neuen Gebühren speziell für dieses Modell an.

Diesen Beitrag teilen

Article by

Kenneth Pangan

Writer and marketer for over ten years, Kenneth Pangan splits his time between history, politics, and art with plenty of interruptions from his dogs demanding attention.

GPT-5.3 Codex: Ein tiefer Einblick in die neue agentenbasierte KI von OpenAI

Was ist GPT-5.3 Codex?

Wichtige Funktionen und Leistungs-Benchmarks