Project Genie: Ein tiefer Einblick in Googles KI-Weltmodell

Stevia Putri
Written by

Stevia Putri

Reviewed by

Stanley Nicholas

Last edited January 30, 2026

Expert Verified

Image alt text

Es fühlt sich an, als würde jede Woche ein neues KI-Modell auftauchen, das etwas kann, das direkt aus einem Science-Fiction-Film stammt. Wir haben uns von einer KI, die eine ordentliche E-Mail schreiben kann, zu einer KI entwickelt, die fotorealistische Bilder erstellt. Der nächste Schritt ist eine KI, die ganze interaktive Welten generiert. Und genau dorthin steuert Google mit Project Genie.

Anfang 2024 erstmals angekündigt und nun auf dem fortschrittlicheren Genie 3-Modell laufend, stellt dieses Experiment einen gewaltigen Sprung dar. Seit Januar 2026 kann eine kleine Gruppe von Nutzern nun einfache Prompts in spielbare Welten verwandeln. Es ist die Art von Technologie, die sich anfühlt, als wäre sie einem Drehbuch entsprungen.

Ein Video von Google DeepMind, das zeigt, wie Project Genie spielbare Welten aus einem einzigen Prompt erstellen kann.

Was also steckt wirklich dahinter? Lassen Sie uns aufschlüsseln, was Project Genie eigentlich ist, wie es funktioniert, wo es eingesetzt werden könnte und wo seine Grenzen als Prototyp im Early Access liegen.

Was ist Googles Project Genie?

Im Kern ist Project Genie ein grundlegendes „Weltmodell“ (world model), das vom Team von Google DeepMind entwickelt wurde. Die Version, die Sie in Google Labs ausprobieren können, basiert auf dem Genie 3-Modell.

Aber was ist ein „Weltmodell“? Es ist ein Begriff für eine KI, die nicht nur Muster in Daten erkennt, sondern tatsächlich die zugrunde liegenden Regeln einer Umgebung lernt. Stellen Sie es sich wie eine KI vor, die eine Intuition für ein kleines Universum entwickelt. Dies ermöglicht es ihr, dieses Universum zu simulieren, vorherzusagen, was als Nächstes passieren könnte, und zu verstehen, wie Ihre Aktionen die Dinge beeinflussen werden.

Eine Infografik, die erklärt, wie das Project Genie-Weltmodell aus Daten lernt, um interaktive Spielwelten zu generieren.
Eine Infografik, die erklärt, wie das Project Genie-Weltmodell aus Daten lernt, um interaktive Spielwelten zu generieren.

Der entscheidende Punkt bei Project Genie ist, dass es nicht nur Videos oder statische Bilder erstellt. Es generiert interaktive Räume im Stil von 2D-Plattformern, in denen Sie sich tatsächlich bewegen können. Sie können einen Charakter steuern, springen und eine Welt erkunden, die gerade erst für Sie erschaffen wurde – und das alles in Echtzeit. Es ist weniger wie das Anschauen eines Films und mehr wie das Betreten eines Traums, den Sie gerade erst beschrieben haben.

Ein kurzer, aber wichtiger Hinweis: Wenn Sie nach „Project Genie“ suchen, stoßen Sie möglicherweise auch auf das AACR Project GENIE®. Dies ist ein völlig separates und nicht damit zusammenhängendes öffentliches Krebsforschungsregister. Es ist ein fantastisches Projekt, hat aber nichts mit Googles KI-Weltmodell zu tun. Um es klarzustellen: Wir sprechen hier über die KI, die spielbare Welten erschafft, nicht über diejenige, die in der Onkologieforschung hilft.

Wie funktioniert Project Genie?

Wie schafft Googles KI das also? Es ist eine Mischung aus cleverem Engineering, das auf allem aufbaut, was wir bisher über generative KI gelernt haben.

Eine Infografik, die den schrittweisen Prozess von Project Genie zeigt, von der multimodalen Eingabe bis zur spielbaren Weltgenerierung in Echtzeit.
Eine Infografik, die den schrittweisen Prozess von Project Genie zeigt, von der multimodalen Eingabe bis zur spielbaren Weltgenerierung in Echtzeit.

Wie Project Genie Welten aus Prompts erstellt

Genie ist multimodal (multi-modal), was bedeutet, dass es verschiedene Arten von Eingaben versteht. Sie können ihm einen einfachen Text-Prompt wie „ein gruseliger Wald mit leuchtenden Pilzen“ geben, aber Sie können es auch mit Bildern, Fotos oder sogar Ihren eigenen Skizzen füttern, um den Prozess zu starten.

Es gibt sogar eine Funktion namens „World Sketching“ (Weltskizzierung), die mit dem Nano Banana Pro funktioniert und es Ihnen ermöglicht, ein Bild fein abzustimmen, bevor die Welt generiert wird. Dies gibt Ihnen mehr kreative Kontrolle, sodass Sie den visuellen Stil anpassen können, bevor Genie ihn zum Leben erweckt. Google hat einige beeindruckende Beispiele gezeigt, wie etwa das Erstellen einer Welt mit „einem Shiba Inu in der Mitte des Bildes“ oder das Fliegen eines „Hochgeschwindigkeits-Papierfliegers“ durch eine Landschaft.

Echtzeit-Generierung und dynamische Ereignisse in Project Genie

Ein wesentlicher Aspekt ist die Echtzeit-Generierung. Genie rendert nicht die gesamte Welt auf einmal vor. Stattdessen generiert es die Welt während des Spielens mit bis zu 24 Bildern pro Sekunde bei einer Auflösung von 720p, was flüssig genug für ein ordentliches, spielähnliches Erlebnis ist.

Während Sie Ihren Charakter mit Tastatur und Maus bewegen, erstellt das Modell ständig das nächste Stück der Welt, das gerade noch außer Sichtweite ist. Dies wird als autoregressive Generierung (autoregressive generation) bezeichnet – ein Prozess, bei dem die Zukunft basierend auf der unmittelbaren Vergangenheit Bild für Bild aufgebaut wird.

Darüber hinaus bietet Genie „promptbare Weltereignisse“ (promptable world events). Das bedeutet, dass Sie eine Welt erkunden und dann einen neuen Prompt eingeben können, um die Dinge zu ändern. Sie könnten zum Beispiel durch ein sonniges Feld laufen und „lass es regnen“ tippen, um die Umgebung, in der Sie sich befinden, dynamisch zu verändern.

Konsistenz wahren mit dem Langzeitgedächtnis

Einer der schwierigsten Teile generativer Modelle ist es, die Dinge konsistent zu halten. Wenn Sie einen Raum verlassen und dann zurückkehren, erwarten Sie, dass er noch genauso aussieht. Genie löst dies, indem es „autoregressiv“ arbeitet und über eine Form von Gedächtnis verfügt.

Das Modell kann sich an Details von Orten erinnern, an denen Sie bereits waren. Wenn Sie also umkehren, bleibt die Umgebung stabil. Laut Google kann Genie eine konsistente Welt für mehrere Minuten der Interaktion aufrechterhalten, wobei sein visuelles Gedächtnis etwa eine Minute zurückreicht. Es ist nicht perfekt, aber es ist ein großer Schritt hin zur Schaffung glaubwürdiger, beständiger KI-generierter Räume.

FähigkeitBeschreibung
Echtzeit-GenerierungArbeitet mit bis zu 24 FPS bei 720p, was eine flüssige, spielähnliche Erkundung ermöglicht.
Multimodale EingabeErstellt Welten aus Textbeschreibungen, Bildern, Fotos oder Skizzen.
Promptbare EreignisseErmöglicht es Nutzern, die Welt (z. B. das Wetter) während der Erkundung dynamisch per Text-Prompt zu ändern.
UmgebungskonsistenzErinnert sich für mehrere Minuten an Details besuchter Orte, um eine stabile Welt zu gewährleisten.
Steuerbare CharaktereNutzer können mit einem Charakter durch die Welt navigieren, der auf Tastatur- und Mauseingaben reagiert.

Was sind die potenziellen Anwendungsfälle für Project Genie?

Obwohl es sich noch um ein Experiment handelt, könnte die Technologie hinter Project Genie viele Branchen verändern. Es geht nicht nur darum, skurrile kleine Spiele aus Text-Prompts zu erstellen; die Auswirkungen sind weitaus größer.

Die Zukunft des Gaming und des kreativen Prototypings

Die direkteste Anwendung liegt im Gaming. Stellen Sie sich vor, Sie erstellen eine einzigartige Spielwelt, indem Sie sie einfach beschreiben. Dies könnte nutzergenerierte Inhalte (user-generated content) völlig verändern und es Spielern ermöglichen, ihre eigenen interaktiven Erlebnisse zu bauen und zu teilen, ohne eine einzige Zeile Code zu kennen.

Für Spieleentwickler könnte dies ein bedeutendes Werkzeug für das schnelle Prototyping (rapid prototyping) sein. Anstatt Wochen mit dem Bau eines Testlevels zu verbringen, könnte ein Designer in wenigen Minuten eine spielbare Version generieren. Künstler könnten ein Konzeptbild sofort in eine interaktive Umgebung verwandeln, was den kreativen Prozess beschleunigt und viel schnellere Iterationen ermöglicht.

Reddit
Sieht cool aus. Ich habe das Gefühl, dass diese Art von Dingen eine Nische finden wird, aber ich glaube nicht, dass sie viele Arten von Spielen ersetzen wird. Es wird wahrscheinlich cool sein, es ein paar Mal auszuprobieren, und dann wird es einem langweilig, weil man merkt, dass es am Ende doch alles irgendwie gleich ist, obwohl man alles erschaffen könnte.

Fortgeschrittenes Training für KI-Agenten und Robotik

Ein weiterer bedeutender Einsatzbereich für Project Genie ist das Training für andere KIs. Die Erstellung realistischer Simulationen zum Trainieren von KI-Agenten ist unglaublich teuer und zeitaufwendig. Genie bietet eine Möglichkeit, bei Bedarf eine nahezu unendliche Vielfalt an Trainingsumgebungen zu generieren.

Google nutzt es bereits dafür. Sie haben gezeigt, wie ihr SIMA-Agent lernen kann, Aufgaben auszuführen, wie etwa das Finden und Öffnen einer bestimmten Tür innerhalb einer von Genie generierten Welt. Dies ermöglicht es dem Agenten, Fähigkeiten in einer sicheren, kontrollierten Umgebung zu erlernen, bevor er in der realen Welt eingesetzt wird. Man kann sich leicht vorstellen, wie dies auf die Robotik ausgeweitet wird, wo ein Roboter eine komplexe Aufgabe millionenfach in einer Simulation üben könnte, oder auf das Training selbstfahrender Autos, indem man sie durch unzählige Szenarien schickt, ohne ein Risiko in der realen Welt einzugehen.

Immersive Simulation für Bildung und Forschung

Über Gaming und KI-Training hinaus gibt es erhebliches Potenzial in anderen Bereichen. Geschichtsstudenten könnten durch eine interaktive Rekonstruktion des Palastes von Knossos auf Kreta spazieren, indem sie einfach ein Foto der Ruinen hochladen. Wissenschaftler könnten komplexe Systeme modellieren, wie die Ausbreitung eines Waldbrandes oder die Strömung von Menschenmengen in einer Stadt, um deren Verhalten besser zu verstehen. Es ist ein Werkzeug zur Erstellung von Sandkästen für fast jeden Bereich, den man sich vorstellen kann.

Von experimentellen Welten zu zuverlässiger Business-KI

Project Genie ist unbestreitbar faszinierend und bietet einen Ausblick in eine sehr spannende Zukunft. Aber es ist wichtig, sich daran zu erinnern, dass es sich vorerst um einen Forschungsprototyp handelt. Die Lücke zwischen einem faszinierenden Experiment und einem zuverlässigen Geschäftswerkzeug ist groß.

Die aktuellen Einschränkungen von Project Genie

Google ist offen mit den derzeitigen Mängeln von Genie umgegangen. Als Forschungsprototyp hat es einige wesentliche Einschränkungen:

  • Interaktionsdauer: Generierte Erlebnisse sind derzeit auf 60 Sekunden begrenzt, und die Konsistenz der Welt beginnt nach einigen Minuten Spielzeit nachzulassen.
  • Begrenzter Aktionsraum: Die Charaktere in diesen Welten können noch keine komplexen, mehrstufigen Aktionen ausführen. Sie können sich bewegen und springen, aber das war es auch schon.
  • Ungenaue Simulation: Genie kann noch keine perfekten „digitalen Zwillinge“ von realen Umgebungen erstellen. Es folgt nicht immer den Gesetzen der Physik.
  • Steuerungslatenz: Die Charaktersteuerung kann sich manchmal etwas verzögert anfühlen, was die Spielbarkeit beeinträchtigen kann.

Wie KI heute die Welt Ihres Unternehmens erlernen kann

Diese Einschränkungen verdeutlichen den Unterschied zwischen einem futuristischen Prototyp und einem verlässlichen Werkzeug, das Sie schon jetzt für Ihr Unternehmen nutzen können. Die Kernidee hinter einem „Weltmodell“ – eine KI, die eine spezifische Umgebung lernt – ist in der Geschäftswelt bereits Realität, nur auf eine andere Weise.

Genauso wie Project Genie ein Modell einer spielbaren Welt aus Internetvideos lernt, lernt ein KI-Teamkollege wie eesel AI die „Welt“ Ihres Unternehmens. Er verbindet sich mit Ihren bestehenden Tools und lernt sofort aus Ihren vergangenen Support-Tickets, Help-Center-Artikeln und internen Dokumenten. Er baut ein tiefes Verständnis für die Richtlinien, den Tonfall und die häufigen Kundenprobleme Ihres Unternehmens auf.

Ein Screenshot des eesel AI Agenten, eines KI-Teamkollegen, der eine ähnliche Erfahrung wie Project Genie bietet, jedoch für den Geschäftsbetrieb.
Ein Screenshot des eesel AI Agenten, eines KI-Teamkollegen, der eine ähnliche Erfahrung wie Project Genie bietet, jedoch für den Geschäftsbetrieb.

Während Project Genie ein faszinierendes Experiment ist, können Sie einen KI-Agenten für den Kundenservice von eesel AI einladen, der heute schon einsatzbereit ist. Er kann darauf trainiert werden, Ihren Geschäftskontext zu verstehen und reale Kundenanliegen autonom zu lösen.

Darüber hinaus kann seine Leistung vor dem Einsatz überprüft werden. eesel AI enthält eine Simulationsfunktion. Sie können Simulationen auf Basis vergangener Tickets durchführen, um genau zu sehen, wie Ihr KI-Teamkollege diese bearbeitet hätte. Sie erhalten klare Kennzahlen zu seiner Leistung, was es Ihnen ermöglicht, sein Verhalten fein abzustimmen und Vertrauen aufzubauen, bevor er jemals mit einem echten Kunden interagiert. Es ist das Konzept des „Weltmodells“, angewandt auf die reale Welt Ihres Unternehmens.

Ein Workflow, der zeigt, wie man den eesel AI-Agenten an vergangenen Tickets testet – eine Funktion, die das „Weltmodell“-Konzept von Project Genie auf das Geschäft anwendet.
Ein Workflow, der zeigt, wie man den eesel AI-Agenten an vergangenen Tickets testet – eine Funktion, die das „Weltmodell“-Konzept von Project Genie auf das Geschäft anwendet.

So erhalten Sie Zugang zu Project Genie

Wenn Sie es selbst ausprobieren möchten: Der Zugang ist derzeit begrenzt. Stand Januar 2026 ist Project Genie ein experimenteller Forschungsprototyp in Google Labs.

Hier sind die aktuellen Voraussetzungen:

Reddit
Ich denke, es muss gesagt werden, dass Genie derzeit nicht wirklich darauf ausgelegt ist, Menschen Spaß zu machen oder nützlich zu sein. Es ist jedoch ein Sprungbrett hin zu simulierten Umgebungen, in denen allgemeine Agenten leben und interagieren können. Dies ist ein langfristiges Spiel, das DeepMind spielt, um ihre multimodalen Modelle in der (nicht so fernen) Zukunft zu erweitern. Und Roboter.

Der Zugang ist direkt an diese Abonnementstufe gebunden. Google hat erklärt, dass geplant ist, den Zugang in Zukunft auf mehr Nutzer und Regionen auszuweiten, aber vorerst bleibt es ein exklusiver Club.

Der Anbruch interaktiver KI-Welten mit Project Genie

Project Genie, angetrieben durch das Genie 3-Modell, ist eine bedeutende Entwicklung in der KI-Technologie. Es ist ein beeindruckender Proof-of-Concept, der zeigt, dass wir kurz davor stehen, interaktive Welten in Echtzeit aus einfachen Prompts zu generieren. Sein Potenzial, Branchen wie Gaming, KI-Training und Bildung umzugestalten, ist beträchtlich.

Gleichzeitig ist es wichtig, es als das zu sehen, was es heute ist: ein Early-Access-Experiment mit klaren Einschränkungen. Es ist ein fantastischer Blick in die Zukunft, aber noch kein ausgereiftes Produkt.

Die Grundprinzipien, die Project Genie so spannend machen – wie tiefes kontextuelles Verständnis und das Erlernen der Regeln einer spezifischen Umgebung – sind bereits vorhanden und lösen reale Geschäftsprobleme. Während KI-generierte spielbare Welten noch am Horizont liegen, können Sie schon heute eine KI nutzen, die Ihre Welt versteht.

Um zu sehen, wie ein KI-Teamkollege die Welt Ihres Unternehmens erlernen und innerhalb von Minuten autonom Kundenanfragen bearbeiten kann, probieren Sie eesel AI gerne aus.

Häufig gestellte Fragen

Es handelt sich um eine experimentelle KI von Google DeepMind, die interaktive Welten im Stil von 2D-Plattformern aus einem einfachen Text- oder Bild-Prompt erstellen kann. Sie können tatsächlich einen Charakter steuern und sich in Echtzeit in der generierten Welt bewegen.
Project Genie nutzt ein „Weltmodell“ (world model), um die Regeln einer Umgebung zu verstehen. Es nimmt Ihren Prompt (Text, Skizze oder Bild) und generiert die Welt Frame für Frame während des Spielens – ein Prozess, der als autoregressive Generierung bezeichnet wird. Dies ermöglicht ein dynamisches und interaktives Erlebnis.
Der Zugang zu Project Genie ist momentan begrenzt. Stand Januar 2026 müssen Sie Abonnent von Google AI Ultra sein, über 18 Jahre alt sein und Ihren Wohnsitz in den USA haben, um es in Google Labs ausprobieren zu können.
Als Forschungsprototyp weist Project Genie einige Einschränkungen auf. Die interaktiven Sitzungen sind kurz (etwa 60 Sekunden), die Aktionen der Charaktere sind grundlegend (Bewegen und Springen) und die physikalischen Gesetze der realen Welt werden nicht perfekt simuliert. Zudem kann es zu Verzögerungen bei der Steuerung kommen.
Das Potenzial ist enorm. Es könnte die Spieleentwicklung revolutionieren, indem es ein schnelles Prototyping von Spielwelten ermöglicht. Es ist zudem ein leistungsstarkes Werkzeug für das Training anderer KIs und Roboter in einer Vielzahl von simulierten Umgebungen und könnte für immersive Bildungssimulationen genutzt werden.
Nein, sie sind völlig unterschiedlich. Googles Project Genie erstellt KI-generierte Welten. Das AACR Project GENIE® ist ein wichtiges [öffentliches Krebsforschungsregister](https://www.aacr.org/professionals/research/aacr-project-genie/aacr-project-genie-frequently-asked-questions/). Es ist leicht, sie zu verwechseln, aber sie stehen in keinem Zusammenhang.

Diesen Beitrag teilen

Stevia undefined

Article by

Stevia Putri

Stevia Putri is a marketing generalist at eesel AI, where she helps turn powerful AI tools into stories that resonate. She’s driven by curiosity, clarity, and the human side of technology.