Sakana AI Bewertung: Hype vs. Realität für den KI-Wissenschaftler

Kenneth Pangan
Written by

Kenneth Pangan

Amogh Sarda
Reviewed by

Amogh Sarda

Last edited November 6, 2025

Expert Verified

Wahrscheinlich haben Sie schon vom Hype um den „KI-Wissenschaftler“ von Sakana AI gehört. Es handelt sich um ein System, das angeblich den gesamten wissenschaftlichen Forschungsprozess automatisiert, von der Ideenfindung bis zur Veröffentlichung von Fachartikeln. Die schlagzeilenträchtige Behauptung? Für etwa 15 Dollar kann diese KI eine vollständige Forschungsarbeit erstellen und läutet damit ein neues Zeitalter der automatisierten Entdeckung ein. Das sind die Art von Nachrichten, bei denen jeder in der Tech-Branche genauer hinhört.

Aber ist das wirklich die Geburtsstunde der „künstlichen Forschungsintelligenz“, oder ist die Geschichte doch etwas komplizierter? In diesem Artikel werden wir Ihnen eine ehrliche Bewertung von Sakana AI geben und die großen Versprechen des Unternehmens mit den tatsächlichen Ergebnissen unabhängiger Forscher vergleichen. Noch wichtiger ist, dass wir darüber sprechen, was das alles für Unternehmen bedeutet, die heute praktische und zuverlässige KI benötigen.

Was sind Sakana AI und der „KI-Wissenschaftler“?

Sakana AI ist ein Forschungslabor mit Sitz in Tokio, das sich von der Natur inspirieren lässt, um neue Arten von KI zu entwickeln. Ihr Projekt „KI-Wissenschaftler“ ist mit Abstand ihre meistdiskutierte Schöpfung. Es ist als ein System konzipiert, das den gesamten Forschungszyklus eigenständig und ohne menschliches Eingreifen verwalten kann.

Laut Sakana AI soll das System:

  • Brandneue Forschungsideen entwickeln.

  • Bestehende Literatur mithilfe der Semantic Scholar-Datenbank durchsuchen.

  • Den für Experimente erforderlichen Code schreiben und ausführen.

  • Die Ergebnisse analysieren und einen kompletten wissenschaftlichen Artikel entwerfen.

  • Sogar ein eigenes Peer-Review durchführen, um Fehler zu finden.

Das Projekt hat eine Menge Aufregung ausgelöst und zeichnet das Bild einer Zukunft, in der sich die Wissenschaft blitzschnell entwickelt. Aber große Behauptungen werfen auch große Fragen auf, und der KI-Wissenschaftler hat definitiv einige kritische Blicke auf sich gezogen.

Das Versprechen: Kann eine KI die wissenschaftliche Entdeckung wirklich automatisieren?

Wenn man die Ankündigungen von Sakana AI liest, positionieren sie den KI-Wissenschaftler als ein revolutionäres Werkzeug, das als erstes seiner Art Entdeckungen von Anfang bis Ende wirklich automatisiert.

Hier sind die wichtigsten Versprechen, die sie gemacht haben:

  • End-to-End-Automatisierung: Das System soll alles von der ersten Hypothese bis zum fertigen Paper bewältigen, ohne dass ein Mensch eingreifen muss. Die Idee ist, es kontinuierlich laufen zu lassen, damit es auf seinen eigenen Entdeckungen aufbauen kann.

  • Erfolg im Peer-Review: Ihre berühmteste Behauptung ist, dass eines ihrer vollständig KI-generierten Paper das Peer-Review bestanden hat für einen Workshop auf der ICLR 2025, einer bedeutenden Konferenz für maschinelles Lernen. Dies wurde als Beweis dafür angeführt, dass seine Arbeit menschlichen Standards genügen kann.

  • Enorme Kosteneinsparungen: Das Unternehmen wirbt mit dem geringen Preis von etwa 6 bis 15 Dollar pro Paper. Dies deutet auf eine Zukunft hin, in der die Forschung nicht durch große Budgets gebremst wird und mehr Menschen die Möglichkeit haben, einen Beitrag zu leisten.

  • Unbegrenzte Entdeckungen: Das System ist so konzipiert, dass es eine Wissensbibliothek erstellt, die im Laufe der Zeit wächst, indem es aus seiner bisherigen Arbeit und dem erhaltenen Feedback lernt, ähnlich wie die menschliche wissenschaftliche Gemeinschaft.

Sakana AI beschreibt dies als den Beginn einer neuen Ära, in der KI Entdeckungen „auf und über dem menschlichen Niveau“ machen kann. Das ist ein aufregender Gedanke, aber was passiert, wenn man sich das Ganze genauer ansieht?

Dieses Video gibt einen kurzen Überblick über den „KI-Wissenschaftler“ von Sakana AI und sein Ziel, die wissenschaftliche Entdeckung zu automatisieren.

Die Realität: Was eine unabhängige Untersuchung ergab

Sobald man die Schlagzeilen hinter sich lässt, zeichnet sich ein deutlich unübersichtlicheres Bild ab. Eine gründliche unabhängige Studie von Beel et al., zusammen mit scharfsinniger Berichterstattung von Medien wie TechCrunch, hat die Fähigkeiten des KI-Wissenschaftlers auf die Probe gestellt. Und obwohl die Technologie in mancher Hinsicht beeindruckend ist, ist sie weit von dem autonomen Genie entfernt, als das sie angepriesen wird.

Ideengenerierung und Neuheit sind ein Reinfall

Der KI-Wissenschaftler soll „neue“ Ideen finden, indem er bestehende Literatur überprüft. Die unabhängige Analyse ergab jedoch, dass es sich dabei im Grunde nur um eine verherrlichte Stichwortsuche auf Semantic Scholar handelte. Es synthetisiert oder versteht das gescannte Wissen nicht wirklich, was aber unerlässlich ist, wenn man herausfinden will, was wirklich neu ist.

Aus diesem Grund stufte das System mehrere bekannte Konzepte als „neu“ ein, darunter „Micro-Batching für SGD“, eine Technik, die es seit Jahren gibt. Dies deutet auf eine enorme Schwäche hin: Die KI kann Schlüsselwörter erkennen, hat aber kein wirkliches Verständnis für Kontext oder Originalität. Ohne das kann sie die Grenzen der Wissenschaft nicht wirklich erweitern.

Experimente sind schlampig und scheitern ständig

Eine Idee zu haben ist eine Sache, aber beim Testen kam der KI-Wissenschaftler richtig ins Straucheln. Die unabhängige Bewertung lieferte eine ziemlich vernichtende Statistik: 42 % der Experimente der KI konnten aufgrund von Programmierfehlern nicht einmal ausgeführt werden. Das System blieb oft in einer Schleife stecken und versuchte immer wieder denselben fehlerhaften Code.

Und wenn die Experimente doch funktionierten? Die Code-Änderungen waren minimal, im Durchschnitt wurden nur 8 % gegenüber der ursprünglichen Vorlage geändert. Das sagt uns, dass die KI nicht sehr anpassungsfähig ist und nicht wirklich neue Wege zum Testen von Ideen entwickelt. Erschwerend kam hinzu, dass die Methodik oft schlichtweg falsch war. In einem Fall behauptete die KI, die Energieeffizienz verbessert zu haben, aber ihre eigenen Ergebnisse zeigten, dass sie den Einsatz von Rechenressourcen tatsächlich erhöht hatte, also das genaue Gegenteil ihres Ziels.

MetrikLeistung des KI-Wissenschaftlers (Studie von Beel et al.)
Erfolgsquote der Experimente58 % (5 von 12 schlugen fehl)
Bewertung der NeuheitUnzuverlässig; bekannte Konzepte als „neu“ eingestuft
Durchschnittliche Zitate pro Paper5
Qualität des ManuskriptsHäufige Fehler (fehlende Abbildungen, Platzhaltertext)
Genauigkeit der Ergebnisse57 % der Paper enthielten halluzinierte oder falsche Ergebnisse

Die endgültigen Paper und Reviews sind oberflächlich

Die fertigen Paper sahen nicht viel besser aus. Sie waren von geringer Qualität, mit einem Median von nur fünf Zitaten (die meisten davon veraltet). Sie waren auch voller Anfängerfehler, wie fehlende Abbildungen, doppelte Abschnitte und sogar Platzhaltertext, in dem wörtlich „Schlussfolgerungen hier“ stand.

Und was ist mit dem automatisierten Peer-Reviewer? Er konnte zwar strukturiertes Feedback ausgeben, übersah aber konsequent die größten Mängel in seiner eigenen Arbeit. Bei der Überprüfung von von Menschen verfassten Arbeiten war er übermäßig kritisch und lehnte Paper ab, die von menschlichen Gutachtern genehmigt worden waren. Es scheint, dass die KI zwar einer Review-Vorlage folgen kann, ihr aber das tiefe, kritische Denken für eine echte Kritik fehlt.

Die Schlussfolgerung der Studie brachte es perfekt auf den Punkt: Die Leistung des KI-Wissenschaftlers ist vergleichbar mit der eines „unmotivierten Studenten, der unter Zeitdruck eine Frist einhalten muss“. Es ist eine faszinierende Demonstration von KI-Nachahmung, aber weit davon entfernt, zuverlässige Wissenschaft zu produzieren.

Von Luftschlössern zur Realität: Was Unternehmen heute von KI brauchen

Während wilde Projekte wie der KI-Wissenschaftler uns einen aufregenden Blick in die Zukunft gewähren, kann man ein Unternehmen nicht auf Luftschlössern aufbauen. Sie benötigen zuverlässige, kontrollierbare und transparente KI, die reale Probleme jetzt löst. Der Hype um experimentelle KI kann von den praktischen Werkzeugen ablenken, die bereits einen Unterschied machen.

Hier kommt eine bodenständige Lösung wie eesel AI ins Spiel. Sie ist für die Praxis gemacht, nicht für ein Forschungslabor.

Vergleichen wir den experimentellen Ansatz von Sakana AI mit den unternehmensreifen Stärken von eesel AI:

  • Zuverlässigkeit vs. Unvorhersehbarkeit: Während der KI-Wissenschaftler bei 42 % seiner Experimente scheitert, können Sie mit eesel AI zuerst eine Simulation durchführen. Das bedeutet, Sie können die Leistung sicher an Tausenden Ihrer tatsächlichen vergangenen Tickets testen, bevor die KI jemals mit einem Kunden spricht. Sie erhalten eine klare, genaue Prognose über die Leistung und können sie mit vollem Vertrauen einsetzen.

  • Kontrolle vs. Blackbox: Der KI-Wissenschaftler erzeugt oft fehlerhafte, unsinnige Ergebnisse, über die Sie keine Kontrolle haben. Mit eesel AI haben Sie das Sagen. Sie können genau festlegen, welches Wissen es verwendet, seine Persönlichkeit und Aktionen anpassen und auswählen, welche Arten von Tickets automatisiert werden sollen. Die KI gerät nie außer Kontrolle, weil sie nur das tut, was Sie ihr sagen.

  • Fundiertes Wissen vs. Halluzination: Der Bot von Sakana AI hat Schwierigkeiten, Literatur zu verstehen, und erfindet oft einfach Dinge. eesel AI verankert sich in der Realität Ihres Unternehmens. Es verbindet sich sofort mit Ihrem vorhandenen Wissen an Orten wie Ihrem Helpdesk, Confluence, Google Docs und vergangenen Support-Gesprächen. Es lernt Ihre Markenstimme und Ihre tatsächlichen Prozesse, sodass seine Antworten immer korrekt und hilfreich sind.

Pro Tip
Der wahre Wert eines KI-Tools liegt nicht in effekthascherischen Behauptungen, sondern in seiner Fähigkeit, Ihre Probleme mit Vertrauen und Transparenz zu lösen. Bevor Sie eine KI einführen, fragen Sie sich: ‚Kann ich sie sicher testen und genau kontrollieren, was sie tut?‘

Das endgültige Urteil zu Sakana AI

Das Projekt von Sakana AI ist eine wirklich beeindruckende technische Demonstration. Es ist ein Meilenstein, der zeigt, wie weit die KI bei der Nachahmung komplexer menschlicher Fähigkeiten wie Forschung und Schreiben gekommen ist. Es ist ohne Zweifel ein cooles Experiment.

Aber es wird dem Hype um einen vollständig autonomen Wissenschaftler, der bereit ist, die Welt zu verändern, absolut nicht gerecht. Das System ist einfach zu unzuverlässig, oberflächlich und fehlerhaft für jeden ernsthaften Einsatz. Es ist ein faszinierender Proof-of-Concept, aber kein Werkzeug, auf das man sich wirklich verlassen kann.

Bereit für KI, die wirklich funktioniert?

Die Zukunft der KI ist aufregend, aber die Probleme von heute brauchen praktische Lösungen. Während wir darauf warten, dass eine KI das nächste nobelpreisgekrönte Paper schreibt, können Unternehmen bereits große Herausforderungen im Kundensupport und beim internen Wissensaustausch lösen.

Anstatt sich mit einer experimentellen KI herumzuschlagen, die fehlerhafte Paper produziert, können Sie eine KI einsetzen, die einwandfreie Antworten liefert. eesel AI ist für die Praxis konzipiert. Es ist Self-Service, verbindet sich in wenigen Minuten mit Ihren Tools und gibt Ihnen das Vertrauen, den Support sicher und effektiv zu automatisieren.

Lesen Sie nicht nur darüber, was KI eines Tages tun könnte. Sehen Sie, was sie schon heute für Sie tun kann. Testen Sie eesel AI kostenlos und finden Sie heraus, wie schnell Sie Ihren Support mit einer KI automatisieren können, der Sie wirklich vertrauen können.

Häufig gestellte Fragen

Die wichtigste Schlussfolgerung ist, dass der „KI-Wissenschaftler“ zwar eine beeindruckende technische Demonstration ist, aber bei weitem kein autonomes, zuverlässiges Forschungswerkzeug für den Praxiseinsatz darstellt. Seine Fähigkeiten sind im Vergleich zu den kühnen Behauptungen oberflächlich.

Diese unabhängige Bewertung von Sakana AI kommt zu dem Schluss, dass die Behauptungen von Sakana AI stark übertrieben sind. So hatte der KI-Wissenschaftler beispielsweise Schwierigkeiten mit echter Neuheit, führte fehlerhafte Experimente durch und erstellte qualitativ minderwertige Paper, entgegen den Versprechungen einer durchgängigen Automatisierung und eines erfolgreichen Peer-Reviews.

Die Bewertung von Sakana AI deckte Probleme auf, wie z. B. dass die KI bekannte Konzepte als neu einstufte, eine Ausfallrate von 42 % bei der Durchführung von Experimenten aufgrund von Programmierfehlern, fehlerhafte Methoden und fertige Paper, die erhebliche Fehler wie fehlende Abbildungen oder Platzhaltertexte enthielten.

Nein, die Bewertung von Sakana AI deutet stark darauf hin, dass dies nicht möglich ist. Obwohl das System eine End-to-End-Automatisierung anstrebt, bedeutet seine Unfähigkeit, wirklich neue Ideen zu generieren, Experimente zuverlässig durchzuführen oder qualitativ hochwertige, genaue Paper zu erstellen, dass es echte wissenschaftliche Entdeckungen noch nicht automatisieren kann.

Diese Bewertung von Sakana AI hebt seine Unzuverlässigkeit, Unvorhersehbarkeit und mangelnde Kontrolle hervor, was ihn für Unternehmen ungeeignet macht. Im Gegensatz zu praktischen Lösungen erzeugt er inkonsistente und oft fehlerhafte Ergebnisse und es fehlt ihm an der Transparenz und Zuverlässigkeit, die Unternehmen zur Lösung realer Probleme benötigen.

Die Bewertung von Sakana AI ergab, dass der KI-Wissenschaftler zwar Feedback strukturieren konnte, sein automatisierter Peer-Reviewer jedoch durchweg erhebliche Mängel in seiner eigenen Arbeit übersah. Bei der Überprüfung von von Menschen verfassten Arbeiten war er oft übermäßig kritisch und ihm fehlte das tiefe kritische Denken menschlicher Gutachter.

Diese Bewertung von Sakana AI stellt die Unzuverlässigkeit und den Blackbox-Charakter der experimentellen KI dem Fokus von eesel AI auf Zuverlässigkeit, Kontrolle und fundiertes Wissen gegenüber. Bewährte Lösungen bieten eine sichere Simulation, Benutzerkontrolle über Aktionen und nutzen vorhandenes Unternehmenswissen für genaue Ergebnisse.

Diesen Beitrag teilen

Kenneth undefined

Article by

Kenneth Pangan

Writer and marketer for over ten years, Kenneth Pangan splits his time between history, politics, and art with plenty of interruptions from his dogs demanding attention.