
Sakana AI revolutioniert KI: Modelle mischen statt trainieren Mit der M2N2-Methode kombiniert Sakana spezialisierte KI-Modelle zu neuen Super-KIs – ganz ohne Nachtraining. Wird das der neue Standard? Kurzfassung | Andreas Becker, 30.08.25
gpt-image-1 | All-AI.de EINLEITUNG Künstliche Intelligenz wird immer vielseitiger, doch das Training großer Modelle bleibt teuer und aufwendig. Die japanische KI-Schmiede Sakana AI hat jetzt ein Verfahren entwickelt, das dieses Problem umgeht: Mit einer Technik namens M2N2 lassen sich bestehende Modelle kombinieren, ohne dass sie neu trainiert werden müssen. Statt einzelne Modelle auf neue Aufgaben anzupassen, verschmilzt M2N2 deren Fähigkeiten direkt miteinander. Das spart Rechenzeit, vermeidet Datenprobleme – und schafft sogar Modelle, die Dinge können, für die sie nie direkt trainiert wurden. NEWS Modelle mischen statt trainieren Normalerweise wird ein KI-Modell mit vielen Daten auf eine bestimmte Aufgabe trainiert. Will man es erweitern, braucht es oft weiteres Feintuning. Das kostet Zeit, Energie – und im Zweifel auch Geld für neue Daten. Sakana AI geht einen anderen Weg: Das neue Verfahren kombiniert die Gewichtungen mehrerer bereits trainierter Modelle. Diese „Gewichte“ sind das, was ein Modell aus dem Training gelernt hat. Werden sie geschickt gemischt, entsteht daraus ein neues Modell, das die Stärken der Ursprungsversionen vereint. Und das ganz ohne klassischen Trainingsprozess. + Evolution statt Handarbeit Bisher war dieses Mischen von Modellen ziemlich aufwendig. Entwickler mussten manuell festlegen, welche Teile eines Modells mit welchen anderen kombiniert werden. M2N2 nimmt diesen Aufwand ab. Die Methode nutzt eine Art evolutionäre Suche: Verschiedene Kombinationen werden ausprobiert, getestet und verbessert – so lange, bis leistungsfähige Mischungen entstehen. Anders als frühere Ansätze setzt M2N2 dabei keine festen Grenzen, etwa bei einzelnen Schichten des Modells. Stattdessen werden die Teile flexibel ausgewählt, in variabler Stärke kombiniert und getestet. Besonders erfolgreich ist die Methode, weil sie gezielt nach Unterschieden zwischen den Modellen sucht – also nach Ergänzungen, nicht nur nach Ähnlichkeiten. So entsteht ein wirklich neues Modell mit mehr Können als seine Vorläufer. Erfolgreich bei Sprache, Bild und Klassifikation Getestet wurde M2N2 unter anderem auf einfache Bilderkennungsaufgaben. Dabei erreichte es deutlich bessere Ergebnisse als andere Verfahren, die ebenfalls auf Modellmischung setzen. Ent*******nd war hier, dass das System gezielt Vielfalt in den Ausgangsmodellen erhält – und so beim Kombinieren tatsächlich neue Fähigkeiten entstehen. Ein weiteres Beispiel war die Verschmelzung zweier Sprachmodelle. Eines war besonders gut in Matheaufgaben, das andere in webbasierten Anwendungen. Durch M2N2 entstand ein Modell, das beide Aufgaben souverän bewältigt. Auch bei Bildgeneratoren zeigte sich das Potenzial: Ein Modell für japanische Bildbeschreibungen wurde mit englisch trainierten Varianten kombiniert. Das Ergebnis war ein leistungsfähiger Bildgenerator, der Prompts in beiden Sprachen versteht – obwohl er nur auf Japanisch optimiert wurde. Vorteile für Unternehmen – aber auch neue Herausforderungen Für Firmen, die bereits spezialisierte KI-Modelle nutzen, ist das Prinzip besonders interessant. Sie können ihre bestehenden Modelle gezielt verschmelzen und so neue, komplexe Fähigkeiten schaffen – etwa ein Sprachmodell, das in Echtzeit auf die Mimik von Kunden reagiert. Statt zwei Modelle parallel laufen zu lassen, reicht dann ein einziges, was Betriebskosten und Rechenzeit deutlich senkt. Die größte Herausforderung liegt allerdings nicht in der Technik, sondern in der Umsetzung. Wenn Modelle aus unterschiedlichen Quellen kombiniert werden – also etwa Open-Source-Modelle, eigene Entwicklungen und kommerzielle Komponenten –, müssen Datenschutz, Sicherheit und Lizenzfragen geklärt sein. Das verlangt klare Prozesse in der Modellverwaltung und sorgfältige Prüfung, was kombiniert werden darf. Ein Blick in die Zukunft Das Konzept von M2N2 passt gut zu einem Trend in der KI-Welt: weg von riesigen Einzelmodellen, hin zu flexiblen Modell-Ökosystemen, in denen Fähigkeiten nach Bedarf kombiniert werden. So entsteht ein lernendes System, das sich laufend an neue Anforderungen anpasst – ganz ohne von Grund auf neu trainiert zu werden. Für die Praxis heißt das: Weniger Aufwand, mehr Anpassungsfähigkeit – und ganz neue Möglichkeiten, wie KI in Unternehmen eingesetzt werden kann. DEIN VORTEIL - DEINE HILFE Kostenlose News und Tutorials – mit minimaler Werbung und maximalem Mehrwert. Damit das so bleibt und wir uns stetig verbessern können, freuen wir uns über deine Unterstützung. Teile diesen Beitrag Folge uns auf Social Media Keine KI-News mehr verpassen und direkt kommentieren! Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support! Youtube - Kanal PayPal - Kaffee KURZFASSUNG
Sakana AI hat mit M2N2 eine Methode entwickelt, mit der sich spezialisierte KI-Modelle kombinieren lassen – ganz ohne neues Training.
Das Verfahren nutzt eine evolutionäre Suche, um die besten Kombinationen aus bestehenden Modellen zu finden und neue Fähigkeiten zu schaffen.
M2N2 zeigt Erfolge bei Sprach-, Bild- und Klassifikationsaufgaben und spart gleichzeitig Rechenzeit, Energie und Kosten.
Für Unternehmen ergeben sich neue Chancen, aber auch Herausforderungen bei Lizenzierung, Datenschutz und Integration.
QUELLEN
VentureBeat
arXiv
GitHub
ACM Digital Library
Sakana AI Blog
Weiterlesen...