
Hugging Face bringt KI-Robotik aufs MacBook Mit SmolVLA startet ein Mini-Modell mit Mega-Power. Kann dieses Tool die Robotik demokratisieren? Kurzfassung | Andreas Becker, 05.06.25
gpt-image-1 | All-AI.de EINLEITUNG Mit SmolVLA hat Hugging Face ein neues KI-Modell vorgestellt, das komplexe Robotikaufgaben auf handelsüblicher Hardware wie einem MacBook bewältigen kann. Trotz seiner kompakten Architektur soll es in virtuellen und realen Anwendungen mit deutlich größeren Modellen konkurrieren können. Was steckt hinter diesem innovativen Vision-Language-Action-Modell, und welche Rolle könnte es künftig in der Robotik spielen? NEWS Ein schlankes Modell mit großer Wirkung SmolVLA wurde gezielt für Geräte mit begrenzten Ressourcen entwickelt. Mit nur 450 Millionen Parametern ermöglicht es eine leistungsfähige Ausführung von Robotikaufgaben, ohne auf teure Spezialhardware angewiesen zu sein. Grundlage der Entwicklung waren frei verfügbare Datensätze aus der Community, was den offenen und zugänglichen Charakter des Projekts unterstreicht. Die Entwickler verfolgen damit das Ziel, Robotikforschung und -entwicklung einem breiteren Nutzerkreis zu ermöglichen. Reaktionsschnelligkeit durch asynchrone Inferenz Ein zentrales Merkmal von SmolVLA ist seine Fähigkeit zur asynchronen Inferenz. Dabei werden Wahrnehmung und Handlung voneinander entkoppelt, was zu deutlich schnelleren Reaktionen führt. Roboter, die mit SmolVLA arbeiten, können dadurch besser auf dynamische Situationen reagieren. Erste Tests zeigen, dass das Modell Aufgaben rund 30 Prozent schneller erledigt als vergleichbare Systeme mit ähnlicher Aufgabenstellung. Teil der LeRobot-Initiative SmolVLA ist Teil der LeRobot-Plattform, mit der Hugging Face eine umfassende Infrastruktur für kostengünstige Robotiklösungen aufbauen will. Neben Modellen und Datensätzen bietet die Plattform auch Tools, die den Einstieg in die Entwicklung vereinfachen. Durch die Übernahme des Robotik-Startups Pollen Robotics baut Hugging Face sein Engagement in diesem Bereich gezielt aus und bringt zusätzliches Know-how ein. Effizienz im Vergleich zu größeren Modellen Im Vergleich zu anderen Vision-Language-Action-Systemen wie OpenVLA oder RoboMamba überzeugt SmolVLA vor allem durch seine kompakte Größe und dennoch starke Leistung. Während OpenVLA auf sieben Milliarden Parameter setzt, kommt SmolVLA mit einem Bruchteil dieser Größe aus, erreicht dabei aber vergleichbare Ergebnisse in vielen Aufgabenbereichen. Dies macht das Modell besonders attraktiv für Szenarien mit begrenzten Ressourcen. Anwendungen in Praxis und Forschung Bereits in der frühen Phase berichten Nutzer von erfolgreichen Anwendungen, etwa bei der Steuerung von Roboterarmen oder der Navigation in simulierten Umgebungen. Die einfache Integration sowie die Möglichkeit, das Modell auf Alltagsgeräten auszuführen, machen SmolVLA besonders interessant für Forschungseinrichtungen, Bildungseinrichtungen und kleinere Unternehmen. AUSBLICK Ein neuer Zugang zur Robotik Mit SmolVLA zeigt Hugging Face, dass leistungsfähige Robotiklösungen nicht zwingend auf große Rechenzentren angewiesen sind. Das Modell verbindet Effizienz, Flexibilität und Benutzerfreundlichkeit in einer Weise, die neue Zielgruppen erschließt und bestehende Anwendungen effizienter gestaltet. Sollte sich das Potenzial von SmolVLA auch im breiten Praxiseinsatz bestätigen, könnte es zu einem zentralen Baustein für die Demokratisierung der Robotik werden. UNSER ZIEL Wir wollen hauptberuflich über Künstliche Intelligenz berichten und dabei immer besser werden. Du kannst uns auf dem Weg unterstützen! Teile diesen Beitrag Folge uns auf Social Media Keine KI-News mehr verpassen und direkt kommentieren! Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support! Youtube - Kanal PayPal - Kaffee KURZFASSUNG
Hugging Face stellt mit SmolVLA ein neues, besonders effizientes Robotik-KI-Modell vor, das auch auf Laptops läuft.
Mit nur 450 Millionen Parametern übertrifft es in Aufgaben viele größere Modelle wie OpenVLA oder RoboMamba.
SmolVLA ermöglicht durch asynchrone Inferenz schnellere Reaktionen und lässt sich einfach in bestehende Systeme integrieren.
Die LeRobot-Plattform und Community-Daten machen Robotik für Bildung, Forschung und Industrie zugänglicher denn je.
QUELLEN
TechCrunch
Hugging Face Blog
arXiv
Weiterlesen...