Physical AI
Alibaba erweitert ‚Qwen‘ für Robotik
Alibaba hat seine KI-Modellfamilie ‚Qwen‘ um eine Robotik-Suite für sogenannte Physical AI ergänzt. Die drei neuen Modelle sollen Roboter bei Manipulation, Navigation und der Simulation physischer Abläufe unterstützen und den Einsatz allgemeiner KI in realen Umgebungen erleichtern.
Alibaba erweitert seine Qwen-Modellfamilie um die Qwen-Robot Suite. Die Plattform umfasst drei spezialisierte Modelle: ‚Qwen-RobotManip‘ für Manipulationsaufgaben, ‚Qwen-RobotNav‘ für Navigation sowie ‚Qwen-RobotWorld‘, ein Video-World-Modell zur Simulation zukünftiger Bewegungsabläufe.
Die Suite soll KI-Systeme dabei unterstützen, physische Umgebungen wahrzunehmen, Sprachbefehle in konkrete Handlungen umzusetzen und Entscheidungen in Echtzeit zu treffen. Zu den vorgesehenen Einsatzbereichen zählen unter anderem Industrieroboterarme, Lieferroboter und Roboterhunde.
Training mit Millionen Datensätzen
Qwen-RobotManip basiert auf ‚Qwen3.5-4B VL‘ und wurde mit mehr als 38.000 Stunden frei verfügbarer Robotikdaten trainiert. Dazu gehören Daten aus Robotik-Repositorien, Videos menschlicher Manipulationshandlungen sowie synthetisch erzeugte Human-to-Robot-Datensätze. Nach Angaben von Alibaba verbessert das Modell den Transfer zwischen unterschiedlichen Roboterplattformen um den Faktor drei und benötigt nur wenig Nachtraining für verschiedene Hardware.
Qwen-RobotNav basiert auf Qwen3-VL und wurde mit 15,6 Millionen kuratierten Beispielen trainiert. Die Daten decken unter anderem Trajektorienplanung sowie visuell-sprachliches Schlussfolgern ab. Das Modell dient als Navigations-Engine für agentische Systeme, die langfristige Aufgaben übernehmen. Als Beispiel nennt Alibaba Anwendungen wie Embodied Question Answering, bei denen Roboter Fragen zu ihrer Umgebung beantworten.
Für Qwen-RobotWorld kamen 8,6 Millionen Video-Text-Paare mit mehr als 200 Millionen Einzelbildern, über 20 Verkörperungstypen und 500 Aktionskategorien zum Einsatz. Das Modell soll physikalisch plausible Bewegungsabläufe vorhersagen, synthetische Trainingsdaten erzeugen und Bewegungen simulieren, bevor sie von Robotern ausgeführt werden.
Ausgewählte Unternehmenskunden aus der Robotikbranche testen die Qwen-Robot Suite bereits im Rahmen von Pilotprojekten.
Fokus auf Physical AI
Mit der neuen Suite erweitert Alibaba den Einsatz seiner Qwen-Modelle über klassische KI-Anwendungen hinaus auf sogenannte Physical AI. Dabei sollen allgemeine Sprach- und Multimodalmodelle mit den Robotikmodellen zusammenarbeiten. Als Beispiel nennt das Unternehmen die Suche nach einem verlorenen Gegenstand an einem realen Ort: Während ein allgemeines Qwen-Modell die Aufgabe plant, übernimmt Qwen-RobotNav die Navigation und Erkundung der Umgebung.











