Google DeepMind hat mit SARA-RT ein neues künstliches Intelligenzmodell für die Robotik vorgestellt, das Maschinen entscheidungsfreudiger und effizienter machen soll. Die neue Architektur soll ein häufiges Problem in der Robotik lösen: Maschinen zerlegen Aufgaben in zu viele kleine Schritte, was zu langsamen und ineffizienten Abläufen führt.
SARA-RT, die Abkürzung für Stochastic Action-Representation-Action for Robotic Transformers, wurde in einem Blogbeitrag des Unternehmens angekündigt und stellt einen signifikanten Wandel in der Art und Weise dar, wie Robotersysteme Befehle erlernen und ausführen. Im Gegensatz zu früheren Modellen, die riesige Mengen visueller Daten verarbeiten, um über jede einzelne Bewegung zu entscheiden, lernt SARA-RT, Aktionen zu zusammenhängenderen, übergeordneten Verhaltensweisen zu gruppieren. Dieser „aktionszentrierte“ Ansatz ermöglicht es dem Roboter, früher zehn kleine Schritte – wie etwa das fünfmalige Anpassen des Griffs vor dem Anheben eines Gegenstands – zu einem einzigen, flüssigen Befehl zusammenzufassen.
Laut den Google-Forschern verbessert diese Methode sowohl die Trainingsgeschwindigkeit als auch die Leistung deutlich. Durch die Fokussierung auf die *Konsequenzen* von Aktionen statt nur auf reine Pixeldaten kann SARA-RT mit weniger Daten effektiver trainiert werden. In Tests zeigten Roboter, die mit dem neuen Modell ausgestattet waren, eine um 501 TP3T verkürzte Trainingszeit und eine um 141 TP3T verbesserte Aufgabenerfolgsrate im Vergleich zu früheren Systemen.
Dieser Durchbruch beseitigt einen zentralen Engpass beim Einsatz von Robotern in komplexen, realen Umgebungen. Durch die Reduzierung des Rechenaufwands und die Beseitigung der „Analyselähmung“ könnte SARA-RT den Einsatz von Robotik in Bereichen wie Logistik, Fertigung und schließlich auch in der häuslichen Assistenz beschleunigen. Die Entwicklung baut auf Googles früheren Arbeiten mit Modellen wie dem Robotic Transformer 2 (RT-2) auf und signalisiert die konsequente Weiterentwicklung leistungsfähigerer und autonomerer Robotersysteme, die sicher und effektiv an der Seite von Menschen agieren können.


