Google DeepMind hat mit der Einführung von SIMA (Scalable, Instructable, Multiworld Agent) einen bedeutenden Fortschritt in der künstlichen Intelligenz erzielt. Im Gegensatz zu früheren KIs, die nur ein Spiel beherrschten, ist SIMA ein Generalist, der Aufgaben in einer Vielzahl von 3D-Videospielen erlernen und ausführen kann – ein entscheidender Schritt hin zur Entwicklung vielseitigerer und anpassungsfähigerer KI-Systeme.
Das Projekt, das diese Woche im Forschungsblog des Unternehmens angekündigt wurde, beinhaltete Partnerschaften mit mehreren Spieleentwicklern, darunter Hello Games („No Man’s Sky“) und Coffee Stain Studios („Goat Simulator 3“). SIMA wurde in diesen interaktiven Umgebungen nicht durch Zugriff auf den Quellcode des Spiels trainiert, sondern durch Beobachtung menschlicher Spieler und Reaktion auf natürliche Sprachanweisungen. Die KI verarbeitet visuelle Daten vom Bildschirm und Benutzerbefehle – wie „die Leiter hochklettern“ oder „Ressourcen finden, um einen Unterschlupf zu bauen“ –, um komplexe, mehrstufige Aufgaben zu erlernen.
Dieser Ansatz markiert eine Abkehr von spezialisierten KIs wie AlphaGo, die auf den Regeln eines einzigen, strukturierten Spiels trainiert wurden. SIMAs Stärke liegt in der Fähigkeit, die erlernten Fähigkeiten auf verschiedene virtuelle Welten anzuwenden. Forscher von DeepMind betonten, dass das Ziel nicht darin bestehe, eine KI zu entwickeln, die menschliche Spieler schlagen kann, sondern eine, die Anweisungen versteht und befolgt, um mit ihnen zusammenzuarbeiten.
Die zugrunde liegende Technologie basiert auf fortschrittlichen Video- und Sprachmodellen, die es dem Agenten ermöglichen, sprachliche Befehle mit Bildschirmaktionen zu verknüpfen. Obwohl derzeit auf virtuelle Welten beschränkt, haben die Prinzipien hinter SIMA tiefgreifende Auswirkungen auf die Zukunft der KI. Die Fähigkeit, jede beliebige Umgebung anhand einfacher Anweisungen zu verstehen und darin zu handeln, könnte den Weg für leistungsfähigere digitale Assistenten, intelligentere Robotik und KI ebnen, die in realen Szenarien sicher navigieren und unterstützen kann. Die Forschung demonstriert ein leistungsstarkes neues Paradigma für das Training von KI, um hilfreicher und auf menschliche Absichten ausgerichtet zu sein.


