TU München
Mask Bot: Roboter mit menschlichem Antlitz
Roboterforscher am Institut für Kognitive Systeme (ICS) der TU München haben zusammen mit japanischen Wissenschaftlern und dem National Institute of Advanced Industrial Science and Technology in Japan (AIST) eine technische Lösung entwickelt, mit der Roboter ein Gesicht erhalten: Ein Beamer projiziert das 3D-Bild eines Gesichts von hinten in eine Kunststoffmaske, Sprache und Mimik steuert ein Computer.
Das Projekt ist Teil des Münchener Roboter-Exzellenzclusters CoTeSys. Der Mask-Bot getaufte Roboter besteht aus einem verblüffend menschenähnlichen Kunststoffkopf. Schlichte Dialoge mit dem Roboter sind bereits möglich: „Rainbow“ sagt Dr. Takaaki Kuratate, vom Lehrstuhl für Kognitive Systeme an der TU München. Und schon klimpert Mask-Bot mit den Augen und verblüfft den menschlichen Gesprächspartner mit einem englischen Satz. Übersetzt ins Deutsche sagt er: „Wenn sich Sonnenstrahlen in den feinen Wassertropfen der Atmosphäre brechen, dann entsteht ein Regenbogen.“ Dabei bewegt er ein wenig den Hals und hebt vielsagend die Augenbrauen.
Damit derartige Mimik möglich wird, realisierten die Entwickler mehrere Neuheiten. Die Präsenz des 3D-Gesichtes erreichten sie mittels einer transparenten Kunststoffmaske, auf die ein hinter ihr befestigter Beamer ein menschliches Gesicht passgenau und dreidimensional projiziert und ihr so Individualität verleiht. Auf diese Weise wirkt das Gesicht auch von der Seite noch sehr realistisch. Weiterer Vorteil: Alle Komponenten für das Gesicht lassen sich im Roboter-Kopf von außen unsichtbar unterbringen.
Um Verzerrungen bei der Darstellung zu vermeiden, sorgte das CoTeSys-Team mit einer stark stauchenden Faktor 0,25-Fischaugenlinse mit einem Makroadapter dafür, dass bei einem Abstand von nur zwölf Zentimetern zwischen Linse und Gesichtsmaske dort auch wirklich ein komplettes Gesicht ankommt.
Ein besonders starker, kleiner Beamer sowie eine spezielle Leuchtschicht-Imprägnierung auf der Innenseite der Kunststoffmaske verhelfen Mask-Bot zudem zu so viel Leuchtkraft, dass die Kommunikation Mensch-Maschine auch bei Tageslicht möglich ist. „Bei uns können Sie die Vorhänge offen lassen“, erklärt Kuratate lachend.
Dieser Teil des neuen Systems könnte schon bald in Videokonferenzen angewandt werden. „Mask-Bot kann dabei das bislang übliche Monitorbild einer Person durch eine echte Nachbildung ersetzen, die mit am Tisch sitzt und genauso aussieht und spricht“, sagt Takaaki Kuratate.
Mask-Bot lernt Mimik von menschlichen Probanden
Für das Mienenspiel hat er die „Talking Head Animation Engine“ entwickelt: Zunächst sammelt ein spezielles Kamerasystem zahlreiche Informationen über das Mienenspiel menschlicher Probanden. Daraus filtert und abstrahiert ein Computer jene Gesichtsausdrücke, die zu einem bestimmten Laut passen, wenn er gesprochen wird. Aus jedem dieser Gesichtsausdrücke wurde ein Set an Gesichtspunkten extrahiert, die der Computer nun jedem neuen Gesicht zuordnen und es so beleben kann. Eine „Emotion Synthesis Software“ sorgt bei Bedarf für eine emotionale Färbung: dass jemand fröhlich, traurig oder wütend schaut. Ein neu entwickeltes Programm ermöglicht, dass dem Computer bereits ein herkömmliches, zweidimensionales Foto ausreicht, um es richtig proportioniert in eine Projektion für eine dreidimensionale Maske umzuwandeln. Weitere Algorithmen verleihen dem Gesicht Mimik und Sprache.
Mask-Bot kann bereits realistisch nachsprechen, was ihm über eine Tastatur eingetippt wird. Englisch, Japanisch und bald auch Deutsch: Eine „Text To Speech“-Programmierung setzt den Text in Audiosignale um. Auf Knopfdruck einmal als Frauen- oder Männerstimme, einmal leiser, ein anderes Mal lauter und fröhlicher. Gesprochene Sprache versteht Mask-Bot allerdings noch kaum. Hören und passende Antworten geben, kann der Roboter derzeit nur auf fest programmierten Bahnen. Das allerdings ist kein Spezifikum der neuen Maschine: Die Entwicklung von Programmen, mit denen Roboter tatsächlich in Echtzeit hören und verstehen können, was ein menschliches Pendant gerade sagt, um dann auch noch passend zu antworten, bleibt laut Kuratate weltweit ein großes Forschungsthema.
Die CoTeSys-Gruppe wählt mit dem System einen anderen Weg als jenen, die Mimik mit Gesichtseinzelteilen und Dutzenden darunter liegender Mini-Motoren zu imitieren. Denn Mask-Bot wird in der Lage sein, viel schneller als ein recht träges mechanisches Antlitz Sprache und Mimik zu kombinieren. So tüfteln die Münchener Erfinder schon am Nachfolger Mask-Bot 2. Hier sollen Maske, Projektor und Computersteuerung in einem mobilen Roboter stecken. Kostete Prototyp 1 noch knapp unter 3000 Euro, sollen bei seinem Nachfolger 400 Euro in Reichweite kommen. „Neben der Verwendung in Videokonferenzen könnten solche Systeme bald Gesprächspartner für ältere Menschen sein, wenn sie alleine Zeit verbringen müssen“ meint Kuratate.













