KI macht es möglich

KIT-Forscher sendet Sprachnachricht von der Titanic

25. Juli 2022, 17:41 Uhr | dpa
OceanGate organisiert Expeditionen zur gesunken Titanic.
© OceanGate

Rund 3800 Meter unter der Meeresoberfläche kann man beobachten, wie die Titanic zerfällt. Wie sie rostet und sich Unterwasser-Lebewesen über sie hermachen. Ein Karlsruher Computerwissenschaftler hat eine Mission zu dem Wrack jetzt für etwas ganz anderes genutzt.

Während einer Expedition zur versunkenen Titanic hat Computerwissenschaftler Alex Waibel aus einem U-Boot heraus eine Sprachtechnologie mit Videofunktion getestet. Dabei sendete er per Sonar Texte an die Oberfläche, die dort mittels künstlicher Intelligenz (KI) in gesprochene Sprache und Video umgewandelt wurden. Einige Dialoge hätten sie durchbekommen, berichtete der Forscher vom Karlsruher Institut für Technologie (KIT) der Deutschen Presse-Agentur. »Wir konnten sehen, dass das wirklich funktioniert.«

So funktioniert es

Der KIT-Forscher Axel Waibel (rechts) im U-Boot mit dem Gründer des Unternehmens OceanGate, Stockton Rush.
Der KIT-Forscher Axel Waibel (rechts) im U-Boot mit dem Gründer des Unternehmens OceanGate, Stockton Rush. Das Unternehmen führt U-Boot-Missionen zur Titanic durch.
© Axel Waibel/KIT/dpa

Die getestete Technik funktioniert wie folgt: Vor dem Tauchgang haben Waibel und beteiligte Kollegen Videos und Stimmproben von sich aufgezeichnet. Erreichen nun Textnachrichten das Computersystem, setzt die KI das so um, dass es auf dem Video so aussieht und klingt, als würde die Person selbst gerade sprechen – samt Lippenbewegungen.

Was insbesondere im Zusammenhang mit der Titanic-Expedition nach einer PR-trächtigen Spielerei von technikaffinen Wissenschaftlern klingt, hat einen ernsten Hintergrund: »Es gibt genügend Stellen auf der Welt, wo die Bandbreite so schlecht ist, dass nur Text-Übertragung möglich ist«, sagte Waibel. Mit der neuen Technologie könnte so einmal Video-Kommunikation möglich werden.

Doch hat die Mission auch die Tücken aufgezeigt: Eines von zwei Sonargeräten sei ausgefallen, sagte Waibel. Daher habe nur ein Teil der Dialoge noch aus dem U-Boot übertragen werden können. Auch sei er auf neue Ideen gekommen: So arbeiteten U-Boot-Besatzungen viel mit Abkürzungen, um Texte zu komprimieren. Ein weiteres Ziel sei, die Technologie so zu verkleinern, dass sie in eine Tasche passt. Alles in allem zeigte sich Waibel zufrieden: »Ein guter Anfang ist gelegt.«

Das Bild zeigt die Drohnenaufnahme eines U-Boots auf einer Plattform.
Das Bild zeigt die Drohnenaufnahme eines U-Boots auf einer Plattform.
© Axel Waibel/KIT/dpa

Eine der größten Herausforderungen beim Umsetzen der Texte in Videos habe im Übrigen gar nichts mit der Sprache zu tun, verriet der Wissenschaftler: »Wenn die Person nichts sagt, ist das überraschend schwer.« Dann bewegen sich die Lippen in den Videos bislang kaum.

Waibel war Teil einer größeren Mission unter anderem mit Biologen und Archäologen. Immer wieder gibt es derartige Expeditionen zur Titanic.

Seit mehr als 30 Jahren beschäftigt sich der Forscher mit KI und maschinellem Lernen in der Sprach- und Kommunikationstechnologie. Er entwickelte unter anderem den nach KIT-Angaben weltweit ersten automatischen simultanen Übersetzungsdienst an einer Universität. Der »Lecture Translator« zeichnet automatisch den Vortrag des Referenten auf und übersetzt die Sprachsignale simultan ins Englische, was dann als Untertitel eingeblendet wird. Studierende ohne Deutschkenntnisse können so über Laptop, Smartphone oder Tablet der Vorlesung folgen.


Das könnte Sie auch interessieren

Verwandte Artikel

KIT - Karlsruher Institut für Technologie, dpa Deutsche Presse-Agentur GmbH

Tellerrand

Künstliche Intelligenz