Sabo Mobile IT
LLM als Basis für die Sprachsteuerung
Sabo Mobile IT setzt bei seiner Sprachsteuerung Sabot auf ‚Large Language Models‘ – kurz LLM. Über die Technik dahinter und den Datenschutz im industriellen Umfeld spricht Thomas Sykora.
Warum ist Sprachsteuerung noch so wenig in der Industrie anzutreffen?
Thomas Sykora: Weil die Technik bis vor kurzem nicht bereit war. Erst die neuen ‚Large Language Models‘ – kurz LLM – wie etwa BERT von Google oder GPT von open.ai sind in der Lage, Absichten des Sprechers korrekt zu interpretieren. Auch Bediensicherheit und Datenschutz waren Barrieren, die es zu überwinden galt. Und zu guter Letzt mussten die Benutzer dafür bereit werden. Mit Maschinen zu sprechen wird bis heute teils als störend empfunden. Tastatureingaben behelligen niemanden, mein Gespräch mit der Maschine müssen alle mithören. Früher galt dagegen die Arbeit am Bildschirm als besonders belastend, was zu speziellen Zulagen führte. Das zeigt, was Gewöhnung ausmacht. Gute Sprachassistenten in unseren Telefonen und digitalen Assistenten sind dabei, unsere Einstellung zu ändern. Junge Smartphone-User zeigen, wohin die Reise geht: Wozu Texte tippen, wenn es Siri gibt?
Welche Unterschiede gibt es in der Sprachsteuerung?
Sprachsteuerungen der ersten Generation konnten nur auf wenige gesprochene Kommandos reagieren – eine Zahl, Ja oder Nein. Alexa kam 2015 auf den Markt und reagierte ebenso wie Siri und Cortana auf einprogrammierte Phrasen – die KI war noch nicht so weit. Selbst gängige Chatbots suchen bis heute im Wesentlichen nach Textübereinstimmung mit vorbereiteten Sätzen und Fragen und geben eingespeicherte Antworten. Das funktioniert oft, stößt bei Sonderfällen, komplizierten Kontexten und spezifischen Problemen aber schnell an Grenzen. Ein Quantensprung war deshalb das Aufkommen der LLM. Das ist die Chance der aktuellen Generation von Assistenten, zu der Sabot ebenso gehört wie die neueste Alexa. Während sie ein extrem breites Feld von Dialogen bedienen muss, ist Sabot fokussiert auf eine Maschine und ihren Kontext. Dafür muss Sabot besonders zuverlässig und sicher sein. Große Internetkonzerne verkaufen die Daten, die wir ihnen durch Nutzung zur Verfügung stellen. Im industriellen Umfeld verbietet sich das. Sabot darf das Gehörte nicht ohne ausdrückliche Erlaubnis weitergeben. Deshalb nutzen wir ein Wake-Wort: Es wird im Gerät erkannt, und erst danach werden die Sprachsignale über das Internet weitergeleitet.
Sie setzen auf einen KI-gesteuerten Chatbot, können Sie die Funktionsweise näher erläutern?
Sabot ist eine modulare Plattform: Die Schnittstelle zur Steuerung der Maschine, Akustik und Umwandlung des Sprachsignals zu Text sind je nach Aufgabenstellung unterschiedlich und deswegen auf mehrere Arten lösbar. Wir setzen dazu KI an mehreren Stellen ein, zum Beispiel zur Unterdrückung von Nebengeräuschen. Der Kern ist jedoch eine KI, die die Intentionen des Bedieners erkennt und gegebenenfalls durch einen Dialog präzisiert und absichert. Hierzu verwendet Sabo bestehende LLM, die nach Bedarf um das Domänenwissen der Maschine und ein speziell antrainiertes neuronales Netzwerk ergänzt werden. Dabei ist Sabot ein selbstlernendes System, das Eingaben beobachten, sich optimieren, vor Bedienfehlern warnen und Handlungsempfehlungen geben kann. In diese Richtung haben wir bereits 2021 mit dem Fraunhofer IPA geforscht.
Wie hoch ist der Aufwand, eine Bestandsmaschine mit Sprachsteuerung auszustatten? Welche technischen Voraussetzungen müssen geschaffen werden?
Das hängt von der Schnittstelle zur Maschine ab, auf die Sabot zugreift. Sie muss angepasst oder ersetzt werden – ein Thema, für das die Sabo Mobile IT GmbH und Grossenbacher Systeme AG zwei Lösungsansätze anbieten. Möglich ist eine Retrofit-Hardware, die den Audioteil, die Intelligenz und die Kommunikation zur Steuerung realisiert. Die zukunftsorientierte und kostenoptimierte Lösung ist jedoch der Einsatz eines neuen Controllers, der die erforderliche Hardware mitbringt und künftige Anforderungen an die Cybersicherheit erfüllt. In beiden Fällen müssen die Maschine und der verbundene Prozess in der KI erfasst und getestet werden, was SABO Mobile IT als Dienstleistung anbietet. Basis hierfür sind derzeit in Forschungs-projekten entwickelte Trainings- und Testwerkzeuge, die die Effektivität steigern und den Kunden zugutekommen werden.











