Mit Sprache bedienen Maschinen und Anlagen fernsteuern, ohne Knöpfe zu drücken

Von Dipl.-Ing. (FH) Hendrik Härter 4 min Lesedauer

Anbieter zum Thema

Sprachassistenten sind im Haushalt weit verbreitet. Aber lässt sich beispielsweise auch ein Industrieroboter per Sprache steuern? Dank Embedded KI können Sprachbefehle in Industrie und Medizin ohne Latenzzeiten ausgewertet und sicher übertragen werden.

Roboter in der Industrie: Dank Embedded KI lassen sich Sprachbefehle ohne Latenzzeiten auswerten und sicher übertragen.(Bild:  frei lizenziert /  Pixabay)
Roboter in der Industrie: Dank Embedded KI lassen sich Sprachbefehle ohne Latenzzeiten auswerten und sicher übertragen.
(Bild: frei lizenziert / Pixabay)

In vielen Haushalten hat der Einsatz von Sprachassistenten den Alltag beeinflusst. Nach einem sogenannten Wake-Word, welches die Applikation aktiviert, übermittelt diese den Wunsch des Bedienenden an einen entfernten Server, der den Sprachbefehl analysiert und anschließend das Auswertungsergebnis an das Gerät zurücksendet. Etwas ähnliches finden sich auch in der Industrie und Medizintechnik, wo Keyword-Spotting (KWS) an Bedeutung zunimmt. Wird Sprache erfasst und ausgewertet, lassen sich schon heute Prozesse beschleunigen sowie effizienter gestalten und sogar Leben retten.

In der Industrie und Medizintechnik bietet Keyword-Spotting bereits heute Vorteile:

  • Effizienz: Durch die Automatisierung von Aufgaben können Prozesse beschleunigt und Kosten gesenkt werden.
  • Sicherheit: KWS kann beispielsweise Maschinen und Anlagen überwachen und so Unfälle verhindern.
  • Genauigkeit: KI-basierte Systeme können Sprache oft präziser erkennen und interpretieren als Menschen.

„Die Vorteile sind unübersehbar,“ sagt Viacheslav Gromov, Gründer und Geschäftsführer des KI-Anbieters AITAD. „Wenn Menschen die Maschine in der Produktion mit der Stimme steuern, dann bedeutet das mehr Flexibilität. Anlagen lassen sich aus der Ferne bedienen und niemand muss Knöpfe drücken oder auf dem Bildschirm der Maschine eine Eingabe eintippen. Es bedeutet auch, keine Keime und Bakterien, ein wichtiger Aspekt in der Medizin. Auch ein gerufener Befehl 'Stop' ist schneller als zur Maschine zu laufen und diese anzuhalten.“

Sprachsteuerungen mit Embedded-KI realisieren

„Sprachsteuerung bietet Unternehmen mehr Flexibilität“, sagt Viacheslav Gromov, Gründer und CEO der AITAD.(Bild:  AITAD)
„Sprachsteuerung bietet Unternehmen mehr Flexibilität“, sagt Viacheslav Gromov, Gründer und CEO der AITAD.
(Bild: AITAD)

Die Übertragung von Sprachsignalen zu entfernten Servern ist mit Latenzzeiten verbunden, die in sicherheitsrelevanten Umgebungen nicht akzeptabel sind. Auch das Manipulations- und Ausfallrisiko einer Netzwerkverbindung spielt eine Rolle. Der Einsatz in sicherheitskritischen Umgebungen in Industrie und Medizin erfordert Antworten, die lokal und in Echtzeit arbeiten.

Hier setzen Sprachsteuerungsmodelle an, die mit Embedded KI realisiert werden. Dabei werden nicht nur einzelne Schlüsselwörter erkannt, sondern bis zu 30 vordefinierte Begriffe, die komplexe Befehle ermöglichen. Ein Schlüsselwort aktiviert das System. Anschließend können komplexe Kombinationen dieser vordefinierten Wortgruppe gesprochen und von der KI ausgewertet werden, die zusammen mit den Mikrofonen auf der gleichen kleinen Platine sitzt („Embedded-KI-Systemkomponente“).

Sprachbefehle am Beispiel Roboter

„Roboter, starte Programm A auf Maschine 3“
„Roboter, Förderband 6 anhalten“
„Roboter, Motor 4 in Maschine 3, erhöhe die Drehzahl um 40 Prozent“
„Roboter, Rollstuhl, jetzt links abbiegen“
„Roboter, Not aus“

„Entscheidend ist hier ein maximales Sicherheitslevel, das durch die lokale Verarbeitung der Sprachdaten – ohne Cloud oder Server – gewährleistet wird. Sowie die Effizienz, da die Befehle in Echtzeit direkt im Chip ausgewertet werden und die Maschine dadurch schneller reagiert,“ erklärt Gromov weiter.

Frei konfigurierbar, echtzeitfähig und robust

Die Sprachdaten werden lokal und ohne Cloud oder Server verarbeitet. Ein Chip wertet die Befehle direkt aus.(Bild:  AITAD)
Die Sprachdaten werden lokal und ohne Cloud oder Server verarbeitet. Ein Chip wertet die Befehle direkt aus.
(Bild: AITAD)

Unternehmen können ihre Sprachsteuerung individuell konfigurieren, angefangen von den Wakewords bis hin zur Wortgruppe. Dies ermöglicht maßgeschneiderte Systeme, die auch in mehreren Sprachen verfügbar sind. Bei Bedarf können synthetisch erzeugte Sicherheitsabfragen integriert werden. Die Einsatzmöglichkeiten sind vielfältig, von der Steuerung von Maschinen bis hin zur Notauslösung per Sprachbefehl. Die Einsatzmöglichkeiten sind vielfältig, von der Steuerung von Maschinen bis hin zur Notauslösung per Sprachbefehl.

Die Einsatzmöglichkeiten der Sprachsteuerung sind nahezu unbegrenzt:

  • Im Operationssaal kann der Chirurg das Hochfrequenzskalpell per Sprachbefehl starten, justieren und wieder abschalten.
  • Berührungsloses Steuern von Maschinen und Geräten in Produktion und Krankenhäusern.
  • Notaus per Sprachbefehl erspart im Ernstfall den Spurt zum Not-Aus-Schalter.
  • Menschen mit Assistenzbedarf können beispielsweise den Rollstuhl per Sprache steuern.

Sprachsteuerung in einer lauten Umgebung

Autarke Sprachsteuerung mit Embedded-KI arbeitet vollständig lokal und in Echtzeit. Sie lassen sich auch in rauen Industrie-Umgebungen einsetzen. Die KI wird nicht nur mit den zu erkennenden Worten, sondern auch mit Störgeräuschen trainiert, um eine zuverlässige Spracherkennung sicherzustellen. Selbst eine laute Umgebung ist kein Problem. Mit einem zusätzlichen Mikrofon lässt sich der Standort des Sprechers erkennen und störende Geräusche eliminieren (Beamforming).

„Diese neue, wegweisende Sprachsteuerung wird die Zukunft in Industrie und Medizin nachhaltig verändern und bestimmen“, ist sich Gromov sicher. „Die Anfragen aus Industrie und Medizin nehmen zu. Wir selbst haben eine Lösung entwickelt, mit der Unternehmen schon heute ihre Produkte mit dieser Technologie ausstatten und damit eine Vorreiterrolle in Wirtschaft und Business einnehmen können. Diese zeichnet sich durch eine hohe Robustheit auch gegen Störgeräusche aus und wird individuell auf die Kundenanforderungen zugeschnitten. Da wir auf eine Vorentwicklung zurückgreifen, können wir unsere lokale Sprachsteuerung mit ungefähr 30 zu erkennenden Wörtern kostengünstig anbieten“. (heh)

Hintergrund

Viacheslav Gromov ist Gründer und CEO von AITAD. Das Unternehmen entwickelt elektronikbezogene künstliche Intelligenz (Embedded KI), die lokal und in Echtzeit definierte Aufgaben in Geräten und Maschinen übernimmt. Er ist Autor zahlreicher Artikel und Lehrbücher im Bereich der Halbleitertechnik. Gromov ist Experte in verschiedenen KI- und Digitalisierungsgremien, unter anderem von DIN und DKE sowie der Bundesregierung (DIT, BMBF). AITAD ist KI-Champion Baden-Württemberg 2023, einer der Top100-Innovatoren 2023 und Gewinner des embedded award 2023 in der Kategorie KI.

AITAD ist ein deutscher Anbieter von Embedded KI. Das Unternehmen beschäftigt sich mit der Entwicklung, Erprobung und Serienfertigung von KI-Elektroniksystemen, insbesondere in Verbindung mit maschinellem Lernen im industriellen Kontext (Systemkomponenten).

Als Entwicklungspartner übernimmt AITAD den gesamten Prozess von der Datenerfassung über die Entwicklung bis hin zur Lieferung der Systemkomponenten. Dies ermöglicht innovative Produktanpassungen, ohne dass Kompetenzen und Ressourcen auf Kundenseite benötigt werden. Der Fokus liegt dabei auf zukunftsweisenden, disruptiven, innovativen Anpassungen mit größtmöglicher Auswirkung auf Strukturen und Produktstrategien.

Die Spezialgebiete von AITAD sind Preventive/Predictive Maintenance, User Interaction und funktionale Innovationen. Dabei geht AITAD einen anderen Weg als viele Hersteller: Statt einer KI-Lösung von der Stange wird für jeden Kunden ein individuelles System entwickelt. Dazu prüft das Unternehmen im ersten Schritt, wie die Produkte des Kunden vom Einsatz von KI profitieren, zeigt die Vorteile und Möglichkeiten auf, entwickelt das System auf allen Ebenen, baut dank einer Prototyping-EMS-Strecke im eigenen Haus auf Basis der gesammelten Daten einen Prototyp des neuen Systems und steht bei der Serienfertigung und Systempflege stets zur Seite.

(ID:49949422)

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung