Sprachassistenten sind im Haushalt weit verbreitet. Aber lässt sich beispielsweise auch ein Industrieroboter per Sprache steuern? Dank Embedded KI können Sprachbefehle in Industrie und Medizin ohne Latenzzeiten ausgewertet und sicher übertragen werden.
Roboter in der Industrie: Dank Embedded KI lassen sich Sprachbefehle ohne Latenzzeiten auswerten und sicher übertragen.
In vielen Haushalten hat der Einsatz von Sprachassistenten den Alltag beeinflusst. Nach einem sogenannten Wake-Word, welches die Applikation aktiviert, übermittelt diese den Wunsch des Bedienenden an einen entfernten Server, der den Sprachbefehl analysiert und anschließend das Auswertungsergebnis an das Gerät zurücksendet. Etwas ähnliches finden sich auch in der Industrie und Medizintechnik, wo Keyword-Spotting (KWS) an Bedeutung zunimmt. Wird Sprache erfasst und ausgewertet, lassen sich schon heute Prozesse beschleunigen sowie effizienter gestalten und sogar Leben retten.
In der Industrie und Medizintechnik bietet Keyword-Spotting bereits heute Vorteile:
Effizienz: Durch die Automatisierung von Aufgaben können Prozesse beschleunigt und Kosten gesenkt werden.
Sicherheit: KWS kann beispielsweise Maschinen und Anlagen überwachen und so Unfälle verhindern.
Genauigkeit: KI-basierte Systeme können Sprache oft präziser erkennen und interpretieren als Menschen.
„Die Vorteile sind unübersehbar,“ sagt Viacheslav Gromov, Gründer und Geschäftsführer des KI-Anbieters AITAD. „Wenn Menschen die Maschine in der Produktion mit der Stimme steuern, dann bedeutet das mehr Flexibilität. Anlagen lassen sich aus der Ferne bedienen und niemand muss Knöpfe drücken oder auf dem Bildschirm der Maschine eine Eingabe eintippen. Es bedeutet auch, keine Keime und Bakterien, ein wichtiger Aspekt in der Medizin. Auch ein gerufener Befehl 'Stop' ist schneller als zur Maschine zu laufen und diese anzuhalten.“
Sprachsteuerungen mit Embedded-KI realisieren
„Sprachsteuerung bietet Unternehmen mehr Flexibilität“, sagt Viacheslav Gromov, Gründer und CEO der AITAD.
(Bild: AITAD)
Die Übertragung von Sprachsignalen zu entfernten Servern ist mit Latenzzeiten verbunden, die in sicherheitsrelevanten Umgebungen nicht akzeptabel sind. Auch das Manipulations- und Ausfallrisiko einer Netzwerkverbindung spielt eine Rolle. Der Einsatz in sicherheitskritischen Umgebungen in Industrie und Medizin erfordert Antworten, die lokal und in Echtzeit arbeiten.
Hier setzen Sprachsteuerungsmodelle an, die mit Embedded KI realisiert werden. Dabei werden nicht nur einzelne Schlüsselwörter erkannt, sondern bis zu 30 vordefinierte Begriffe, die komplexe Befehle ermöglichen. Ein Schlüsselwort aktiviert das System. Anschließend können komplexe Kombinationen dieser vordefinierten Wortgruppe gesprochen und von der KI ausgewertet werden, die zusammen mit den Mikrofonen auf der gleichen kleinen Platine sitzt („Embedded-KI-Systemkomponente“).
Sprachbefehle am Beispiel Roboter
„Roboter, starte Programm A auf Maschine 3“ „Roboter, Förderband 6 anhalten“ „Roboter, Motor 4 in Maschine 3, erhöhe die Drehzahl um 40 Prozent“ „Roboter, Rollstuhl, jetzt links abbiegen“ „Roboter, Not aus“
„Entscheidend ist hier ein maximales Sicherheitslevel, das durch die lokale Verarbeitung der Sprachdaten – ohne Cloud oder Server – gewährleistet wird. Sowie die Effizienz, da die Befehle in Echtzeit direkt im Chip ausgewertet werden und die Maschine dadurch schneller reagiert,“ erklärt Gromov weiter.
Frei konfigurierbar, echtzeitfähig und robust
Die Sprachdaten werden lokal und ohne Cloud oder Server verarbeitet. Ein Chip wertet die Befehle direkt aus.
(Bild: AITAD)
Unternehmen können ihre Sprachsteuerung individuell konfigurieren, angefangen von den Wakewords bis hin zur Wortgruppe. Dies ermöglicht maßgeschneiderte Systeme, die auch in mehreren Sprachen verfügbar sind. Bei Bedarf können synthetisch erzeugte Sicherheitsabfragen integriert werden. Die Einsatzmöglichkeiten sind vielfältig, von der Steuerung von Maschinen bis hin zur Notauslösung per Sprachbefehl. Die Einsatzmöglichkeiten sind vielfältig, von der Steuerung von Maschinen bis hin zur Notauslösung per Sprachbefehl.
Die Einsatzmöglichkeiten der Sprachsteuerung sind nahezu unbegrenzt:
Im Operationssaal kann der Chirurg das Hochfrequenzskalpell per Sprachbefehl starten, justieren und wieder abschalten.
Berührungsloses Steuern von Maschinen und Geräten in Produktion und Krankenhäusern.
Notaus per Sprachbefehl erspart im Ernstfall den Spurt zum Not-Aus-Schalter.
Menschen mit Assistenzbedarf können beispielsweise den Rollstuhl per Sprache steuern.
Sprachsteuerung in einer lauten Umgebung
Autarke Sprachsteuerung mit Embedded-KI arbeitet vollständig lokal und in Echtzeit. Sie lassen sich auch in rauen Industrie-Umgebungen einsetzen. Die KI wird nicht nur mit den zu erkennenden Worten, sondern auch mit Störgeräuschen trainiert, um eine zuverlässige Spracherkennung sicherzustellen. Selbst eine laute Umgebung ist kein Problem. Mit einem zusätzlichen Mikrofon lässt sich der Standort des Sprechers erkennen und störende Geräusche eliminieren (Beamforming).
„Diese neue, wegweisende Sprachsteuerung wird die Zukunft in Industrie und Medizin nachhaltig verändern und bestimmen“, ist sich Gromov sicher. „Die Anfragen aus Industrie und Medizin nehmen zu. Wir selbst haben eine Lösung entwickelt, mit der Unternehmen schon heute ihre Produkte mit dieser Technologie ausstatten und damit eine Vorreiterrolle in Wirtschaft und Business einnehmen können. Diese zeichnet sich durch eine hohe Robustheit auch gegen Störgeräusche aus und wird individuell auf die Kundenanforderungen zugeschnitten. Da wir auf eine Vorentwicklung zurückgreifen, können wir unsere lokale Sprachsteuerung mit ungefähr 30 zu erkennenden Wörtern kostengünstig anbieten“. (heh)
Viacheslav Gromov ist Gründer und CEO von AITAD. Das Unternehmen entwickelt elektronikbezogene künstliche Intelligenz (Embedded KI), die lokal und in Echtzeit definierte Aufgaben in Geräten und Maschinen übernimmt. Er ist Autor zahlreicher Artikel und Lehrbücher im Bereich der Halbleitertechnik. Gromov ist Experte in verschiedenen KI- und Digitalisierungsgremien, unter anderem von DIN und DKE sowie der Bundesregierung (DIT, BMBF). AITAD ist KI-Champion Baden-Württemberg 2023, einer der Top100-Innovatoren 2023 und Gewinner des embedded award 2023 in der Kategorie KI.
AITAD ist ein deutscher Anbieter von Embedded KI. Das Unternehmen beschäftigt sich mit der Entwicklung, Erprobung und Serienfertigung von KI-Elektroniksystemen, insbesondere in Verbindung mit maschinellem Lernen im industriellen Kontext (Systemkomponenten).
Als Entwicklungspartner übernimmt AITAD den gesamten Prozess von der Datenerfassung über die Entwicklung bis hin zur Lieferung der Systemkomponenten. Dies ermöglicht innovative Produktanpassungen, ohne dass Kompetenzen und Ressourcen auf Kundenseite benötigt werden. Der Fokus liegt dabei auf zukunftsweisenden, disruptiven, innovativen Anpassungen mit größtmöglicher Auswirkung auf Strukturen und Produktstrategien.
Die Spezialgebiete von AITAD sind Preventive/Predictive Maintenance, User Interaction und funktionale Innovationen. Dabei geht AITAD einen anderen Weg als viele Hersteller: Statt einer KI-Lösung von der Stange wird für jeden Kunden ein individuelles System entwickelt. Dazu prüft das Unternehmen im ersten Schritt, wie die Produkte des Kunden vom Einsatz von KI profitieren, zeigt die Vorteile und Möglichkeiten auf, entwickelt das System auf allen Ebenen, baut dank einer Prototyping-EMS-Strecke im eigenen Haus auf Basis der gesammelten Daten einen Prototyp des neuen Systems und steht bei der Serienfertigung und Systempflege stets zur Seite.
(ID:49949422)
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.