Geräte bedienen ohne Lernaufwand: Laut Anbieter NXP ermöglicht die jetzt vorgestellte VIT „Speech-to-Intent“-Engine smarte Interaktionen mit Edge-Geräten durch natürliches Sprachverstehen. Der Clou: Ein (leistungsstarker) Mikrocontroller reicht für den Betrieb, ressourcenfressende Cloud-Verbindungen sind nicht nötig.
Im Smart Home können Nutzer und Nutzerinnen dank VIT „Speech-to-Intent“ smarte Geräte per Sprache bedienen, ohne sich Befehle merken zu müssen.
(Bild: NXP)
Seit Amazons Alexa hat sich die Bedienung von elektronischen Geräten mittels der menschlichen Stimme immer weiter etabliert. Tatsächlich gehört die Sprachsteuerung in Umgebungen wie Smart Homes, Smart Factories und Smart Cities mittlerweile zu den wichtigsten Benutzerschnittstellen. Das Problem: Edge-Geräte, die nur wenig Rechenressourcen zur Verfügung haben, „verstehen“ nur bestimmte Befehle. Ein halbwegs natürlicher Umgang damit ist per natürlich gesprochener Sprache kaum möglich. Oder die Edge-Devices müssen über das Internet auf leistungsstarke Server in Rechenzentren zugreifen – was sowohl bezüglich des Ressourcenverbrauchs (Strom, Bandbreite) als auch der Privatsphäre bedenklich ist.
Mit seiner nun vorgestellten Voice-Intelligent-Technology-(VIT-)„Speech-to-Intent“-Engine will NXP Semiconductors (NXP) das beste beider Welten zusammenbringen: Natürliche Sprachbedienung und Sparsamkeit. Die Lösung erlaubt es laut Hersteller, auf natürliche Weise mit Maschinen zum Beispiel in IoT-, Industrie- und Automobilanwendungen zu sprechen, ohne sich Befehle oder ganze Satzbausteine zur Bedienung der Geräte merken zu müssen.
Bislang ist man davon noch weit entfernt: Viele smarte Geräte erfordern bei der Spracheingabe präzise Formulierungen oder Cloud-Verbindungen, um die gewünschte Aktion auszuführen. VIT „Speech-to-Intent“, das Teil der VIT-Software-Suite von NXP ist, will das ändern: Durch das „natürliche Sprachverständnis“ der Lösung sollen smarte Geräte die Absichten der Nutzer und Nutzerinnen erkennen können.
Schlanke, auf Mikrocontrollern lauffähige Lösung
Laut Hersteller eröffnet das Raum für Innovationen, insbesondere im Smart Home und in Situationen, in denen Anwender möglicherweise die Hände nicht frei haben, etwa in Krankenhäusern oder Fabrikhallen. NXP will so das Entwickeln von sprachgesteuerten Geräten mit Software, die für seine MCUs und MPUs optimiert ist, erleichtern – vom fortschrittlichen KI-gesteuerten Gerät bis zum kontextabhängigen Sprachbefehl mit VIT „Speech-to-Intent“. Mögliche Anwendungen für eine derartige natürliche Sprachschnittstellen sind unter anderem Smart Watches, Haushaltsgeräte, HLK-Systeme und Beleuchtung.
Die VIT „Speech-to-Intent“-Engine benötigt laut NXP nur wenig Speicherplatz und Rechenleistung. Sie ist kompatibel mit NXP-Bausteinen wie i.MX RT Crossover-MCUs und RW61x-MCUs sowie den Anwendungsprozessoren i.MX 8M Mini, i.MX 8M Plus und i.MX 9x. Bislang unterstützt VIT „Speech-to-Intent“ Interaktionen in englischer Sprache, im Laufe des Jahres wird NXP auch Mandarin hinzufügen. Weitere Unterstützung für Spanisch, Deutsch, Koreanisch, Französisch und Japanisch ist für 2024 geplant.
Cloud-Leistung ohne Cloud-Anbindung
Nach eigenen Angaben hat NXP die VIT-Engine so konzipiert, dass sie mit der Leistung Cloud-basierter Systeme konkurrieren kann, ohne jedoch auf eine Cloud-Verbindung angewiesen zu sein. Das hätte mehrere Vorteile: Neben der deutlich besseren Energieeffizienz wäre es ein Gewinn für den Schutz der Privatsphäre der Nutzer. Auch kürzere Latenzzeiten ließen sich durch die lokale Ausführung der Engine realisieren.
„Wir sind längst auf dem Weg zu intelligenten Geräten, die unsere Bedürfnisse immer besser antizipieren und automatisch erfüllen können. Das gilt insbesondere für das Smart Home. Hier hat sich die Sprache als eine der beliebtesten Methoden erwiesen, um den Geräten unsere Anliegen mitzuteilen“, sagt Rafael Sotomayor, Executive Vice President und General Manager Secure Connected Edge bei NXP. „Mit VIT ‚Speech-to-Intent‘ können Menschen mit intelligenten Geräten interagieren und sind dabei nicht auf bestimmte Schlüsselwörter angewiesen. Das ist bequemer, nutzerfreundlicher und einfacher und ermöglicht den Übergang von einem intelligenten zu einem autonomen Zuhause.“
Intelligente Sprachtechnologie-Suite
VIT „Speech-to-Intent“ ist Teil der Voice Intelligent Technology (VIT) Software-Suite, einem umfassenden Softwarepaket für lokale Sprachsteuerung von NXP. VIT basiert auf Deep-Learning-Algorithmen und umfasst eine ständig aktive Wake-Word-Engine, eine Voice-Command-Engine und eben die „Speech-to-Intent“-Engine. Entwickler sollen mit dem kostenlosen Wake-Word- und Voice-Command-Engines von NXP sofort loslegen können. Beide sind über das MCUXpresso SDK verfügbar und werden von einem Online-Tool zur Modellerstellung unterstützt. Darüber hinaus ist ein Upgrade auf die „Speech-to-Intent“-Engine möglich. (me)
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.