Egal, ob Amazon, Apple, Google oder Microsoft, jeder beansprucht den stark umkämpften Markt der Sprachassistenten für sich. Denn Sprache könnte die Touch-Technologie ablösen und die Benutzeroberfläche der Zukunft werden.
Homepod von Apple: Hallo Siri, spiel mir das Lied
(Bild: Apple)
Die jährlich steigenden Verkaufszahlen zeigen deutlich, dass die Sprachsteuerungstechnologie immer relevanter für uns, aber auch für andere Unternehmen wird. Da stellt sich schon die Frage, ob wir in Zukunft noch physikalische Eingabegeräte benötigen, um einen Computer oder andere elektronische Geräte zu bedienen und welche Herausforderungen die Sprachassistenztechnologie dafür überwinden muss.
Historie und Weiterentwicklung der Benutzeroberfläche
Bei genauerem Hinsehen zur Entwicklung von Benutzeroberflächen von Computern und Anwendungen lässt sich feststellen, dass die Bedienung technischer Geräte immer mehr an unsere menschliche Interaktion angepasst wird: Waren Computer in der Verwendung anfangs noch so abstrakt, dass sie ausschließlich von Experten bedient werden konnten, änderte sich dies durch die Einführung kompakter PC-Systeme und neuer Ein- und Ausgabegeräte. Die erste Computermaus machte 1968 die Nutzung der Desktop-Computer für ein wesentlich breiteres Publikum zugänglich.
Bildergalerie
Bei der Erfindung von Tablets mit integriertem Touchdisplay ist man schon einen erheblichen Schritt weiter gegangen: hier konnte man das Gerät sehr komfortabel per Gestensteuerung bedienen. Ist es da nicht eine logische Folge, dass Sprache als nächste Stufe auf der Leiter zu noch intuitiverer Benutzung und Steuerung von elektronischen Geräten und Anwendungen folgt? Das Ergebnis wäre eine Mischung aus Augmented Reality, Gesten und Sprachbefehlen, die uns helfen sollen, Geräte noch einfacher zu steuern.
Herausforderung 1: Sicherheitsbedenken
Einfach sprechen, statt die Eingabe in das Gerät per Touchscreen einzugeben – das ist für den Verbraucher weitaus intuitiver und meist schneller. Es bleibt jedoch ein Spagat, den Nutzer vollbringen müssen: Einerseits ist der Wunsch groß, dass der digitale Assistent eine echte Hilfestellung und Erleichterung für den Alltag bieten kann – und dafür muss er den Nutzer gut verstehen. Um dies zu gewährleisten, ist es jedoch nötig, dass der Nutzer Informationen über sich preisgibt, die der Sprachassistent mithilfe von künstlicher Intelligenz verarbeitet, um daraus lernen zu können.
Diese Informationen freizugeben, widerstrebt jedoch vielen Nutzern, da sie bei den Sprachassistenten erhebliche Sicherheitsbedenken haben. Dies hat eine im März 2019 durchgeführte Studie von OnePoll im Auftrag von reichelt elektronik bestätigt. Selbst unter denjenigen, die bereits einen Sprachassistenten verwenden, hat ein signifikanter Teil (40%) Sicherheitsbedenken – ganze 77% der 1000 Probanden sagen, dass sie speziell bei der Speicherung ihrer Daten Sorgen haben. Keines der aktuellen Modelle ist schon so weit ausgereift, dass es diese Bedenken beseitigen kann.
Alexa, Siri, Cortana – die bekanntesten und beliebtesten Sprachassistenten haben allesamt weibliche Stimmen und werden als weiblich wahrgenommen. In ihrer Rolle als stets geduldige, devote Helferinnen, die fraglos alle Befehle befolgen, bestärkt das veraltete Rollenbilder – so ein kürzlich erschienener Bericht der UNESCO. Als besonders prekär wird herausgehoben, dass die Sprachassistentinnen auf sexuelle Anspielungen oder Beschimpfungen meist nachsichtig oder sogar flirtend reagieren.
Hier wird deutlich, dass künstliche Intelligenz keineswegs neutral, sondern stark von den Daten beeinflusst ist, mit denen sie trainiert wird. So übertragen sich menschengemachte Vorurteile und Diskriminierung auf den digitalen Helfer. Die Hersteller stehen also vor der großen Herausforderung, bestehende Geschlechtervorurteile in ihren Systemen abzubauen, um für Gleichheit zu sorgen und für alle Nutzer – egal welchen Geschlechts – eine gute Nutzererfahrung zu bieten.
Amazon Echo Dot: Sprachassistenten sind beliebt, doch Informationen über sich selbst preiszugeben, widerstrebt vielen Nutzern.
Eine weitere Schwierigkeit, die noch nicht ausreichend zu Ende diskutiert wurde, ist die Nutzung einer sprachlichen Benutzeroberfläche in öffentlichen Räumen, wie Zügen oder Restaurants. Kritisch ist in einem solchen Szenario zum Beispiel, dass die Umstehenden die Spracheingabe mithören könnten. Dadurch würden persönliche Informationen nicht nur an den Adressaten, sondern an alle Personen im näheren Umfeld weitergeben.
Ein weiterer Punkt, der bei der Durchsetzung der Sprache als Eingabemodus eine Rolle spielt, ist der Aspekt der Lärmbelästigung. Wenn beispielsweise ein gesamtes Zugabteil lautstark mit seinem Sprachassistent sprechen würde, anstatt auf dem Smartphone oder Tablet zu tippen oder zu wischen, gäbe es einen immensen Anstieg des Lärmpegels.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Herausforderung 4: Spracherkennung
In den letzten Jahren hat sich die Sprachentwicklung um ein Vielfaches verbessert und die Hersteller arbeiten fieberhaft daran, die Technologie kontinuierlich voranzutreiben. Dennoch liegt die Erkennungsrate der Worte immer noch nicht bei 100%.
Reichelt-Umfrage: Wie sehen Verbraucher Sprachassistenten
(Bild: reichelt elektronik)
Schwierig wird es zusätzlich, wenn die Person versucht, mit dem Sprachassistenten in einem Dialekt zu sprechen. Dieser Eindruck wird von Verbrauchern bestätigt. Ganze 75% der Befragten geben an, nicht überzeugt zu sein, dass ihre Eingaben korrekt verstanden werden.
Sprachtechnologie, primär im Smart Home und Auto
Auch wenn die Nutzung von Sprachassistenten als Benutzeroberfläche prognostiziert wird, gilt es noch ein paar Hürden zu meistern, damit der Nutzer dies als wirkliche Bereicherung wahrnimmt. Nichts desto trotz werden die Sprachsysteme immer besser und erobern immer mehr Lebensbereiche.
Ein großer Vorteil gegenüber dem Tippen ist, dass die Hände dabei frei sind. Das ist auch der Grund, warum Spracheingabe bisher vor allem im Smart Home eingesetzt wird. Ein weiterer Bereich, der gerade erobert wird, ist das Auto. Hier liegt der Vorteil klar auf der Hand: Der Fahrer kann sich die Nachrichten vorlesen lassen und den Assistenten mit weiteren sprachlichen Anleitungen bedienen – die Hände bleiben dabei am Lenkrad.
Daraus kann geschlossen werden, dass Sprachassistenten sich momentan überall dort durchsetzen, wo wir meist mit vorranging anderen Dingen beschäftigt sind oder beide Hände für eine bestimmte Tätigkeit benötigen. Die Bedienung von Technik wird so beinahe zur Nebensache. Dass sie das Smartphone in naher Zukunft komplett ablösen, ist nicht zu erwarten, doch sie haben das Potential, unseren Umgang mit Technologie grundlegend zu verändern.