Skip to main content

Sprachassistent: Wie funktioniert Alexa?

Sprachassistenten erleichtern uns im Smart Home den Alltag. Doch es gibt immer noch viele Vorbehalte gegen Alexa, Siri und Co. Wir klären auf.

Alex, Siri und Co. machen das Leben leichter. Die digitalen "Helferlein" automatisieren viele Aufgaben und Abläufe im Alltag. So lässt sich der Alltag im Smart Home mithilfe von smarten Sprachassistenten komfortabel steuern – und Lichtschalter, Fernbedienung und Schlüssel gehören der Vergangenheit an.

 

"Alexa, wie warm ist es draußen?" Ob Temperatur, spezifische Tiergeräusche, ja sogar den Sinn des Lebens – der digitale Sprachassistent von Amazon hat auf fast alles eine Antwort. Längst sind die smarten Boxen Teil unseres Alltags. Doch noch immer gibt es viele Fragezeichen: Wie funktionieren Alexa, Siri und Co.? Wie sicher sind meine Daten? Und wo landen eigentlich die Sprachaufzeichnungen?

Komfort und Unterhaltung auf Zuruf

Es ist erstaunlich, was Künstliche Intelligenz heute alles möglich macht. Auch im Wohnalltag, dank smart vernetzter Haustechnik. Das Haus hört aufs Wort, öffnet auf Wunsch Türen, dreht die Heizung hoch und dimmt das Licht. Mit Sprachsteuerung zieht mehr Komfort und Wohlbefinden in die Wohnung ein.

Ein digitaler Sprachassistent verrät, wie das Wetter wird. Er spielt Musik via Spotify oder Radiosender ab und hilft bei der Erstellung von Einkaufslisten.

"Sprachassistenten sind in den vergangenen Jahren zu einer echten Hilfe geworden und beherrschen mittlerweile tausende Kommandos. In den kommenden Jahren wird sich dieser Trend noch schneller fortsetzen. Die Programme werden zunehmend mit ihrer Umwelt verschmelzen", ist Dr. Sebastian Klöß, Bereichsleiter für Consumer Technology beim Bitkom, überzeugt.

Schon heute lassen sich auf Zuruf Licht, Steckdosen oder Heizung steuern. "Zudem werden Sprachassistenten längst nicht mehr nur in Smartphones, sondern zunehmend auch in Fernsehern oder vernetzten Lautsprechern genutzt", erläutert der Digitalexperte. "Je mehr Befehle die Programme erhalten, desto klüger wird die künstliche Intelligenz – und kann künftig noch besser auf die Nutzerinnen und Nutzer reagieren."

So verbreitet sind digitale Sprachassistenten:

Sprachassistenten lassen sich über unterschiedliche Endgeräte verwenden. Für Sprachbefehle wird vor allem das Smartphone eingesetzt. Der Digitalverband Bitkom wollte im Rahmen einer Befragung wissen: Welche Geräte werden am häufigsten genutzt, um per Sprachbefehl Informationen abzufragen und Geräte zu steuern?

Ein Großteil der Nutzer, nämlich 66 Prozent, nutzt das Smartphone, gefolgt vom Tablet (41 Prozent). 26 Prozent der Befragten setzen auf Smart Speaker. Laut der Bitkom-Befragung von November 2020 kommen digitale Sprachassistenten bei 56 Prozent der Befragten täglich zum Einsatz. Ein weiteres knappes Drittel (32 Prozent) verwendet den Sprachassistenten mehrmals pro Woche.

Am häufigsten werden Sprachassistenten genutzt, um Musik abzuspielen oder Radio zu hören (79 Prozent), dies trifft umso mehr auf jüngere User zu (91 Prozent der 16- bis 29-Jährigen). Knapp drei Viertel (74 Prozent) nutzen sprachgesteuerte Systeme, um Geräte im Haushalt steuern. Mit deutlichem Abstand folgt der Zugriff auf diverse Informationen. So werden Sprachassistenten beispielsweise genutzt, um etwa Abfahrtszeiten öffentlicher Verkehrsmittel, Sportergebnisse, Kochrezepte oder die Wettervorhersage abzurufen. Foto: fizkes/stock.adobe.com

Digitale Sprachassistenten haben sich also zum nützlichen Alltagshelfer und zur Bedienzentrale im Smart Home entwickelt. Aber was genau verbirgt sich eigentlich hinter der Technik?

Was ist ein digitaler Sprachassistent?

Ein Sprachassistent ist ein Programm, das auf künstlicher Intelligenz basiert und mit gesprochenen Anweisungen bedient wird. Es handelt sich also um eine Software, die gesprochene Worte der Nutzer analysiert, diese in einen Zusammenhang setzt und darauf reagiert.

Die Software ist entweder in ein Smartphone oder einen Smart Speaker integriert. Eine relativ neue Gerätekategorie im Bereich der Sprachassistenten sind sogenannte Smart Displays, eine Kombination aus Tablet und Lautsprecher. Sie stehen in der Regel an einem bestimmten Ort in der Wohnung und fungieren von dort aus als Steuerzentrale für das Smart Home.

Im Gegensatz zu smarten Lautsprecherboxen können Smart Displays per Sprachbefehl gesuchte Informationen in Text- und Bildform anzeigen. Besonders praktisch ist das in der Küche, wenn nach einem Befehl wie "Ich möchte ein Dinkelbrot backen" auf dem Bildschirm das entsprechende Rezept erscheint – und wenn die Hände gerade mit Teig verklebt sind, kann mit der Stimme der Timer am Backofen gestellt werden.

Im Smart-Home-Bereich kommuniziert die KI über eine Box, einen intelligenten Lautsprecher, mit dem Nutzer. Die sprachgesteuerten Smart Speaker mit Freisprechanlage sind auf die Stimme der Nutzer zugeschnitten.

Spricht man die Software mithilfe eines Aktivierungsbefehls an, beantwortet das Endgerät Fragen verbal oder führt Befehle aus, wie etwa die Steuerung vernetzter Geräte des Smart-Home-Systems. Je nach Hersteller signalisiert ein Leuchtring, ob das Gerät gerade aktiv ist.

Weil der eigentliche Sprachassistent reine Software ist, kann er auf unterschiedlichen Geräten genutzt werden. Und so lassen sich via Smartphone, Tablet, Smart Speaker oder Smart Display fast alle elektrischen Geräte in einem modernen vernetzten Smart Home verbal steuern. Dabei können verschiedene Geräte ins System integriert werden – vom Backofen über den Kühlschrank bis hin zum smarten Rasenmäher.

Wie funktionieren Sprachassistenten?

Digitale Sprachassistenten bestehen also aus einer Software, die wiederum in eine Hardware, bestehend aus Mikrofon und Lautsprecher, integriert ist. Wahrgenommene Geräusche werden von der Software in Frequenzen und Spektrogramme zerlegt, in denen die Assistenten ihr Aktivierungswort erkennen – also zum Beispiel "Hey Siri" oder "Alexa".

Danach werden die Audiosignale in die Cloud gesendet, wo die gesprochene Sprache in Text übersetzt wird. Die Erkennung von dessen Inhalt erfolgt laut Bitkom mithilfe von Natural-Language-Understanding-Systemen (NLU). Daran schließt sich die Rückübertragung des Texts in Sprache an, die dann als digitales Signal zurück an das Gerät beim Nutzer geschickt wird. Alternativ wird die Übersetzung in einen Befehl umgewandelt, der an ein weiteres smartes Gerät weitergegeben wird.

Um Alexa und Co. nutzen zu können, muss man übrigens kein Technik-Nerd sein. Digitale Sprachassistenten lassen sich einfach installieren und sind unkompliziert zu bedienen.

Was können Alexa, Siri und Co.?

Das Smart Home entwickelt sich zunehmend zu einem wichtigen Einsatzbereich von Sprachassistenten, wie eine Bitkom-Studie aus dem Jahr 2020 belegt. So gaben 52 Prozent aller Nutzer von Smart-Home-Anwendungen an, diese per Sprachbefehl zu steuern. Damit ist die Sprache nach dem Wischen und Tippen in einer Smartphone-App die zweitbeliebteste und verbreitetste Methode, sein Smart Home zu steuern. Diese Popularität von Sprachassistenten im Smart Home hat dazu geführt, dass es mittlerweile sogar Kinderspielküchen mit Alexa gibt.

"Die Sprachassistenten werden in den kommenden Jahren weiter an Popularität gewinnen, weil es sowohl bei der Spracherkennung als auch bei der Assistenzfunktion kontinuierlich Fortschritte geben wird", ist man beim Digitalverband Bitkom überzeugt. Schon heute werden Sprachbefehle sehr zuverlässig erkannt und selbst komplexe Anweisungen, die ganz natürlich gesprochen werden, verstanden.

"Alexa, chönntsch bitte z'Liecht amache!"

Die Zuverlässigkeit der Technologie wird sich weiter verbessern, sodass sogar starke Dialekte kein Problem mehr sind. So gibt es laut Bitkom zurzeit beim Schweizerdeutschen in der Erkennungsquote der Sprachassistenten noch Verbesserungsbedarf.

Welche Sprachassistenten gibt es?

Die bekanntesten Sprachassistenten im Überblick:

Die wichtigsten Sprachassistenten (Software/Hardware) und ihre Anbieter:

AnbieterName
GoogleGoogle Assistant  / Google Home
AmazonAlexa / Echo
AppleSiri / Apple HomePod
MicrosoftCortana
SamsungBixby
TelekomHallo Magenta
HuaweiHiVoice

Alexa Sprachassistent: Vielseitige Allrounderin

Die bekannteste "Sprachassistentin" ist Amazons Alexa. Seit 2016 erleichtert die KI auch deutschen Haushalten den Alltag. Alexa ist lediglich die Software, die wiederum in einen Smart Speaker integriert ist. Alexa ist also quasi das "Hirn" des intelligenten sprachgesteuerten Lautsprechers mit Freisprechanlage, dem Amazon Echo.

Über den Zuruf "Alexa!" wird die Software aktiviert. Sie beantwortet Fragen, spielt aber auf Wunsch auch Musik ab, stellt den Wecker, liest Nachrichten oder Sportergebnisse vor und ruft Termine ab. Außerdem lassen sich mithilfe von Alexa Licht und Lampen im Smart Home steuern – und das alles via Sprachbefehl, also ohne Schalter oder Bedienung.

Neben dem Klassiker, dem Amazon Echo, gibt es heute eine ganze Reihe von Hardware für Amazon-Sprachassistenten sowie Erweiterungsmodule. Hier eine Auswahl:

  • Echo: Original Version des Amazon-Sprachassistenten, mittlerweile auch in einem Kugeldesign erhältlich
  • Echo Dot: flachere Version des Amazon Echo mit einem kleineren Lautsprecher, inzwischen auch mit einer Uhranzeige verfügbar
  • Echo Plus: inklusive Temperatursensor und Smart-Home-Integration, größerer Lautsprecher als in der Standard-Version
  • Echo Show: mit einem rechteckigen Display zur Wiedergabe von Videos ausgestattet und integrierte Kamera für Video-Calls
  • Echo Spot: rundes Display in einem kugelförmigen Gehäuse
  • Echo Auto: Variante für Autos, die an das Infotainmentsystem angeschlossen werden kann
  • Echo Studio: sound-optimierter Lautsprecher
  • Echo Sub: separater Subwoofer, der mit einem vorhandenen Echo-Gerät verbunden wird
  • Echo Flex: wird direkt in eine Steckdose gesteckt, geringere Klangqualität
Entwicklung des Amazon Sprachassistenten:

Der Amazon Echo ist der Klassiker unter den Alexa Sprachassistenten.

Amazon Echo Dot (4. Generation) ist einer der beliebtesten smarten Lautsprecher von Amazon.

Heute ist der Amazon Echo Dot in unterschiedlichen Varianten erhältlich, u.a. mit Uhr-Anzeige.

Der Echo Show 8 punktet u.a. mit einem 8-Zoll-HD-Display und einer 13-Megapixel-Kamera.

Im Mai 2021 stellte Amazon das jüngste Update seiner Echo-Show-Modelle vor – die am schnellsten wachsende Kategorie innerhalb der Echo-Familie. So verfügt Echo Show 8 u.a. über eine leistungsstarke 13-Megapixel-Weitwinkelkamera, die während Videoanrufen digital schwenkt und zoomt, sowie Stereolautsprecher. Kostenpunkt: 129,99 Euro.

Außerdem wurde die HD-Kamera des Echo Show 5, der in drei Farben für 84,99 Euro erhältlich ist, überarbeitet. Mithilfe der integrierten Kameras können sich Hausbesitzer aus der Ferne im Zuhause umsehen. Zudem können kompatible Smart-Home-Geräte wie Lampen oder Thermostate über das Display oder per Sprache gesteuert werden.

Tipp: Nachfragen

Mancher Nutzer kennt das: Man unterhält sich mit Familie oder Freunden, plötzlich meldet sich Alexa zu Wort. Fragen Sie nach: Sagen Sie "Alexa, was hast du gehört?" und der Sprachassistent liest Ihnen Ihre letzte Anfrage vor. Sie können auch fragen: "Alexa, warum hast du das getan?" und der digitale Sprachassistent gibt eine kurze Erklärung zur Antwort auf die zuletzt gestellte Anfrage.

Apple Sprachassistent: Optimaler Sound

Nicht nur Amazon hat mit Alexa einen eigenen Sprachassistenten am Start. Siri kennen die meisten von ihrem iPhone. Apple lancierte 2018 den HomePod, dessen kleinere Version, der HomePod mini, künftig ausschließlich erhältlich sein soll. Der kompakte intelligente Lautsprecher mit einer Höhe von 8,4 Zentimetern kann mit der Apple-Sprachsteuerung Siri, Apple Music sowie HomeKit-kompatiblen Geräten verbunden werden und ermöglicht damit auch eine Smart-Home-Steuerung. 

Dabei legt der kalifornische Tech-Gigant den Fokus auf eine herausragende Soundqualität. Der HomePod mini bietet ein sattes und detailgetreues akustisches Erlebnis und ist damit auch ideal fürs Home Entertainment geeignet. So verspricht Apple ein "großartiges Musik-Hörerlebnis" – unabhängig davon, wo der smart Speaker steht. 

Ein Ring aus drei Mikrofonen hört auf den Sprachbefehl "Hey Siri" und ein viertes, nach innen gerichtetes Mikrofon hilft dabei, den vom Lautsprecher kommenden Schall zu isolieren, um die Stimmerkennung bei gleichzeitiger Musikwiedergabe zu verbessern.

Ins Smart-Home-System integriert, wird der HomePod mini zur Steuerzentrale. Damit haben die Bewohner Zugriff auf Smart-Home-Zubehör, ob von zu Hause oder von unterwegs aus. Ein Sprachbefehl an Siri genügt, um beispielsweise das Licht auszuschalten, einen Staubsauger-Roboter zu steuern, die Temperatur zu ändern und die Haustür zu verriegeln.

Telekom Sprachassistent: Schnelle TV-Bedienung

Auch die Telekom hat mit Hallo Magenta! einen eigenen Sprachassistenten lanciert. Damit lassen sich Telekom-Dienste wie Magenta SmartHome einfach durch die Stimme der Hausbewohner steuern.

Ist es im Wohnzimmer zu kalt? Oder in der Küche zu dunkel? Über den Smart Speaker, der mit dem Magenta SmartHome vernetzt wird, können gezielt einzelne Lampen oder Heizungen reguliert werden – und das per Sprach­steuerung. Programmierte Szenen sorgen für die passende Stimmung und lassen sich ebenfalls auf Zuruf aktivieren: "Hallo Magenta, aktiviere die Szene Kinoabend!"

Das Streaming-Angebot MagentaTV kann ebenfalls via Hallo Magenta! gesteuert werden – damit wird die eigene Stimme zur Fernbedienung. Auch das Tippen auf der Fernbedienung bei der Suche nach der Lieblingsserie im TV wird überflüssig. Filme und Serien können auf Zuruf gesucht werden. Und die Senderauswahl oder die Lautstärke lassen sich per Sprachbefehl ebenfalls über den Telekom Sprachassistenten regeln.

Selbst beim Telefonieren bleiben die Hände frei: Ohne zusätzliches Gerät telefonieren die Nutzer per Sprachwahl über ihren Festnetzanschluss. Im Telekom-Smart-Speaker ist außerdem Alexa integriert, die Software von Amazon beantwortet also auch Fragen.

Google Sprachassistent: Smarter Alltagsbegleiter

Seit Herbst 2017 bietet IT-Riese Google einen eigenen Sprachassistenten auf dem deutschen Markt an. Drittanbieter können den Google Assistant in ihre Produkte integrieren, damit lässt sich auch dieser Sprachassistent mit unterschiedliche Smart-Home-Geräten verschiedener Hersteller synchronisieren. Über den Smart Speaker können somit wie bei den anderen Sprachassistenten auch kompatible Smart-Home-Geräte wie Thermostate oder Jalousien bedient werden.

Wie andere Sprachassistenten wird auch die Sprachsoftware des Google Assistant in verschiedene Google-Geräte wie Lautsprecher (Google Home), Displays (Google Nest Hub) oder Smartphones integriert.

Der Google Sprachassistent wird mit dem Zuruf "Hey Google" aktiviert. Auch dieser digitale Alltagshelfer liefert Antworten auf Fragen zu Themen wie Wetter, Sport, Finanzen, Umrechnungen und  Übersetzungen. Wenn der User die Erlaubnis erteilt, liefert der Google Assistant auch Informationen zum persönlichen Tagesablauf, etwa zu Flugzeiten oder dem Verkehrsaufkommen auf dem Weg zur Arbeit. 

Mit unseren Sprachbefehlen hinterlassen wir natürlich digitale Fußspuren. Ein vernetztes Smart Home generiert jede Menge persönliche Daten, die ein ziemlich genaues Bild unseres Privatlebens ergeben – erst recht, wenn es sich um O-Töne handelt, um Gespräche, wie sie Sprachassistenten wie Google Home oder Alexa aufzeichnen.

Datensicherheit: Hört Alexa immer mit?

Viele Menschen glauben nach wie vor, dass sie von Sprachassistenten wie dem Google Assistant oder Alexa "abgehört" werden. Wie sieht es tatsächlich mit der Datensicherheit aus? Was wird alles aufgenommen? Und was passiert mit den aufgezeichneten Daten? Wie und wann sollte man die Sprachsteuerung in den eigenen vier Wänden deaktivieren? 

Transparenter Datenschutz

In der Regel bieten Sprachassistenten eine hohe Datensicherheit. Die sichere Verarbeitung von Kundendaten in der EU gewinnt immer stärker an Bedeutung. So bietet beispielsweise der Telekom-Sprachassistent höchste Datensicherheit, wie der Konzern versichert. Die Verarbeitung der Daten bzw. deren Speicherung erfolge ausschließlich auf Servern innerhalb der Europäischen Union und folge damit den hohen europäischen Sicherheitsstandards.

Das heißt konkret: Bis zum Aktivierungswort "Hallo Magenta" ist der Smart Speaker nicht aktiv. Für zusätzliche Privatsphäre lassen sich die Mikrofone im Gerät per Knopfdruck abschalten. Der gesamte Verlauf der persönlichen Sprachbefehle in der Hallo-Magenta-App kann eingesehen und jederzeit unwiderruflich gelöscht werden. Es bleibt keine Kopie erhalten.

Auch Alexa und die Echo-Geräte wurden von Amazon nach eigenen Angaben "mit Datenschutzmaßnahmen auf mehreren Ebenen entwickelt". Möchte man zu Alexa sprechen, muss das Gerät zuerst aufgeweckt werden. Dies geschieht über den Aktivierungsbefehl: "Alexa!" Erst dann beginnt das Gerät, die entsprechende Anfrage an die Amazon-Cloud zu senden. 

Wie kann ich erkennen, dass mein Sprachassistent gerade etwas aufzeichnet? Wenn Alexa eine Anfrage aufzeichnet und an die Cloud weiterleitet, weisen ein blaues Licht am Echo-Gerät oder ein Signalton darauf hin.

Alle Interaktionen mit Alexa werden während der Übertragung in die Cloud von Amazon verschlüsselt und dort sicher gespeichert, so das Versprechen des Konzerns. Das Mikrofon und die Kamera der smarten Echo-Lautsprecher lassen sich ausschalten.

Die persönlichen Sprachaufzeichnungen sind jederzeit in den Alexa-Datenschutzeinstellungen oder in der Alexa App einsehbar. Außerdem können die gespeicherten Daten hier gelöscht oder die Speicheroption für Sprachaufnahmen deaktiviert werden. Um eine Aufzeichnung per Sprachbefehl zu löschen, sagen Sie "Alexa, lösche, was ich gerade gesagt habe!" oder "Alexa, lösche alles, was ich heute gesagt habe!", um die Aufnahmen des Tages zu löschen.

Auch Apple legt großen Wert auf die Berücksichtigung von Datenschutz und Sicherheit. Bei der Nutzung des Sprachassistenten HomePod mini werden Informationen ausschließlich dann an Apple-Server gesendet, wenn der Sprachbefehl "Hey Siri" lokal auf dem Gerät erkannt wird oder der Nutzer Siri durch Berührung aktiviert. Anfragen werden nicht mit der Apple-ID des Nutzers verknüpft und persönliche Informationen nicht an Werbeunternehmen oder andere Organisationen verkauft, betont der Konzern.

Tipp: Wohnraum sicher vernetzen

Wer auf Nummer sicher gehen möchte, kann sich zum Beispiel die Tipps zur Datensicherheit im Smart Home des Bundesamt für Sicherheit in der Informationstechnik (BSI) genau durchlesen.

Sprachassistenten 4.0: Was bringt die Zukunft?

Generell werden sich Online-Angebote immer mehr in Richtung Voice First weiterentwickeln. Die eigene Sprache ist dann der selbstverständliche Zugang zu diesen Services. So lassen sich etwa Kinotickets, ein Mietwagen oder Essen per Sprache ordern. Diese Inhalte und Funktionen sind dann natürlich auch via Sprachassistenten zugänglich

"Darüber hinaus werden die Sprachassistenten noch stärker zum Hirn des Smart Home und seiner Roboter werden", ist man beim Branchenverband Bitkom überzeugt.

Diese Themen könnten Sie ebenfalls interessieren:

Hier geht's zurück zur Startseite.

News Heizung & Haustechnik

Worauf es bei der smarten Haustechnik in den eigenen vier Wänden ankommt.

Container mit Produkten von Grünbeck

Bei einer Roadshow von Grünbeck können sich Interessierte über die neuesten Produkte der…

Umweltfreundliche Wärmepumpe

Umweltfreundliche Heizungen werden mit attraktiven Zuschüssen gefördert.