Wie funktioniert die Sprachsuche (voice search)?
Wie funktioniert also die Sprachsuche? Nun, es gibt vier Phasen der Spracherkennung, die alle Suchanfragen durchlaufen:
- Filterung der Geräusche (Trennung der Sprachabfrage vom Strom der anderen Geräusche)
- Digitalisieren (Umwandlung der Schallwellen in digitale Daten)
- Sprachanalyse (Verarbeitung der Daten)
- Mustererkennung (Vergleich der Suchanfrage mit den Mustern in der Datenbank).
Phasen der Spracherkennung
Es ist kein Geheimnis, dass eines der fortschrittlichsten ASR-Systeme zu Google gehört. Die KI, die hinter Googles Spracherkennung "Search by Voice" steht, sammelt Daten von Nutzern und sammelt Millionen von Beispielen, um ein Modell zu erstellen. Die Spracherkennungstechnologie - ursprünglich von IBM entwickelt - ermöglicht es Maschinen oder Programmen, laut gesprochene Wörter zu erkennen und in lesbaren Text umzuwandeln. Anschließend wird jede neue Sprachabfrage mit diesem Sprachmodell verglichen.
Dank Millionen verarbeiteter Beispiele kann das System Akzente, unterschiedliche Intonationen und viele andere individuelle Sprachdetails erkennen. Für eine primitive ASR ist es fast unmöglich, den Unterschied zwischen "Sie schreiben" und "Sie haben Recht" zu erkennen. Aber ein intelligentes System kann das richtige Wort aus dem Kontext heraus bestimmen. Heute kann die Spracherkennungsmaschine von Google Sprache mit einer Genauigkeit von bis zu 95 % in Text umwandeln.
Es werden mehrere Algorithmen und Berechnungstechniken eingesetzt, um Sprache zu erkennen, sie in Text umzuwandeln und die Transkriptionsgenauigkeit zu verbessern. Eine der am häufigsten verwendeten Methoden ist die natürliche Sprachverarbeitung (NLP).
NLP ist zwar kein Spracherkennungsalgorithmus, aber ein Bereich der künstlichen Intelligenz, der sich eingehend mit der Interaktion zwischen Mensch und Maschine durch Sprache und Text beschäftigt. Viele moderne Mobilgeräte enthalten eine Spracherkennung, um eine Sprachsuche durchzuführen oder mehr Zugänglichkeit in Bezug auf Texte zu bieten.