Lernendes Sprachassistenzsystem
Ref-Nr: TA-201946VER
Kurzfassung
Das hier angebotene Verfahren zur sprachbasierten Unterstützung, erhöht die Erkennungsrate bezüglich des Ansprechverhaltens von Sprachassistenzsystemen. Durch eine Adaptionseinrichtung ist das System in der Lage, Informationen die vorab abgespeicherten und die extrahierten eines individuellen Bedieners, so zu verarbeiten und anzupassen, dass das Sprachmodul auch die neuen Informationen im Anschluss verarbeiten kann.
Hintergrund
Mithilfe von Sprachassistenzsystem sind die Sprachtranskription, Sprachübersetzung und Sprachsteuerung von Endverbrauchergeräten wie Smartphone, Fernseher, Navigationssystem und Spielkonsolen medienerfreundlicher und einfacher zu handhaben. Beim jetzigen Stand der Technik existieren hierbei aber zwei Problemfelder. Erstens sind natürliche Sprachen fehlerbehaftet und weisen großen Interpretationsspielraum auf und zweitens muss ein Sprachassistenzsystem von sich aus feststellen, ob eine gesprochenen Sprachakustik an das Sprachassistenzsystem gestellt ist oder nicht. Sprachassistenzsysteme können nicht feststellen, ob ein gesprochenes Kommandowort im Kontext der gesamten Sprachakustik dazu dient, das Sprachassistenzsystem zu bedienen oder ob es z.B. im Kontext Teil einer Konversation zwischen zwei Personen ist.
Bilder & Videos
Lösung
Das hier angebotene Verfahren zur sprachbasierten Unterstützung, erhöht die Erkennungsrate bezüglich des Ansprechverhaltens von Sprachassistenzsystemen. Nach der Aufnahme auditiv wahrnehmbare Schallsignale, durch bspw. einen Schallsensor (Mikrofon), werden diese in ein digitales Signal umwandelt. Die Erkennungseinrichtung, versteht mittels einer Recheneinheit die auditiven Schallsignale einer Sprachakustik und extrahiert die sprachbasierten Informationen heraus. Sie ist nicht nur in der Lage sprachliche Inhalte zu erkennen, sondern kann auch prosodische Eigenschaften der Sprachakustik herauszufiltern, wie z.B. Akzente, Tonsprache, Intonation, Tempo, Rhythmus oder Pausen. Diese Informationen werden in der Aktivierungseinheit mittels Sprachmodell erkannt und es wird entschieden, ob durch die sprachinhaltliche und sprachprosodische Information der Akustik eine Aktivierungsabsicht besteht oder nicht. Neu bei diesem Sprachassistenzsystem ist nun, dass ein in einem digitalem Datenspeicher vorab hinterlegtes Modell der Sprachakustik mittels einer an das System gerichtete Sprachakustik extrahierten Information verbessert werden kann, wenn das bisherige Modell für die Erkennung nicht sensitiv genug war (Lerneffekt). Durch diese Adaptionseinrichtung ist das System in der Lage, beide Informationen, die vorab abgespeicherten und die extrahierten eines individuellen Bedieners, so zu verarbeiten und anzupassen, dass das Sprachmodul auch die neuen Informationen im Anschluss verarbeiten kann.
Vorteile
• Spezifisch personalisierte sprachbasierte Unterstützung • Explizite Benutzerinteraktion, auch bei mehreren Personen gleichzeitig • Benutzerfreundlich • sogar für Nicht-Muttersprachler geeignet • Erkennung sprachlicher prosodische Eigenschaften • Minimale Fehlerhaftigkeit • kurze Bearbeitungszeit
Anwendungsbereiche
• Informations- und Kommunikationstechnik • Sprachassistenz • Mobile Dialogsysteme • Kognitive Systeme • Smart Speaker • Machine Learning/ KI • Hausautomation
Anbieter

Otto-von-Guericke-Universität Magdeburg
Christoph Mendel
0391 67-57380
christoph.mendel@ovgu.de
www.ovgu.de
Adresse
Universitätsplatz 2
39106 Magdeburg
Entwicklungsstand
Idee
Patentsituation
- DE DE 10 2020 119 980 B3 erteilt
- PCT PCT/EP2021/068566 anhängig
Stichworte
Signal- und Sprachverarbeitung, SprachassistenzsystemAngebot Anbieter-Website