Skip to main content

Verfahren und Vorrichtung zum maschinellen Verarbeiten von Texten


Kurzfassung

Verfahren zum maschinellen Verarbeiten von Texten, das iterativ aus ganzen Sätzen oder Satzfragmenten dessen Bausteine erlernt.


Hintergrund

Das menschliche Gehirn ist in der Lage, Sprache zu erlernen. Es kann als Netzwerk betrachtet werden, das aus einzelnen Neuronen besteht, die über synaptische bzw. Spaltverbindungen miteinander verbunden sind. Somit muss die Fähigkeit, Sprache zu erzeugen, innerhalb dieses Netzwerks verteilt realisiert werden. Einzelne Sätze müssen also in Bausteine zerlegt werden. Diese Bausteine müssen bei der Spracherzeugung wieder zu einem Satz zusammengefügt werden. Hierzu wurde ein verteiltes Verfahren zum maschinellen Verarbeiten von Texten erstellt, das iterativ aus ganzen Sätzen oder Satzfragmenten diese Bausteine erlernt.


Problemstellung

Das vorgestellte Verfahren stellt eine mögliche Lösung dar, wie diese Bausteine aussehen können, so dass verteilt gespeicherte Sätze wieder zu sinnvollen Sätzen zusammengesetzt werden. Zur Lösung dieses Problems wird die Häufigkeit der Worte einer Sprache gezählt. Das Verfahren ist unabhängig von der Sprache (bislang wurden die Sprachen Deutsch und Englisch getestet) und liefert im Ergebnis ein Maß für die Wahrscheinlichkeit, dass ein bestimmtes Wort auf ein vorgegebenes Satzfragment folgt. Satzfragmente können sowohl in Richtung Satzanfang wie auch in Richtung Satzende expandiert werden. Aufgrund dieser Fähigkeit kann ein einfaches Dialogsystem erstellt werden, bei dem ein Nutzer einen Satz eingibt (in Textform oder durch ein Spracherkennungsystem) und das System einen entsprechenden Antwortsatz erzeugt. Hierzu wird der Eingabesatz auf besonders relevante Worte analysiert und eine Replik ausgehend von den relevanten Worten des Eingabesatzes erzeugt.


Lösung

Das vorliegende System berechnet fortlau-fend die Wahrscheinlichkeiten, wie oft ein spezielles Wort auf ein anderes Wort bzw. auf bestimmte Sequenzen folgt. Die Wahrscheinlichkeiten werden kontinuierlich an die verarbeitete Sprache angepasst. Daher lernt das System kontinuierlich. Das Verfahren beschreibt, wie diese Wahrscheinlichkeiten in einer neuronalen Struktur lokal abgelegt werden können so daß die Erzeugung natürlicher Sprache möglich ist. Obwohl das Verfahren auf die neuronale Struktur des Gehirns abgebildet werden kann, kommen bei der Implementierung des Verfahrens lediglich Standard Datenstrukturen aus der Informatik zum Einsatz, da die Architektur eines Rechners für diese Art der Ausführung besser geeignet ist.


Vorteile

  • Erzeugung natürlicher Sprache
  • Kontinuierliches Lernen
  • Vielseitiger Einsatz in Sprachsteue-rungs- und Sprachassistenzsyste-men
  • Aufbau von Dialogsystemen

Anwendungsbereiche

  • Erzeugung natürlicher Sprache
  • Informatik

Service

  • Verkauf
  • Lizenzierung
  • Entwicklungskooperation

PVA Mecklenburg-Vorpommern AG

Christian Tholen
+49 381 497474-38
c.tholen@pva-mv.de
www.pva-mv.de
Adresse
Gerhart-Hauptmann-Straße 23
18055 Rostock



Entwicklungsstand

Prototyp


Patentsituation

  • DE 10 2016 125 162.3 anhängig

Kontakt | Geschäftsstelle

TechnologieAllianz e. V.
Christiane Bach-Kaienburg
(Geschäftsstellenleiterin)

c/o PROvendis GmbH
Schloßstr. 11-15
D-45468 Mülheim an der Ruhr