Englisch

Definition der Begriffsklärung in der Sprachwissenschaft

In der Linguistik ist Disambiguierung der Prozess der Bestimmung, welcher Sinn eines Wortes in einem bestimmten Kontext verwendet wird. Auch als lexikalische Begriffsklärung bekannt .

In der Computerlinguistik wird dieser Unterscheidungsprozess als Wortsinn-Disambiguierung (WSD) bezeichnet .

 

Beispiele und Beobachtungen

„Es kommt vor, dass unsere Kommunikation in verschiedenen Sprachen es ermöglicht, dass dieselbe Wortform verwendet wird, um verschiedene Dinge in einzelnen Kommunikationstransaktionen zu bedeuten. Die Konsequenz ist, dass man in einer bestimmten Transaktion die beabsichtigte Bedeutung von a herausfinden muss gegebenes Wort unter seinen potentiell assoziierten Sinnen. Während die Mehrdeutigkeiten, die sich aus solchen multiplen formbedeutenden Assoziationen ergeben, auf der lexikalischen Ebene liegen, müssen sie oft durch einen größeren Kontext aus dem Diskurs gelöst werden, in den das Wort eingebettet ist Das Wort „Service“ konnte nur auseinandergehalten werden, wenn man über das Wort selbst hinausblicken konnte, wie im Gegensatz zu „dem Service des Spielers in Wimbledon“ und „dem Service des Kellners im Sheraton“. Dieser Prozess der Identifizierung von Wortbedeutungen in einem Diskurs ist allgemein als Wortsinn- Disambiguierung (WSD) bekannt. “ (Oi Yee Kwong, Neue Perspektiven für rechnergestützte und kognitive Strategien zur Disambiguierung des Wortsinns . Springer, 2013)

 

Lexikalische Disambiguierung und Wortsinn-Disambiguierung (WSD)

„Die lexikalische Disambiguierung in ihrer weitesten Definition ist nichts weniger als die Bestimmung der Bedeutung jedes Wortes im Kontext, was bei Menschen als weitgehend unbewusster Prozess erscheint. Als Rechenproblem wird es oft als ‚KI-vollständig‘ bezeichnet, d. H. Ein Problem, dessen Lösung eine Lösung für ein vollständiges Verständnis der natürlichen Sprache oder ein vernünftiges Denken voraussetzt (Ide und Véronis 1998).

„Auf dem Gebiet der Computerlinguistik wird das Problem allgemein als Wortsinn-Disambiguierung (WSD) bezeichnet und ist definiert als das Problem der rechnerischen Bestimmung, welcher ‚Sinn‘ eines Wortes durch die Verwendung des Wortes in einem bestimmten Kontext aktiviert wird. WSD ist Im Wesentlichen eine Aufgabe der Klassifizierung: Wortsinne sind die Klassen, der Kontext liefert die Beweise, und jedes Vorkommen eines Wortes wird einer oder mehreren seiner möglichen Klassen basierend auf den Beweisen zugeordnet. Dies ist die traditionelle und übliche Charakterisierung von WSD, die sieht Es handelt sich um einen expliziten Prozess der Disambiguierung in Bezug auf ein festes Inventar von Wortsinnen. Es wird angenommen, dass Wörter einen endlichen und diskreten Satz von Sinnen aus einem Wörterbuch. einer lexikalischen Wissensbasis oder einer Ontologie haben (in letzterem entsprechen die Sinne Konzepten dass ein Wort lexikalisiert wird). Anwendungsspezifische Inventare können ebenfalls verwendet werden. Beispielsweise kann man in einer Einstellung für maschinelle Übersetzung (MT) Wortübersetzungen als Wortsinne behandeln, ein Ansatz, der weil ist Aufgrund der Verfügbarkeit großer mehrsprachiger paralleler Korpora. die als Trainingsdaten dienen können, wird dies zunehmend möglich . Das feste Inventar der traditionellen WSD verringert die Komplexität des Problems, es gibt jedoch alternative Felder. . .. „(Eneko Agirre und Philip Edmonds,“ Einführung. “ Wortsinn-Disambiguierung: Algorithmen und Anwendungen . Springer, 2007)

 

Homonymie und Begriffsklärung

„Die lexikalische Disambiguierung ist besonders für Fälle von Homonymie gut geeignet. Beispielsweise muss ein Auftreten von Bass je nach beabsichtigter Bedeutung auf eines der lexikalischen Elemente Bass 1 oder Bass 2 abgebildet werden .

„Lexikalische Disambiguierung impliziert eine kognitive Wahl und ist eine Aufgabe, die Verständnisprozesse hemmt. Sie sollte von Prozessen unterschieden werden, die zu einer Differenzierung der Wortsinne führen. Die erstere Aufgabe wird ziemlich zuverlässig auch ohne viele Kontextinformationen ausgeführt, während die letztere nicht ist (vgl Veronis 1998, 2001). Es wurde auch gezeigt, dass gleichnamige Wörter, die eine Disambiguierung erfordern, den lexikalischen Zugriff verlangsamen, während polysemische Wörter, die eine Vielzahl von Wortsinnen aktivieren, den lexikalischen Zugriff beschleunigen (Rodd ea 2002).

„Sowohl die produktive Modifikation semantischer Werte als auch die einfache Wahl zwischen lexikalisch unterschiedlichen Elementen haben jedoch gemeinsam, dass sie zusätzliche nicht-lexikalische Informationen erfordern.“ (Peter Bosch, „Produktivität, Polysemie und Prädikatenindexikalität“. Logik, Sprache und Berechnung: 6. Internationales Tiflis-Symposium über Logik, Sprache und Berechnung , herausgegeben von Balder D. ten Cate und Henk W. Zeevat. Springer, 2007 )

 

Lexikalische Kategorie Disambiguierung und das Prinzip der Wahrscheinlichkeit

„Corley und Crocker (2000) präsentieren ein breit gefächertes Modell der Disambiguierung lexikalischer Kategorien, das auf dem Prinzip der Wahrscheinlichkeit basiert . Insbesondere schlagen sie vor, dass der Satzprozessor für einen Satz, der aus Wörtern w 0 … w n besteht , am wahrscheinlichsten übernimmt part-of-speech. Sequenz t 0 t… n Genauer gesagt ihr Modell nutzt zwei einfache Wahrscheinlichkeiten:. ( i ) die bedingte Wahrscheinlichkeit eines Wortes w i einen bestimmten Teil der Sprache gegeben t i ist , und ( ii ) die Wahrscheinlichkeit t i gegeben den vorherigen Teil der Sprache t i-1 . Wenn jedes Wort des Satzes angetroffen wird, weist das System ihm den Teil der Sprache t i zu , der das Produkt dieser beiden Wahrscheinlichkeiten maximiert. Dieses Modell nutzt die Einsicht dass viele syntaktische Ambiguitäten eine lexikalische Basis haben (MacDonald et al., 1994), wie in (3):

(3) Die Lagerpreise / Marken sind günstiger als die übrigen.

„Diese Sätze sind vorübergehend mehrdeutig zwischen einer Lesart, bei der Preise oder Marken das Hauptverb oder ein Teil eines zusammengesetzten Substantivs sind. Nachdem das Modell auf einem großen Korpus trainiert wurde, sagt es den wahrscheinlichsten Teil der Sprache für Preise voraus , wobei die Tatsache korrekt berücksichtigt wird dass die Menschen verstehen Preis als Substantiv , sondern machen als verb (siehe Crocker & Corley, 2002 und darin zitierte Literatur). Nicht nur , dass das Modell Konto für eine Reihe von Begriffsklärung Präferenzen in lexikalischer Kategorie Mehrdeutigkeit verwurzelt, es erklärt auch , warum in Im Allgemeinen sind die Menschen sehr genau darin, solche Unklarheiten zu lösen. “ (Matthew W. Crocker, „Rationale Modelle des Verstehens: Adressierung des Leistungsparadoxons“ . Psycholinguistik des 21. Jahrhunderts: Vier Eckpfeiler , herausgegeben von Anne Cutler. Lawrence Erlbaum, 2005)

Similar Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.