Englisch

Definition und Beispiele von Korpora in der Linguistik

In der Linguistik ist ein Korpus eine Sammlung von Sprachdaten (normalerweise in einer Computerdatenbank enthalten), die für Forschung, Wissenschaft und Lehre verwendet werden. Wird auch als Textkorpus bezeichnet . Plural: Korpora .

Der erste systematisch organisierte Computerkorpus war der Brown University Standard Corpus des heutigen amerikanischen Englisch (allgemein bekannt als Brown Corpus), der in den 1960er Jahren von den Linguisten Henry Kučera und W. Nelson Francis zusammengestellt wurde.

Bemerkenswerte Korpora in englischer Sprache umfassen Folgendes:

Etymologie
Aus dem Lateinischen „Körper“

 

Beispiele und Beobachtungen

    • „Die Bewegung für ‚authentische Materialien‘ im Sprachunterricht, die in den 1980er Jahren aufkam, befürwortete eine stärkere Verwendung von realen oder ‚authentischen‘ Materialien – Materialien, die nicht speziell für den Unterricht entwickelt wurden -, da argumentiert wurde, dass solche Materialien offengelegt würden Lernende anhand von Beispielen für den Gebrauch natürlicher Sprache aus realen Kontexten. In jüngerer Zeit haben das Aufkommen der Korpuslinguistik und die Einrichtung umfangreicher Datenbanken oder Korpora verschiedener Genres authentischer Sprache einen weiteren Ansatz geboten, um den Lernenden reflektierende Unterrichtsmaterialien zur Verfügung zu stellen authentischer Sprachgebrauch. “
      (Jack C. Richards, Vorwort des Serienherausgebers. Verwenden von Korpora im Sprachunterricht , von Randi Reppen. Cambridge University Press, 2010)
    • Kommunikationsmodi: Schreiben und Sprechen
      Korpora kann Sprache codieren, die in einem beliebigen Modus erzeugt wird – zum Beispiel gibt es Korpora der gesprochenen Sprache und Korpora der geschriebenen Sprache. Darüber hinaus zeichnen einige Videokorpora paralinguistische Merkmale wie Gesten auf … und Korpora der Gebärdensprache wurden konstruiert …
      „Korpora, die die geschriebene Form einer Sprache darstellen, stellen normalerweise die kleinste technische Herausforderung dar, die zu konstruieren ist. . . . Mit Unicode können Computer Textmaterial in nahezu allen aktuellen und ausgestorbenen Schriftsystemen der Welt zuverlässig speichern, austauschen und anzeigen. . . .
      „Das Sammeln und Transkribieren von Material für einen gesprochenen Korpus ist jedoch zeitaufwändig. Einige Materialien stammen möglicherweise aus Quellen wie dem World Wide Web. Transkripte wie diese wurden jedoch nicht als zuverlässige Materialien für die sprachliche Erforschung konzipiert der gesprochenen Sprache … [S] gesprochene Korpusdaten werden häufiger durch Aufzeichnen und anschließendes Transkribieren von Interaktionen erzeugt. Orthographische und / oder phonemische Transkriptionen gesprochener Materialien können zu einem vom Computer durchsuchbaren Sprachkorpus zusammengestellt werden. “
      (Tony McEnery und Andrew Hardie, Corpus Linguistics: Methode, Theorie und Praxis . Cambridge University Press, 2012)

 

    • Konkordanz
      Konkordanz ist ein zentrales Werkzeug in der Korpuslinguistik und bedeutet einfach die Verwendung von Korpussoftware, um jedes Vorkommen eines bestimmten Wortes oder einer bestimmten Phrase zu finden. Mit einem Computer können wir jetzt Millionen von Wörtern in Sekunden suchen. Das Suchwort oder die Phrase wird oft als „Knoten“ bezeichnet, und Konkordanzzeilen werden normalerweise mit dem Knotenwort / der Knotenphrase in der Mitte der Zeile mit sieben oder acht Wörtern auf beiden Seiten dargestellt. Diese werden als Schlüsselwort-im-Kontext-Anzeigen bezeichnet ( oder KWIC-Konkordanzen). “
      (Anne O’Keeffe, Michael McCarthy und Ronald Carter, „Einführung“. Vom Korpus zum Klassenzimmer: Sprachgebrauch und Sprachunterricht . Cambridge University Press, 2007)
    • Vorteile der
      Korpuslinguistik „1992 stellte [Jan Svartvik] die Vorteile der Korpuslinguistik in einem Vorwort einer einflussreichen Sammlung von Arbeiten vor. Seine Argumente werden hier in Kurzform angegeben:
      – Korpusdaten sind objektiver als Daten, die auf Selbstbeobachtung beruhen.
      – Korpus Daten können leicht von anderen Forschern überprüft werden, und Forscher können dieselben Daten gemeinsam nutzen, anstatt immer ihre eigenen zusammenzustellen.
      – Korpusdaten werden für Studien zur Variation zwischen Dialekten. Registern und Stilen benötigt.
      – Korpusdaten geben die Häufigkeit des Auftretens sprachlicher Elemente an.
      – Korpusdaten liefern nicht nur anschauliche Beispiele, sondern sind eine theoretische Ressource.
      – Korpusdaten liefern wichtige Informationen für eine Reihe von Anwendungsbereichen wie Sprachunterricht und Sprachtechnologie (maschinelle Übersetzung, Sprachsynthese usw.).
      – Korpora bieten die Möglichkeit der Gesamtverantwortung für sprachliche Merkmale – Der Analyst sollte alles in den Daten berücksichtigen, nicht nur ausgewählte Merkmale.
      – Compu Mit terisierten Korpora erhalten Forscher auf der ganzen Welt Zugang zu den Daten.
      – Korpusdaten sind ideal für Nicht-Muttersprachler der Sprache.
      (Svarvik 1992: 8-10) Svartvik weist jedoch auch darauf hin, dass es entscheidend ist, dass der Korpuslinguist auch eine sorgfäl
      tige manuelle Analyse durchführt: bloße Zahlen sind selten genug. Er betont auch, dass die Qualität des Korpus wichtig ist. “
      (Hans Lindquist, Corpus Linguistics and the Description of English . Edinburgh University Press, 2009)

 

    • Zusätzliche Anwendungen der korpusbasierten Forschung
      „Neben den Anwendungen in der Sprachforschung an sich können die folgenden praktischen Anwendungen erwähnt werden.
      Lexikographie Von
      Korpus abgeleitete Frequenzlisten und insbesondere Konkordanzen etablieren sich als grundlegende Werkzeuge für den Lexikographen. .
      Sprache Unterricht
      … die Verwendung von Konkordanz als Sprachlern Tools ist derzeit ein großes Interesse an computergestützten Sprachenlernen (CALL, siehe Johns 1986)….
      Speech
      Verarbeitungsmaschine Übersetzung ist ein Beispiel für die Anwendung von Korpora für Was Informatiker als Verarbeitung natürlicher Sprache bezeichnen . Neben der maschinellen Übersetzung ist ein Hauptforschungsziel für NLP die Sprachverarbeitung , dh die Entwicklung von Computersystemen, die in der Lage sind, automatisch erzeugte Sprache aus schriftlichen Eingaben ( Sprachsynthese ) auszugeben oder Spracheingaben umzuwandeln in schriftliche Form ( Spracherkennung ). “ (Geoffrey N. Leech, „Corpora“. The Linguistics Encyclopedia , Hrsg. Von Kirsten Malmkjaer. Routledge, 1995)

 

Similar Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.