Sold out

Swantje Westpfahl

POS-Tagging für Transkripte gesprochener Sprache - Entwicklung einer automatisierten Wortarten-Annotation am Beispiel des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK)

German · Paperback / Softback

Description

Der Band leistet eine theoretisch begründete und empirisch validierte Entwicklung einer automatisierten Wortartenannotation (Part-of-Speech-Tagging) für Transkripte spontansprachlicher Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), das über die Datenbank für Gesprochenes Deutsch der Forschungsgemeinschaft öffentlich zugänglich ist. Dabei setzt er zwei Schwerpunkte: erstens die theoretische Aufarbeitung von Unterschieden von Transkripten gesprochener Sprache zu schriftsprachlichen Daten in Hinblick auf die Entwicklung eines Tagsets für das gesprochene Deutsch; zweitens die Darstellung der empirischen Arbeitsschritte zur Erstellung des automatisierten Part-of-Speech-Taggings, d. h. die Implementierung und Evaluierung für die Annotation des FOLK-Korpus. Der Band ist eine kritische Reflexion der Wortartentheorien im Spannungsfeld zwischen Theorie und datengeleiteter Arbeit. Er gibt Einblicke über die Korpusaufbereitung von Transkripten gesprochener Sprache und stellt diese in Bezug zu Theorien über die Eigenheiten gesprochener Sprache.Die Autorin hat für ihre Arbeit 2020 den Peter-Roschy-Preis des Vereins der Freunde des Leibniz-Instituts für Deutsche Sprache erhalten.

List of contents

1. Einleitung1.1 Was ist Part-of-Speech-Tagging?1.2 Inhalt und Aufbau der Untersuchung1.3 Datengrundlage FOLK1.4 Related Work1.5 Pilotstudie1.6 Zielsetzung der Untersuchung2. Theoretische Grundlagen2.1 Grammatik der gesprochenen Sprache2.2 Segmentierung von Transkripten gesprochener Sprache2.3 Kontext und Multimodalität in der Face-to-Face-2.4 Wortarten in der gesprochenen Sprache2.5 Weitere Klassifikationsprobleme3. Empirischer Teil3.1 Zielsetzung der empirischen Arbeit3.2 Überblick über die empirische Vorgehensweise3.3 Auswahl des Taggers und des Tagsets3.4 Funktionsweise des Taggers3.5 Möglichkeiten der Anpassung des Taggers und des Tagsets3.6 Erstellen des Goldstandards3.7 Erste Anpassung des Tagsets und der Guidelines3.8 Manuelle Korrektur des Development-Sets3.9 Inter-Annotator-Agreement zur manuellen Korrektur desDevelopment-Sets3.10 Einführung eines Post-Processings3.11 Zweite Anpassung der Guidelines3.12 Entwicklung eines automatisierten Taggings anhand des Development-Sets3.13 Manuelle Korrektur des Goldstandard-Sets3.14 Entwicklung eines automatisierten Taggings anhand des Goldstandards3.15 Evaluation des POS-Taggings für spontansprachliche Daten3.16 Fazit4. Abschließende Diskussion und Ausblick5. Literatur6. Anhang

About the author

Frau Swantje Westpfahl war wissenschaftliche Mitarbeiterin am Leibniz-Institut für Deutsche Sprache und E-Learning-Projektleiterin bei der Intelligent Media Systems in Karlsruhe. Derzeit ist sie als Leiterin des Institute for Security and Safety in Potsdam tätig.

Product details

Authors	Swantje Westpfahl
Publisher	Narr

Languages	German
Product format	Paperback / Softback
Released	01.03.2020

EAN	9783823383611
ISBN	978-3-8233-8361-1
No. of pages	417
Dimensions	155 mm x 229 mm x 29 mm
Weight	697 g
Series	Studien zur deutschen Sprache
Subjects	Humanities, art, music > Linguistics and literary studies > General and comparative linguistics Humanities, art, music > Linguistics and literary studies > German linguistics / literary studies Literaturwissenschaft, Sprachwissenschaft, Linguistik, Deutsch, Gesprochene-Sprache-Forschung; Korpusaufbereitung; Wortarten; Computerlinguistik; Annotation

Customer reviews

No reviews have been written for this item yet. Write the first review and be helpful to other users when they decide on a purchase.

Write a review

Thumbs up or thumbs down? Write your own review.