Sold out

POS-Tagging für Transkripte gesprochener Sprache - Entwicklung einer automatisierten Wortarten-Annotation am Beispiel des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK)

German · Paperback / Softback

Description

Read more

Der Band leistet eine theoretisch begründete und empirisch validierte Entwicklung einer automatisierten Wortartenannotation (Part-of-Speech-Tagging) für Transkripte spontansprachlicher Daten des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK), das über die Datenbank für Gesprochenes Deutsch der Forschungsgemeinschaft öffentlich zugänglich ist. Dabei setzt er zwei Schwerpunkte: erstens die theoretische Aufarbeitung von Unterschieden von Transkripten gesprochener Sprache zu schriftsprachlichen Daten in Hinblick auf die Entwicklung eines Tagsets für das gesprochene Deutsch; zweitens die Darstellung der empirischen Arbeitsschritte zur Erstellung des automatisierten Part-of-Speech-Taggings, d. h. die Implementierung und Evaluierung für die Annotation des FOLK-Korpus. Der Band ist eine kritische Reflexion der Wortartentheorien im Spannungsfeld zwischen Theorie und datengeleiteter Arbeit. Er gibt Einblicke über die Korpusaufbereitung von Transkripten gesprochener Sprache und stellt diese in Bezug zu Theorien über die Eigenheiten gesprochener Sprache.Die Autorin hat für ihre Arbeit 2020 den Peter-Roschy-Preis des Vereins der Freunde des Leibniz-Instituts für Deutsche Sprache erhalten.

List of contents

1. Einleitung1.1 Was ist Part-of-Speech-Tagging?1.2 Inhalt und Aufbau der Untersuchung1.3 Datengrundlage FOLK1.4 Related Work1.5 Pilotstudie1.6 Zielsetzung der Untersuchung2. Theoretische Grundlagen2.1 Grammatik der gesprochenen Sprache2.2 Segmentierung von Transkripten gesprochener Sprache2.3 Kontext und Multimodalität in der Face-to-Face-2.4 Wortarten in der gesprochenen Sprache2.5 Weitere Klassifikationsprobleme3. Empirischer Teil3.1 Zielsetzung der empirischen Arbeit3.2 Überblick über die empirische Vorgehensweise3.3 Auswahl des Taggers und des Tagsets3.4 Funktionsweise des Taggers3.5 Möglichkeiten der Anpassung des Taggers und des Tagsets3.6 Erstellen des Goldstandards3.7 Erste Anpassung des Tagsets und der Guidelines3.8 Manuelle Korrektur des Development-Sets3.9 Inter-Annotator-Agreement zur manuellen Korrektur desDevelopment-Sets3.10 Einführung eines Post-Processings3.11 Zweite Anpassung der Guidelines3.12 Entwicklung eines automatisierten Taggings anhand des Development-Sets3.13 Manuelle Korrektur des Goldstandard-Sets3.14 Entwicklung eines automatisierten Taggings anhand des Goldstandards3.15 Evaluation des POS-Taggings für spontansprachliche Daten3.16 Fazit4. Abschließende Diskussion und Ausblick5. Literatur6. Anhang

About the author










Frau Swantje Westpfahl war wissenschaftliche Mitarbeiterin am Leibniz-Institut für Deutsche Sprache und E-Learning-Projektleiterin bei der Intelligent Media Systems in Karlsruhe. Derzeit ist sie als Leiterin des Institute for Security and Safety in Potsdam tätig.

Product details

Authors Swantje Westpfahl
Publisher Narr
 
Languages German
Product format Paperback / Softback
Released 01.03.2020
 
EAN 9783823383611
ISBN 978-3-8233-8361-1
No. of pages 417
Dimensions 155 mm x 229 mm x 29 mm
Weight 697 g
Series Studien zur Deutschen Sprache
Subjects Humanities, art, music > Linguistics and literary studies > General and comparative linguistics
Humanities, art, music > Linguistics and literary studies > German linguistics / literary studies

Literaturwissenschaft, Sprachwissenschaft, Linguistik, Deutsch, Gesprochene-Sprache-Forschung; Korpusaufbereitung; Wortarten; Computerlinguistik; Annotation

Customer reviews

No reviews have been written for this item yet. Write the first review and be helpful to other users when they decide on a purchase.

Write a review

Thumbs up or thumbs down? Write your own review.

For messages to CeDe.ch please use the contact form.

The input fields marked * are obligatory

By submitting this form you agree to our data privacy statement.