Fr. 64.00

Wer hat wann gesprochen? - Audiobasierte Schätzung des Sprecherstandorts für die Diarisierung

Tedesco · Tascabile

Spedizione di solito entro 2 a 3 settimane (il titolo viene stampato sull'ordine)

Descrizione

Ulteriori informazioni

Die Sprechertagung ist ein Prozess, der aktive Sprecher erkennt und diejenigen Sprachsignale gruppiert, die von demselben Sprecher geäußert wurden. Im Allgemeinen gibt es zwei Hauptanwendungen für die Sprechertypisierung. Automatische Spracherkennungssysteme nutzen die sprecherhomogenen Cluster, um die akustischen Modelle sprecherabhängig anzupassen und damit die Erkennungsleistung zu erhöhen. Sprecherindizierungs- und Rich-Transcription-Systeme nutzen ebenfalls die Sprecherdiarisierungsausgabe als eine der Informationen, die aus einer Aufnahme extrahiert werden und deren automatische Indizierung und andere Weiterverarbeitung ermöglichen. In dieser Studie wird eine Anwendung zur Sprechertiarisierung entwickelt - unter Verwendung von binauralen Mehrparteien-Sprachaufnahmen - um die Sprecheraktivität basierend auf interauralen Zeitdifferenzen (ITD) zu verfolgen. Diese Cues werden für einen gegebenen Sprachsignalrahmen mittels Gammatone-Filterung und Kreuzkorrelationstechnik berechnet. Ihre Werte werden verwendet, um zu bestimmen, welcher Sprecher in der Aufnahme das betrachtete Sprachfragment produziert hat. Diese Studie wurde von Dr. Jon Barker betreut und zur Erfüllung der Anforderungen für den Master in Advanced Computer Science, University of Sheffield, United Kingdom, 2007 verteidigt.

Info autore










Maral Dadvar trabaja en el Grupo de Interacción con los Medios Humanos de la Universidad de Twente, en los Países Bajos, como investigador de doctorado. Desarrolló un interés en el procesamiento del lenguaje natural cuando implementó la diarización del hablante para su tesis de maestría. Maral tiene una maestría en ciencias informáticas avanzadas de la Universidad de Sheffield, Reino Unido.

Dettagli sul prodotto

Autori Maral Dadvar
Editore Verlag Unser Wissen
 
Lingue Tedesco
Formato Tascabile
Pubblicazione 08.01.2021
 
EAN 9786203172522
ISBN 9786203172522
Pagine 72
Categoria Scienze naturali, medicina, informatica, tecnica > Informatica, EDP > Software applicativo

Recensioni dei clienti

Per questo articolo non c'è ancora nessuna recensione. Scrivi la prima recensione e aiuta gli altri utenti a scegliere.

Scrivi una recensione

Top o flop? Scrivi la tua recensione.

Per i messaggi a CeDe.ch si prega di utilizzare il modulo di contatto.

I campi contrassegnati da * sono obbligatori.

Inviando questo modulo si accetta la nostra dichiarazione protezione dati.