Fr. 64.00

¿Quién habló cuándo? - Estimación de la ubicación de los altavoces basada en audio para la diarización

Spanish · Paperback / Softback

Shipping usually within 2 to 3 weeks (title will be printed to order)

Description

Read more










La diarización de hablantes es el proceso que detecta los hablantes activos y agrupa las señales del habla que ha emitido el mismo hablante. Generalmente podemos encontrar dos aplicaciones principales para la diarización del hablante. Los sistemas de reconocimiento automático del habla utilizan los grupos homogéneos de hablantes para adaptar los modelos acústicos a la dependencia del hablante y, por lo tanto, aumentar el rendimiento del reconocimiento. Los sistemas de indexación del hablante y de transcripción enriquecida también utilizan la salida de la diarización del hablante como información extraída de una grabación, lo que permite su indexación automática y otros procesamientos posteriores. En el presente estudio se desarrolla una aplicación de diarización del hablante, utilizando grabaciones binaurales multipartitas del habla, para hacer un seguimiento de la actividad del hablante sobre la base de las indicaciones de la diferencia de tiempo interaural (DTI). Estas pistas, para un marco de señal de habla determinado, se calculan utilizando la técnica de filtrado y correlación cruzada de gammatones. Sus valores se utilizan para determinar qué hablante de la grabación produce el fragmento de habla considerado. Este estudio ha sido supervisado por el Dr. Jon Barker, y defendido para cumplir los requisitos para el grado de Master en Informática Avanzada, Universidad de Sheffield, Reino Unido, 2007.

About the author










Maral Dadvar trabaja en el Grupo de Interacción con los Medios Humanos de la Universidad de Twente, en los Países Bajos, como investigador de doctorado. Desarrolló un interés en el procesamiento del lenguaje natural cuando implementó la diarización del hablante para su tesis de maestría. Maral tiene una maestría en ciencias informáticas avanzadas de la Universidad de Sheffield, Reino Unido.

Product details

Authors Maral Dadvar
Publisher Ediciones Nuestro Conocimiento
 
Languages Spanish
Product format Paperback / Softback
Released 02.01.2021
 
EAN 9786203172287
ISBN 978-620-3-17228-7
No. of pages 72
Dimensions 150 mm x 220 mm x 5 mm
Weight 125 g
Subject Natural sciences, medicine, IT, technology > IT, data processing > Application software

Customer reviews

No reviews have been written for this item yet. Write the first review and be helpful to other users when they decide on a purchase.

Write a review

Thumbs up or thumbs down? Write your own review.

For messages to CeDe.ch please use the contact form.

The input fields marked * are obligatory

By submitting this form you agree to our data privacy statement.