Modelo de procesamiento de voz para la clasificación de estados

Por favor, use este identificador para citar o enlazar este ítem: http://repositoriodigital.ipn.mx/handle/123456789/7767

Título :	Modelo de procesamiento de voz para la clasificación de estados
Autor :	Sárez Guerra, Sergio Yáñez Márquez, Cornelio Solís Villarreal, José Francisco
Palabras clave :	Speech percepcion
Fecha de publicación :	2011
Editorial :	Instituto Politécnico Nacional. Centro de Investigación en Computación
Resumen :	En esta tesis se reportan los avances obtenidos en la clasificación de emociones a partir de señales de voz, los objetivos que se plantean para la conclusión del mismo y una descripción de los trabajos relacionados encontrados hasta el momento. El reconocimiento de emociones es un problema que ha sido abordado de diferentes maneras, teniendo en cuenta diversas formas de obtener los datos, como son la lectura de señales biométricas (presión arterial, pulso, entre las más importantes), detección de secuencias de movimientos del cuerpo humano al andar, el seguimiento de la expresión facial, la señal de voz, entre otras. Hay trabajos que abordan el tema analizando diferentes tipos de señales y otros que tratan con un solo tipo de señal; para los propósitos del presente proyecto, se trabaja con la señal de voz. Las técnicas utilizadas hasta el presente para el reconocimiento y clasificación de emociones son redes neuronales artificiales, mixturas Faustianas, Modelos Ocultos de Járkov, principalmente. En este trabajo de tesis se hace uso de técnicas de soporte vectorial y memorias asociativas, la combinación de ambas dan como resultados una efectividad cercana al 99% de acierto en la clasificación de emociones. Se utiliza la base de datos de Berlín [2], la cual es gratuita y con la cual muchos investigadores han llevado a cabo sus trabajos y donde los resultados reportados no han sobrepasado al 82 %. // In this work, in general terms, we report the progress made in the recognition and classification of emotions from voice signals, the objectives proposed for the conclusion and a description of relevant work found so far. Emotion recognition is a problem that has been treated in diferent manners, taking into account various ways of obtaining data, such as reading biometric signals (blood pressure, pulse, among the most important), detection of sequences of movements of the human body walking, monitoring of facial expression, voice signal, among others. There are works dealing with the issue by analyzing diferent types of signals and others who deal with one type of signal, for the purposes of this project, working with the voice signal. Actually, the techniques used for the recognition and classification of emotions are neural networks, Gaussian mixtures, Hidden Markov Models, mainly. In this thesis makes use of support vector techniques and associative memories, the combination of both result in an overall close of 99% accuracy in the classification of emotions. It uses the database Berlin [2], which is free and with which many researchers have carried out their work and where the reported results have not exceeded 82 %.
Descripción :	Doctorado en Ciencias de la Computación
URI :	http://www.repositoriodigital.ipn.mx/handle/123456789/7767
Aparece en las colecciones:	Doctorado

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
tesis.pdf		935.63 kB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem

El Instituto Politécnico Nacional

Contribuye al desarrollo económico y social de la nación, a través de la formación integral de personas competentes; de la investigación, el desarrollo tecnológico y la innovación. Además tiene reconocimiento internacional por su calidad e impacto social.

Aviso de privacidad