Reconocedor de voz para silla de ruedas basado en HMM e implementado en DSP

Angarita León, Esteban; Vargas Sánchez, Carolina

dc.contributor.advisor	Calderón Porras, Eduardo	spa
dc.contributor.advisor	Chío Cho, Nayibe	spa
dc.contributor.advisor	Tibaduiza Burgos, Diego Alexander	spa
dc.contributor.author	Angarita León, Esteban	spa
dc.contributor.author	Vargas Sánchez, Carolina	spa
dc.date.accessioned	2020-06-26T19:45:12Z
dc.date.available	2020-06-26T19:45:12Z
dc.date.issued	2007-05
dc.identifier.uri	http://hdl.handle.net/20.500.12749/1529
dc.description.abstract	El reconocedor de voz desarrollado pretende identificar cinco (5) comandos diferentes, dichos por un hablante que haya realizado la fase de entrenamiento del sistema previamente. En esa fase el usuario debe pronunciar varias repeticiones de cada uno de los comandos de voz para que el algoritmo de entrenamiento cree los patrones de comparación. La voz se adquiere a través de un micrófono omnidireccional y la señal se limita en frecuencia con un filtro pasabanda antialiasing. El procesamiento digital de la señal obtenida se realiza con una tarjeta DSP56F805EVM de Motorola. Primero se realiza la conversión A/D a 12 bits de resolución. Las muestras resultantes se procesan con un filtro digital tipo IIR que permite el paso del espectro entre 0.3 y 3.4 KHz correspondiente al intervalo de interés. Es aquí donde cobra importancia la programación del chip DSP, permitiendo el procesamiento de la señal en tiempo real, característica necesaria para la ejecución del algoritmo de reconocimiento de voz basado en los modelos ocultos de Markov (MOM o HMM). A la señal que resulta después del filtro digital, se le calcula el contorno de energía, luego de un proceso de segmentación y enventanado. En el algoritmo, ese proceso se aprovecha para ir determinando al mismo tiempo el vector de observaciones O, según la teoría de las MOM. El algoritmo de reconocimiento de voz incluye los algoritmos forward, backward y de Baum-Welch, cuyos cálculos permiten obtener y comparar probabilidades. Las comparaciones, según el propósito sea de entrenamiento o de reconocimiento, servirán respectivamente para optimizar los modelos de cada comando o para identificar la acción que el sistema debe realizar de acuerdo al comando introducido: adelante, atrás, izquierda, derecha, parar. Las acciones se llevan a cabo por medio de los puertos PWM y GPIO del chip DSP. Las señales son enviadas a una tarjeta de potencia VNH2SP30-E para cada uno de los motores (principal y de dirección). Estas tarjetas reciben las señales PWM y de polaridad para el manejo de la velocidad y el sentido de giro de los motores.	spa
dc.description.tableofcontents	INTRODUCCIÓN 1 OBJETIVO GENERAL 5 OBJETIVOS ESPECÍFICOS 6 1. DISEÑO METODOLÓGICO 7 2. SISTEMA DE RECONOCIMIENTO DE VOZ 11 2.1. CARACTERÍSTICAS 12 3. LA SEÑAL DE VOZ 15 3.1. FONEMAS Y ALÓFONOS 16 3.2. FUENTES DE VARIABILIDAD DEL HABLA 17 3.3. REPRESENTACIÓN DE LA SEÑAL 18 3.4. VOCABULARIO DEL RECONOCEDOR: ANÁLISIS DE LA SEÑAL 19 4. EL MICRÓFONO 23 4.1. CARACTERÍSTICAS DINÁMICAS DE UN MICRÓFONO CAPACITIVO ... 27 4.2. MICRÓFONO UTILIZADO EN EL PROTOTIPO CONSTRUIDO 30 4.3. PREAMPLIFICADOR 33 5. FILTRO ACTIVO 38 5.1. ALIASING 38 5.2. DISEÑO E IMPLEMENTACIÓN DEL FILTRO ACTIVO 39 6. MUESTREO Y CONVERSIÓN A/D 45 6.1. CARACTERÍSTICAS DE CONVERSOR A/D DEL DSP56F805 45 6.2. NÚMERO DE INSTRUCCIONES ENTRE CADA CONVERSIÓN 48 6.3. PROGRAMA DE PRUEBA 50 7. FILTRO DIGITAL 53 7.1. DISEÑO DEL FILTRO DIGITAL EN MATLAB 56 7.2. IMPLEMENTACIÓN DEL FILTRO DIGITAL 67 8. EXTRACCIÓN DE CARACTERÍSTICAS 72 8.1. SEGMENTACIÓN Y ENVENTANADO 72 8.2. CÁLCULO DEL CONTORNO DE ENERGÍA DE LA SEÑAL 77 9. EL MÉTODO DE RECONOCIMIENTO: MODELOS OCULTOS DE MARKOV 81 9.1. ELEMENTOS DE UN MODELO OCULTO DE MARKOV 82 9.2. FUNCIONAMIENTO DE UN RECONOCEDOR DE VOZ BASADO EN HMM 83 9.3. LOS TRES PROBLEMAS BÁSICOS DE LA TEORÍA DE HMM 84 9.3.1. Problema 1. 85 9.3.2. Problema 2. 86 9.3.3. Problema 3. 86 10. APLICACIÓN DE MODELOS OCULTOS DE MARKOV 88 10.1. ELEMENTOS BÁSICOS DE CADA MODELO 89 11. PROGRAMACIÓN EN CODEWARRIOR 93 11.1. INICIAR UN PROYECTO NUEVO PARA EL DSP56F805 93 11.2. AGREGAR Y CONFIGURAR LOS BEANS TIMERINT Y ADC 99 12. PWM (Pulse Width Modulation) 114 12.1. GENERACIÓN DE PWM 115 13. IMPLEMENTACIÓN PWM 118 13.1. ALGORITMO 118 13.2. TARJETA DE POTENCIA. 124 14. FUNCIONAMIENTO DEL PROTOTIPO 128 15. PROTOTIPO DE IMPLEMENTACIÓN 130 16. DISEÑO PARA COMERCIALIZACIÓN 138 16.1. ESPECIFICACIONES MOTOR DE DISEÑO 138 16.2. ESPECIFICACIONES MICRÓFONO DE DISEÑO 144 16.3. DISEÑO DE LA SILLA DE RUEDAS 147 CONCLUSIONES 150 BIBLIOGRAFÍA 153 Anexo A. Programa completo del reconocedor 155 Anexo B. Diseño del filtro digital con QEDesign Lite 156 Anexo C. Planos del prototipo 169 Anexo D. Características del DSP56F805 170 Anexo E. Características del VNH2SP30 171 Anexo F. Características del LM4562 172 Anexo G. Manejo de la silla por medio de joystick 173	spa
dc.format.mimetype	application/pdf	spa
dc.language.iso	spa	spa
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/2.5/co/	*
dc.title	Reconocedor de voz para silla de ruedas basado en HMM e implementado en DSP	spa
dc.title.translated	Wheelchair voice recognizer based on HMM and implemented in DSP	eng
dc.degree.name	Ingeniero Mecatrónico	spa
dc.coverage	Bucaramanga (Colombia)	spa
dc.publisher.grantor	Universidad Autónoma de Bucaramanga UNAB	spa
dc.rights.local	Abierto (Texto Completo)	spa
dc.publisher.faculty	Facultad Ingeniería	spa
dc.publisher.program	Pregrado Ingeniería Mecatrónica	spa
dc.description.degreelevel	Pregrado	spa
dc.type.driver	info:eu-repo/semantics/bachelorThesis
dc.type.local	Trabajo de Grado	spa
dc.type.coar	http://purl.org/coar/resource_type/c_7a1f
dc.subject.keywords	Automatic voice recognition	eng
dc.subject.keywords	Voice processing systems	eng
dc.subject.keywords	Signal Processing	eng
dc.subject.keywords	Mechatronic Engineering	eng
dc.subject.keywords	Investigations	eng
dc.subject.keywords	Digital techniques	eng
dc.subject.keywords	Stationary signal	eng
dc.subject.keywords	Scanning	eng
dc.subject.keywords	Patterns	eng
dc.identifier.instname	instname:Universidad Autónoma de Bucaramanga - UNAB	spa
dc.identifier.reponame	reponame:Repositorio Institucional UNAB	spa
dc.type.hasversion	info:eu-repo/semantics/acceptedVersion
dc.rights.accessrights	info:eu-repo/semantics/openAccess	spa
dc.rights.accessrights	http://purl.org/coar/access_right/c_abf2	spa
dc.relation.references	Angarita León, Esteban, Vargas Sánchez, Carolina, Calderón Porras, Eduardo (2007). Reconocedor de voz para silla de ruedas basado en HMM e implementado en DSP. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNAB	spa
dc.relation.references	AMBARDAR, Ashok. Procesamiento de señales analógicas y digitales. 2 ed. México D.F. : Thomson Editores, 2000. 811p.	spa
dc.relation.references	BERNAL BERMÚDEZ, Jesús, et al. Reconocimiento de voz y fonética acústica. México D.F. : Alfaomega y Ra–ma editorial, 2000. 332p.	spa
dc.relation.references	CÁRDENAS MAESTRE, Laura Constanza y MONTEZUMA GÓMEZ, Libardo Andrés. Sistema de Registro de Señales Eléctricas para Apoyo Diagnóstico de Patologías Cardiácas Basado en Electrocardiografía y DSP. Tesis de Grado. Bucaramanga : UNAB. 2006. 153p.	spa
dc.relation.references	GRUPO DE TRATAMIENTO Avanzado de Señal, Universidad de Cantabria. Análisis Localizado de la Señal en el Dominio del Tiempo. Diapositivas. Disponible en formato PDF.	spa
dc.relation.references	MARI, Jean–Francois, et al. Automatic Word Recognition Based on Second– Order Hidden Markov Models. En IEEE Transactions on speech and audio processind, vol. 5, Nº 1. (Enero, 1997); pág. 22.	spa
dc.relation.references	MAXIM DALLAS SEMICONDUCTOR. The Basics of Anti–Aliasing: Using Switched–Capacitor Filtres. Artículo (Application Note 928). Enero 11 de 2002. Disponible en línea en : http://www.maxim-ic.com/appnotes.cfm/appnote_number/928	spa
dc.relation.references	[7] MICROSTAR LABORATORIES INC. DAPL IIR Filter Module Manual. Documentación. Disponible en línea en : http://www.mstarlabs.com/docs/manuals/DAPLIFM.PDF	spa
dc.relation.references	MUÑOZ MONER, Antonio Faustino. Sensórica e instrumentación: Mecánica de alta precisión. 2000.	spa
dc.relation.references	OROPEZA RODRÍGUEZ, José Luis. Algoritmos y Métodos Para el Reconocimiento de Voz en Español Mediante Sílabas. En Computación y Sistemas, vol.9, Nº3, pág. 270. Disponible en formato PDF.	spa
dc.relation.references	RABINER, Lawrence R. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. En Proceedings of the IEEE, vol.77, Nº2. (Febrero, 1989); pág. 257.	spa
dc.relation.references	RAMÍREZ ROJAS, Juan Carlos. Control de Velocidad de los Motores de Corriente Continua de una Silla de Ruedas. Trabajo de Grado. Bucaramanga, UIS. 2003. 178h.	spa
dc.relation.references	RÍOS MAESTRE, Antonio. Universidad Autónoma de Barcelona. Capítulo 4 Fonemas y Alófonos del Español. Estudios de Lingüística Española, revista universitaria electrónica, vol. 4, 1999. Disponible en línea en : http://elies.rediris.es/elies4/Cap4.htm	spa
dc.relation.references	SOLIMAN, Samir S. Señales y sistemas: continuos y discretos. Madrid : Prentice Hall, 1999. 542p.	spa
dc.relation.references	THE DIGITAL SIGNAL processing handbook. Salem : CRC Press, 1998.	spa
dc.contributor.cvlac	https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000461849	*
dc.contributor.cvlac	Chío Cho, Nayibe [0000375918]
dc.contributor.googlescholar	Chío Cho, Nayibe [mModWy8AAAAJ]
dc.contributor.orcid	Chío Cho, Nayibe [0000-0002-9459-4350]
dc.contributor.researchgate	Chío Cho, Nayibe [Nayibe_Chio]
dc.subject.lemb	Reconocimiento automático de la voz	spa
dc.subject.lemb	Sistemas de procesamiento de la voz	spa
dc.subject.lemb	Procesamientos de señales	spa
dc.subject.lemb	Ingeniería mecatrónica	spa
dc.subject.lemb	Investigaciones	spa
dc.subject.lemb	Técnicas digitales	spa
dc.description.abstractenglish	The developed speech recognizer aims to identify five (5) different commands, spoken by a speaker who has previously performed the training phase of the system. In this phase, the user must pronounce several repetitions of each of the voice commands for the training algorithm to create the comparison patterns. The voice is acquired through an omnidirectional microphone and the signal is limited in frequency with an antialiasing bandpass filter. The digital processing of the obtained signal is carried out with a Motorola DSP56F805EVM card. A / D conversion is performed first at 12 bit resolution. The resulting samples are processed with a type IIR digital filter that allows the spectrum to pass between 0.3 and 3.4 KHz corresponding to the interval of interest. This is where the programming of the DSP chip becomes important, allowing the processing of the signal in real time, a necessary characteristic for the execution of the voice recognition algorithm based on hidden Markov models (MOM or HMM). The signal that results after the digital filter is calculated with the energy contour, after a segmentation and windowing process. In the algorithm, this process is used to determine at the same time the vector of observations O, according to the MOM theory. The speech recognition algorithm includes the forward, backward, and Baum-Welch algorithms, whose calculations allow probabilities to be obtained and compared. Comparisons, depending on the purpose be it training or reconnaissance, will serve respectively to optimize the models of each command or to identify the action that the system must perform according to the command entered: forward, backward, left, right, stop. Actions are carried out through the PWM and GPIO ports of the DSP chip. The signals are sent to a VNH2SP30-E power card for each of the motors (main and steering). These cards receive the PWM and polarity signals for managing the speed and direction of rotation of the motors.	eng
dc.subject.proposal	Señal estacionaria	spa
dc.subject.proposal	Escaneo	spa
dc.subject.proposal	Patrones	spa
dc.type.redcol	http://purl.org/redcol/resource_type/TP
dc.rights.creativecommons	Atribución-NoComercial-SinDerivadas 2.5 Colombia	*
dc.contributor.researchgroup	Grupo de Investigación Control y Mecatrónica - GICYM	spa
dc.contributor.researchgroup	Grupo de Investigaciones Clínicas	spa
dc.contributor.apolounab	Chío Cho, Nayibe [nayibe-chío-cho]
dc.coverage.campus	UNAB Campus Bucaramanga	spa
dc.description.learningmodality	Modalidad Presencial	spa
dc.contributor.linkedin	Chío Cho, Nayibe [nayibe-chio-cho-41a17724]