Mostrar el registro sencillo del ítem

dc.contributor.advisorCalderón Porras, Eduardospa
dc.contributor.advisorChío Cho, Nayibespa
dc.contributor.advisorTibaduiza Burgos, Diego Alexanderspa
dc.contributor.authorAngarita León, Estebanspa
dc.contributor.authorVargas Sánchez, Carolinaspa
dc.date.accessioned2020-06-26T19:45:12Z
dc.date.available2020-06-26T19:45:12Z
dc.date.issued2007-05
dc.identifier.urihttp://hdl.handle.net/20.500.12749/1529
dc.description.abstractEl reconocedor de voz desarrollado pretende identificar cinco (5) comandos diferentes, dichos por un hablante que haya realizado la fase de entrenamiento del sistema previamente. En esa fase el usuario debe pronunciar varias repeticiones de cada uno de los comandos de voz para que el algoritmo de entrenamiento cree los patrones de comparación. La voz se adquiere a través de un micrófono omnidireccional y la señal se limita en frecuencia con un filtro pasabanda antialiasing. El procesamiento digital de la señal obtenida se realiza con una tarjeta DSP56F805EVM de Motorola. Primero se realiza la conversión A/D a 12 bits de resolución. Las muestras resultantes se procesan con un filtro digital tipo IIR que permite el paso del espectro entre 0.3 y 3.4 KHz correspondiente al intervalo de interés. Es aquí donde cobra importancia la programación del chip DSP, permitiendo el procesamiento de la señal en tiempo real, característica necesaria para la ejecución del algoritmo de reconocimiento de voz basado en los modelos ocultos de Markov (MOM o HMM). A la señal que resulta después del filtro digital, se le calcula el contorno de energía, luego de un proceso de segmentación y enventanado. En el algoritmo, ese proceso se aprovecha para ir determinando al mismo tiempo el vector de observaciones O, según la teoría de las MOM. El algoritmo de reconocimiento de voz incluye los algoritmos forward, backward y de Baum-Welch, cuyos cálculos permiten obtener y comparar probabilidades. Las comparaciones, según el propósito sea de entrenamiento o de reconocimiento, servirán respectivamente para optimizar los modelos de cada comando o para identificar la acción que el sistema debe realizar de acuerdo al comando introducido: adelante, atrás, izquierda, derecha, parar. Las acciones se llevan a cabo por medio de los puertos PWM y GPIO del chip DSP. Las señales son enviadas a una tarjeta de potencia VNH2SP30-E para cada uno de los motores (principal y de dirección). Estas tarjetas reciben las señales PWM y de polaridad para el manejo de la velocidad y el sentido de giro de los motores.spa
dc.description.tableofcontentsINTRODUCCIÓN 1 OBJETIVO GENERAL 5 OBJETIVOS ESPECÍFICOS 6 1. DISEÑO METODOLÓGICO 7 2. SISTEMA DE RECONOCIMIENTO DE VOZ 11 2.1. CARACTERÍSTICAS 12 3. LA SEÑAL DE VOZ 15 3.1. FONEMAS Y ALÓFONOS 16 3.2. FUENTES DE VARIABILIDAD DEL HABLA 17 3.3. REPRESENTACIÓN DE LA SEÑAL 18 3.4. VOCABULARIO DEL RECONOCEDOR: ANÁLISIS DE LA SEÑAL 19 4. EL MICRÓFONO 23 4.1. CARACTERÍSTICAS DINÁMICAS DE UN MICRÓFONO CAPACITIVO ... 27 4.2. MICRÓFONO UTILIZADO EN EL PROTOTIPO CONSTRUIDO 30 4.3. PREAMPLIFICADOR 33 5. FILTRO ACTIVO 38 5.1. ALIASING 38 5.2. DISEÑO E IMPLEMENTACIÓN DEL FILTRO ACTIVO 39 6. MUESTREO Y CONVERSIÓN A/D 45 6.1. CARACTERÍSTICAS DE CONVERSOR A/D DEL DSP56F805 45 6.2. NÚMERO DE INSTRUCCIONES ENTRE CADA CONVERSIÓN 48 6.3. PROGRAMA DE PRUEBA 50 7. FILTRO DIGITAL 53 7.1. DISEÑO DEL FILTRO DIGITAL EN MATLAB 56 7.2. IMPLEMENTACIÓN DEL FILTRO DIGITAL 67 8. EXTRACCIÓN DE CARACTERÍSTICAS 72 8.1. SEGMENTACIÓN Y ENVENTANADO 72 8.2. CÁLCULO DEL CONTORNO DE ENERGÍA DE LA SEÑAL 77 9. EL MÉTODO DE RECONOCIMIENTO: MODELOS OCULTOS DE MARKOV 81 9.1. ELEMENTOS DE UN MODELO OCULTO DE MARKOV 82 9.2. FUNCIONAMIENTO DE UN RECONOCEDOR DE VOZ BASADO EN HMM 83 9.3. LOS TRES PROBLEMAS BÁSICOS DE LA TEORÍA DE HMM 84 9.3.1. Problema 1. 85 9.3.2. Problema 2. 86 9.3.3. Problema 3. 86 10. APLICACIÓN DE MODELOS OCULTOS DE MARKOV 88 10.1. ELEMENTOS BÁSICOS DE CADA MODELO 89 11. PROGRAMACIÓN EN CODEWARRIOR 93 11.1. INICIAR UN PROYECTO NUEVO PARA EL DSP56F805 93 11.2. AGREGAR Y CONFIGURAR LOS BEANS TIMERINT Y ADC 99 12. PWM (Pulse Width Modulation) 114 12.1. GENERACIÓN DE PWM 115 13. IMPLEMENTACIÓN PWM 118 13.1. ALGORITMO 118 13.2. TARJETA DE POTENCIA. 124 14. FUNCIONAMIENTO DEL PROTOTIPO 128 15. PROTOTIPO DE IMPLEMENTACIÓN 130 16. DISEÑO PARA COMERCIALIZACIÓN 138 16.1. ESPECIFICACIONES MOTOR DE DISEÑO 138 16.2. ESPECIFICACIONES MICRÓFONO DE DISEÑO 144 16.3. DISEÑO DE LA SILLA DE RUEDAS 147 CONCLUSIONES 150 BIBLIOGRAFÍA 153 Anexo A. Programa completo del reconocedor 155 Anexo B. Diseño del filtro digital con QEDesign Lite 156 Anexo C. Planos del prototipo 169 Anexo D. Características del DSP56F805 170 Anexo E. Características del VNH2SP30 171 Anexo F. Características del LM4562 172 Anexo G. Manejo de la silla por medio de joystick 173spa
dc.format.mimetypeapplication/pdfspa
dc.language.isospaspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.titleReconocedor de voz para silla de ruedas basado en HMM e implementado en DSPspa
dc.title.translatedWheelchair voice recognizer based on HMM and implemented in DSPeng
dc.degree.nameIngeniero Mecatrónicospa
dc.coverageBucaramanga (Colombia)spa
dc.publisher.grantorUniversidad Autónoma de Bucaramanga UNABspa
dc.rights.localAbierto (Texto Completo)spa
dc.publisher.facultyFacultad Ingenieríaspa
dc.publisher.programPregrado Ingeniería Mecatrónicaspa
dc.description.degreelevelPregradospa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.localTrabajo de Gradospa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.subject.keywordsAutomatic voice recognitioneng
dc.subject.keywordsVoice processing systemseng
dc.subject.keywordsSignal Processingeng
dc.subject.keywordsMechatronic Engineeringeng
dc.subject.keywordsInvestigationseng
dc.subject.keywordsDigital techniqueseng
dc.subject.keywordsStationary signaleng
dc.subject.keywordsScanningeng
dc.subject.keywordsPatternseng
dc.identifier.instnameinstname:Universidad Autónoma de Bucaramanga - UNABspa
dc.identifier.reponamereponame:Repositorio Institucional UNABspa
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2spa
dc.relation.referencesAngarita León, Esteban, Vargas Sánchez, Carolina, Calderón Porras, Eduardo (2007). Reconocedor de voz para silla de ruedas basado en HMM e implementado en DSP. Bucaramanga (Santander, Colombia) : Universidad Autónoma de Bucaramanga UNABspa
dc.relation.referencesAMBARDAR, Ashok. Procesamiento de señales analógicas y digitales. 2 ed. México D.F. : Thomson Editores, 2000. 811p.spa
dc.relation.referencesBERNAL BERMÚDEZ, Jesús, et al. Reconocimiento de voz y fonética acústica. México D.F. : Alfaomega y Ra–ma editorial, 2000. 332p.spa
dc.relation.referencesCÁRDENAS MAESTRE, Laura Constanza y MONTEZUMA GÓMEZ, Libardo Andrés. Sistema de Registro de Señales Eléctricas para Apoyo Diagnóstico de Patologías Cardiácas Basado en Electrocardiografía y DSP. Tesis de Grado. Bucaramanga : UNAB. 2006. 153p.spa
dc.relation.referencesGRUPO DE TRATAMIENTO Avanzado de Señal, Universidad de Cantabria. Análisis Localizado de la Señal en el Dominio del Tiempo. Diapositivas. Disponible en formato PDF.spa
dc.relation.referencesMARI, Jean–Francois, et al. Automatic Word Recognition Based on Second– Order Hidden Markov Models. En IEEE Transactions on speech and audio processind, vol. 5, Nº 1. (Enero, 1997); pág. 22.spa
dc.relation.referencesMAXIM DALLAS SEMICONDUCTOR. The Basics of Anti–Aliasing: Using Switched–Capacitor Filtres. Artículo (Application Note 928). Enero 11 de 2002. Disponible en línea en : http://www.maxim-ic.com/appnotes.cfm/appnote_number/928spa
dc.relation.references[7] MICROSTAR LABORATORIES INC. DAPL IIR Filter Module Manual. Documentación. Disponible en línea en : http://www.mstarlabs.com/docs/manuals/DAPLIFM.PDFspa
dc.relation.referencesMUÑOZ MONER, Antonio Faustino. Sensórica e instrumentación: Mecánica de alta precisión. 2000.spa
dc.relation.referencesOROPEZA RODRÍGUEZ, José Luis. Algoritmos y Métodos Para el Reconocimiento de Voz en Español Mediante Sílabas. En Computación y Sistemas, vol.9, Nº3, pág. 270. Disponible en formato PDF.spa
dc.relation.referencesRABINER, Lawrence R. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. En Proceedings of the IEEE, vol.77, Nº2. (Febrero, 1989); pág. 257.spa
dc.relation.referencesRAMÍREZ ROJAS, Juan Carlos. Control de Velocidad de los Motores de Corriente Continua de una Silla de Ruedas. Trabajo de Grado. Bucaramanga, UIS. 2003. 178h.spa
dc.relation.referencesRÍOS MAESTRE, Antonio. Universidad Autónoma de Barcelona. Capítulo 4 Fonemas y Alófonos del Español. Estudios de Lingüística Española, revista universitaria electrónica, vol. 4, 1999. Disponible en línea en : http://elies.rediris.es/elies4/Cap4.htmspa
dc.relation.referencesSOLIMAN, Samir S. Señales y sistemas: continuos y discretos. Madrid : Prentice Hall, 1999. 542p.spa
dc.relation.referencesTHE DIGITAL SIGNAL processing handbook. Salem : CRC Press, 1998.spa
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000461849*
dc.contributor.cvlacChío Cho, Nayibe [0000375918]
dc.contributor.googlescholarChío Cho, Nayibe [mModWy8AAAAJ]
dc.contributor.orcidChío Cho, Nayibe [0000-0002-9459-4350]
dc.contributor.researchgateChío Cho, Nayibe [Nayibe_Chio]
dc.subject.lembReconocimiento automático de la vozspa
dc.subject.lembSistemas de procesamiento de la vozspa
dc.subject.lembProcesamientos de señalesspa
dc.subject.lembIngeniería mecatrónicaspa
dc.subject.lembInvestigacionesspa
dc.subject.lembTécnicas digitalesspa
dc.description.abstractenglishThe developed speech recognizer aims to identify five (5) different commands, spoken by a speaker who has previously performed the training phase of the system. In this phase, the user must pronounce several repetitions of each of the voice commands for the training algorithm to create the comparison patterns. The voice is acquired through an omnidirectional microphone and the signal is limited in frequency with an antialiasing bandpass filter. The digital processing of the obtained signal is carried out with a Motorola DSP56F805EVM card. A / D conversion is performed first at 12 bit resolution. The resulting samples are processed with a type IIR digital filter that allows the spectrum to pass between 0.3 and 3.4 KHz corresponding to the interval of interest. This is where the programming of the DSP chip becomes important, allowing the processing of the signal in real time, a necessary characteristic for the execution of the voice recognition algorithm based on hidden Markov models (MOM or HMM). The signal that results after the digital filter is calculated with the energy contour, after a segmentation and windowing process. In the algorithm, this process is used to determine at the same time the vector of observations O, according to the MOM theory. The speech recognition algorithm includes the forward, backward, and Baum-Welch algorithms, whose calculations allow probabilities to be obtained and compared. Comparisons, depending on the purpose be it training or reconnaissance, will serve respectively to optimize the models of each command or to identify the action that the system must perform according to the command entered: forward, backward, left, right, stop. Actions are carried out through the PWM and GPIO ports of the DSP chip. The signals are sent to a VNH2SP30-E power card for each of the motors (main and steering). These cards receive the PWM and polarity signals for managing the speed and direction of rotation of the motors.eng
dc.subject.proposalSeñal estacionariaspa
dc.subject.proposalEscaneospa
dc.subject.proposalPatronesspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TP
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.contributor.researchgroupGrupo de Investigación Control y Mecatrónica - GICYMspa
dc.contributor.researchgroupGrupo de Investigaciones Clínicasspa
dc.contributor.apolounabChío Cho, Nayibe [nayibe-chío-cho]
dc.coverage.campusUNAB Campus Bucaramangaspa
dc.description.learningmodalityModalidad Presencialspa
dc.contributor.linkedinChío Cho, Nayibe [nayibe-chio-cho-41a17724]


Ficheros en el ítem

Thumbnail
Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Atribución-NoComercial-SinDerivadas 2.5 Colombia
Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 2.5 Colombia