PAJARES MARTINSANZ, GONZU00E1LO
Gracias al avance de los dispositivos que incorporan sistemas automáticos con diferentes propósitos, este tema de reconocimiento de voz es un tema en continuo auge y como ejemplo de ello tenemos los robots y sistemas inteligentes, la telefonía móvil, los traductores e intérpretes automáticos o el más reciente paradigma conocido como Internet de las Cosas (Internet of Things, IOT).
La base en los reconocedores automáticos de voz son las señales acústicas, que representan unidades del habla (palabras, sílabas, fonemas). Dichas señales son en realidad secuencias de valores discretos a lo largo del tiempo. Bajo esta perspectiva, el libro aborda dos aspectos clave. Primero, establece las bases sobre el análisis de señales acústicas, introduciendo conceptos y técnicas necesarias para su tratamiento y en segundo lugar, aplica tales conceptos y técnicas para concretar los fundamentos y llegar al desarrollo de las técnicas de reconocimiento propuestas, obteniendo así las propiedades que caracterizan una unidad de voz con fines de su reconocimiento. Estas propiedades son a veces suficientes, sin embargo, constituyen la entrada para los reconocedores más avanzados basados en técnicas de aprendizaje, que quedan fuera del ámbito del presente texto (debido a que este aspecto es ampliamente abordado en la literatura especializada). Pero, si hablamos de la conjunción de conceptos y técnicas sobre el tratamiento de señales y la extracción de características, es ahí donde radica el valor añadido de este libro, que proporciona, con la claridad y ejemplos ilustrativos suficientes, los conceptos esenciales en sendos ámbitos. ésta es la razón fundamental por la que se publica la obra, siendo conscientes de la necesidad de un texto con las características reunidas por este.
El libro consta de ocho capítulos, de suerte que al tratamiento de señales se dedican los capítulos dos a cinco, mientras que los capítulos seis a ocho se centran en la extracción de características.
VENTAJAS
La unión del tratamiento de señales y la extracción de características hacen que este texto sea autosuficiente, de suerte que el lector, incluso sin ser experto en los conceptos relativos al tratamiento de señales, puede abordar sin dificultad los contenidos del libro, para llegar al desarrollo de sus propios reconocedores. Sin duda, este hecho otorga un valor añadido de interés a la obra.
CONOZCA
• Desde el punto de vista computacional que el fundamento del análisis de voz, y por tanto su reconocimiento, está basado en una primera etapa en la generación y tratamiento de señales temporales digitales.rn• Respecto a las técnicas mencionadas sobre reconocimiento de voz mediante técnicas de aprendizaje automático destacan aquellas basadas en clasificadores, tales como Bayes, K-vecinos más cercanos, perceptrón, árboles de decisión o máquinas vectores soporte o las más recientes que incluyen aprendizaje profundo, por mencionar solo algunas. rn• Existen otras técnicas de naturaleza estocástica tales como los modelos ocultos de Markov (Hidden Markov Models, HMM). Un HMM se caracteriza por presentar una arquitectura basada en nodos con sus correspondientes estados y probabilidades de transición entre estados.
APRENDA
• Que los sistemas de reconocimiento de voz se fundamentan en el análisis de las señales generadas o recibidas a través de los sistemas físicos de emisión o recepción con el fin de conseguir su interpretación. rn• Que hoy día los numerosos dispositivos existentes en el mercado están equipados con sistemas de captura y reconocimiento de la voz, con desarrollos basados en interfaces de usuario.rn• Otro ámbito donde el tratamiento de las señales de sonido cobra especial relevancia: en los vehículos inteligentes, en donde los sistemas de reconocimiento de voz están llamados a jugar un importante papel de cara al uso razonable de los dispositivos que necesiten intervención humana, minimizando así el riesgo de potenciales accidentes con el consiguiente incremento de la seguridad vial.
A QUIéN VA DIRIGIDO
Este libro está dirigido a desarrolladores, ingenieros, investigadores o estudiantes universitarios encuentran en el libro una referencia de base de suma utilidad para abordar los aspectos conceptuales y de implementación en el desarrollo de reconocedores automáticos de voz, particularmente para quienes se inicien en la materia por su carácter didáctico y autocontenido.rn