Advanced search options

Advanced Search Options 🞨

Browse by author name (“Author name starts with…”).

Find ETDs with:

in
/  
in
/  
in
/  
in

Written in Published in Earliest date Latest date

Sorted by

Results per page:

You searched for id:"handle:10486/678952". One record found.

Search Limiters

Last 2 Years | English Only

No search limiters apply to these results.

▼ Search Limiters

1. López Moreno, Ignacio. Deep Neural Network Architectures for Large-scale, Robust and Small-Footprint Speaker and Language Recognition.

Degree: 2017, Universidad Autónoma de Madrid

Las redes neuronales artificiales son sistemas de aprendizaje capaces de extraer la información embebida en las señales de voz. Son capaces de modelar de forma eficiente secuencias temporales complejas, con información no lineal y distribuida en distintos niveles semanticos, mediante el uso de algoritmos de optimización integral con la capacidad potencial de mejorar los sistemas aprendizaje automático existentes. Las redes neuronales artificiales son, pues, una tecnología prometedora para mejorar el reconocimiento automático de locutores e idiomas; siendo el reconocimiento de de locutores e idiomas, tareas con cada vez más demanda en los nuevos sistemas de control por voz, que ya utilizan millones de personas. Esta tesis tiene como objetivo la mejora del estado del arte de las tecnologías de reconocimiento de locutor y de idioma mediante la formulación, implementación y análisis empírico de nuevos enfoques basados en redes neuronales, aplicables a dispositivos portátiles y a su uso en gran escala. Las principales contribuciones de esta tesis incluyen la propuesta original de: (1) arquitecturas eficientes que hacen uso de capas neuronales densas, localmente densas, recurrentes y convolucionales; (2) una nueva estrategia de combinación de enfoques clásicos y enfoques basados en el uso de las denominadas redes de cuello de botella; (3) el diseño del primer sistema público de reconocimiento de voz, de vocabulario abierto y continuo, que es además multilingüe; y (4) la propuesta de un nuevo algoritmo de optimización integral para tareas de reconocimiento de locutor, aplicable también a otras tareas de verificación. Los resultados experimentales extraídos de esta tesis han demostrado que las redes neuronales artificiales son capaces de reducir el número de parámetros usados por los algoritmos de reconocimiento tradicionales, así como de mejorar el rendimiento de dichos sistemas de forma substancial. Dicha mejora relativa puede acentuarse a través del modelado de voz mediante redes recurrentes de memoria a largo plazo, el uso de algoritmos de optimización integral, el uso de locuciones de evaluation de corta duración y mediante la optimización del sistema con grandes cantidades de datos de entrenamiento. Advisors/Committee Members: González Rodríguez, Joaquín (dir.), González Domínguez, Javier (dir.), UAM. Departamento de Tecnología Electrónica y de las Comunicaciones.

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

López Moreno, I. (2017). Deep Neural Network Architectures for Large-scale, Robust and Small-Footprint Speaker and Language Recognition. (Thesis). Universidad Autónoma de Madrid. Retrieved from http://hdl.handle.net/10486/678952

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Chicago Manual of Style (16th Edition):

López Moreno, Ignacio. “Deep Neural Network Architectures for Large-scale, Robust and Small-Footprint Speaker and Language Recognition.” 2017. Thesis, Universidad Autónoma de Madrid. Accessed September 24, 2017. http://hdl.handle.net/10486/678952.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

MLA Handbook (7th Edition):

López Moreno, Ignacio. “Deep Neural Network Architectures for Large-scale, Robust and Small-Footprint Speaker and Language Recognition.” 2017. Web. 24 Sep 2017.

Vancouver:

López Moreno I. Deep Neural Network Architectures for Large-scale, Robust and Small-Footprint Speaker and Language Recognition. [Internet] [Thesis]. Universidad Autónoma de Madrid; 2017. [cited 2017 Sep 24]. Available from: http://hdl.handle.net/10486/678952.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Council of Science Editors:

López Moreno I. Deep Neural Network Architectures for Large-scale, Robust and Small-Footprint Speaker and Language Recognition. [Thesis]. Universidad Autónoma de Madrid; 2017. Available from: http://hdl.handle.net/10486/678952

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

.