Última actualización: 17/05/2019


Curso Académico: 2019/2020

Procesado del habla y el lenguaje natural
(18067)
Titulación: Máster Universitario en Ingeniería de la información para la salud (359)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: PELAEZ MORENO, CARMEN

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Optativa
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Competencias que adquiere el estudiante y resultados del aprendizaje.
Competencias Básicas CB6 Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación. CB7 Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio. CB8 Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios. CB9 Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades. CB10 Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo. Competencias generales: CG2 Capacidad para aplicar los conocimientos de las habilidades y métodos de investigación relacionados con las Ingenierías. CG3 Capacidad para aplicar los conocimientos de las habilidades y métodos de investigación relacionados con las Ciencias de la Vida. CG4 Capacidad para contribuir a la ampliación de las fronteras del conocimiento a través de una investigación original, parte de la cual merezca la publicación referenciada a nivel internacional. CG5 Habilidad para realizar un análisis crítico y de evaluación y síntesis de ideas nuevas y complejas. CG6 Habilidad para comunicarse con la comunidad académica y científica y con la sociedad en general acerca de sus ámbitos de conocimiento en los modos e idiomas de uso habitual en su comunidad científica internacional. Competencias específicas: CE8 Habilidad para manejar con soltura los conceptos y fundamentos matemáticos necesarios para el análisis, diseño e implementación de algoritmos de aprendizaje automático para su funcionamiento bajo unas especificaciones dadas y en particular en el ámbito del habla y el lenguaje natural. CE9 Habilidad en el manejo de técnicas avanzadas de aprendizaje automático para su aplicación en el ámbito de la biomedicina.
Descripción de contenidos: Programa
Procesado del habla y el lenguaje natural Unidad 0. Introducción a las tecnologías del habla y el lenguaje Unidad 1. El Sistema auditivo y la perpeción de la voz Unidad 2. El sistema fonador. Codificación de voz y audio. Unidad 3. Reconocimiento de habla Extracción de características. Modelos acústicos. Reconocimiento de extremo a extremo y modelos con aprendizaje profundo. Unidad 4. Reconocimiento de hablante y biometría. Unidad 5. Fundamentos de la mejora de voz Unidad 6. Procesado del lenguaje natural Pipelines lingüisticos para procesado de texto. Modelos de lenguaje Aprendizaje profundo en Procesado del Lenguaje natural: análisis léxico y parsing. Aprendizaje profundo en Procesado del Lenguaje natural: comprensión del lenguaje Unidad 7. Applicaciones a salud Clasificación de textos y modelado de tópicos Computación afectiva: Detección e identificación de emociones y sentimientos Detección de patologías
Actividades formativas, metodología a utilizar y régimen de tutorías
Actividades formativas: Se proponen varios tipos de actividades formativas: clases de teorico-prácticas, prácticas guiadas en laboratorio y proyecto final de laboratorio. Se adoptarán varios tipos de metodologías: clases magistrales, aprendizaje invertido y aprendizaje basado en problemas (con cantidad variable de supervisión y alcance) y gamificación. CLASES DE TEORICO-PRACTICAS (3.5 ECTS) Las clases de teoría proporcionan una visión general de los principales conceptos teóricos y matemáticos en la representación y procesado del habla y el lenguaje natural así como de las herramientas analíticas utilizadas para su procesado. En estas clases se introducirán ejemplos en el laboratorio dentro de las exposiciones teóricas: todas las sesiones formativas que sea posible se van a llevar a cabo en el laboratorio lo que nos permite que todos los alumnos puedan utilizar un ordenador. Los ejemplos estarán imbricados en la exposición teórica proporcionando gran dinamismo a la clase. Por otra parte, esto nos permite introducir conceptos y herramientas básicas que solucionen las diferencias en formación previa. Además todos los temas se iniciarán con un debate sobre sus implicaciones tecnológicas. Para hacerlo efectivo se utilizaran técnicas de aprendizaje invertido (flipping the classroom). En concreto, se proporcionará previamente a los alumnos un vídeo seleccionado para provocar el debate y la participación, junto con una serie de preguntas que les ayuden a reflexionar y que el profesor no responderá de forma concluyente. De esta manera se pretende provocar curiosidad por averiguar los componentes de las tecnologías que se explicarán en las siguientes sesiones de cada tema. GAMIFICACIÓN (1.5 ECTS) Se ilustrará el proceso de publicación científica mediante un juego de roles. Los alumnos deberán formar equipos en los que adquirirán los siguientes roles: un editor, dos revisores y dos autores. Se proporcionarán unas guías con requisitos y formularios para realizar las labores propias de cada rol junto con una fechas tope (deadlines para las fases de revisión, respuesta y decisión del editor). Se asignará un artículo a cada equipo (que todos los alumnos de la asignatura deberán leer) y se expondrá en clase el proceso. De esta manera se promociona el trabajo en equipo, se incorpora la lectura crítica y activa de artículos de investigación y se soluciona el problema del número excesivo de alumnos necesario para evaluar y sacar provecho colectivo de las presentaciones individuales anterior. Además, el resto de alumnos realizarán un cuestionario al final para evaluar la comprensión del artículo y promover el seguimiento e interés durante la exposición. PROYECTO FINAL (1 ECTS) Los alumnos realizarán un proyecto en el que programarán un sistema modular completo relacionado con las temáticas explicadas en clase. Se proporcionará a los alumnos unas guías básicas y se impartirán unas sesiones preparatorias utilizando las técnicas del Problem Based Learning.
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100
Bibliografía básica
  • Ben Gold (Author), Nelson Morgan (Author), Dan Ellis (Author). Speech and Audio Signal Processing: Processing and Perception of Speech and Music. Wiley. 2011
  • Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed.). Prentice Hall. 2018
  • Yu, Dong, Deng, Li. Automatic Speech Recognition. Springer. 2015
Bibliografía complementaria
  • Christopher D. Manning (Author), Hinrich Schütze (Author). Foundations of Statistical Natural Language Processing. MIT Press. 1999
  • Li Deng (Editor), Yang Liu (Editor). Deep Learning in Natural Language Processing. Springer. 2018

El programa de la asignatura y la planificación semanal podrían sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.