Última actualización: 26/04/2024


Curso Académico: 2024/2025

Tecnologías del habla para salud
(19293)
Máster Universitario en Aprendizaje Automático para la Salud (Plan: 480 - Estudio: 359)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: PELAEZ MORENO, CARMEN

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Optativa
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Objetivos
En Tecnologías del Habla para la Salud se adquirirán conocimientos sobre: · Los mecanismos de producción y percepción de la voz y sus categorías lingüísticas. · El estado del arte y los fundamentos de los codificadores de voz y audio, el reconocimiento automático de voz, la síntesis de voz o conversión texto-voz, reconocimiento e identificación de locutor y sistemas diálogo. · Sus aplicaciones para la salud. Además se adquirirán las siguientes habilidades: · Destrezas básicas para la investigación en codificadores de voz y audio, el reconocimiento automático de voz, la síntesis de voz o conversión texto-voz, reconocimiento e identificación de locutor y sistemas diálogo. · Capacidad para aplicar los conocimientos sobre Tecnologías del Habla para la investigación en salud.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
Unidad 0. Introducción a las tecnologías del habla Unidad 1. El Sistema auditivo y la percepción de la voz Unidad 2. El sistema fonador. Codificación de voz y audio. Unidad 3. Reconocimiento de habla. · Extracción de características. · Modelos acústicos y de lenguaje. · Reconocimiento de extremo a extremo y modelos con aprendizaje profundo. Unidad 4. Reconocimiento de hablante y biometría. Unidad 5. Síntesis de voz Unidad 6. Applicaciones a salud · Computación afectiva: Detección e identificación de emociones y sentimientos · Detección de patologías
Actividades formativas, metodología a utilizar y régimen de tutorías
Se proponen varios tipos de actividades formativas: clases de teorico-prácticas (AF3) que incluyen prácticas guiadas en laboratorio (AF4 y AF6), proyecto final de laboratorio (AF6) y discusiones o debates sobre cuestiones clave del estado del arte basadas en la lectura de artículos y materiales audiovisuales (AF6-AF7-AF8). Se establecen 2 horas a la semana de tutorias para el alumnado donde el profesorado está disponible en su despacho (AF5) Se adoptarán varios tipos de metodologías: clases magistrales (MD1), aprendizaje invertido (MD2) y aprendizaje basado en problemas (con cantidad variable de supervisión y alcance, MD3) y gamificación (MD4 y MD5). CLASES DE TEÓRICO-PRÁCTICAS Las clases de teoría proporcionan una visión general de los principales conceptos teóricos y matemáticos en la representación y procesado del habla así como de las herramientas analíticas utilizadas para su procesado. En estas clases se introducirán ejemplos en el laboratorio dentro de las exposiciones teóricas: todas las sesiones formativas que sea posible se van a llevar a cabo en el laboratorio lo que nos permite que todo el alumnado pueda utilizar un ordenador. Los ejemplos estarán imbricados en la exposición teórica proporcionando gran dinamismo a la clase. Por otra parte, esto nos permite introducir conceptos y herramientas básicas que solucionen las diferencias en formación previa. Además todos los temas se iniciarán con un debate sobre sus implicaciones tecnológicas. Para hacerlo efectivo se utilizaran técnicas de aprendizaje invertido (flipping the classroom). En concreto, se proporcionará previamente al alumnado un vídeo seleccionado para provocar el debate y la participación, junto con una serie de preguntas que les ayuden a reflexionar y que la profesora no responderá de forma concluyente. De esta manera se pretende provocar curiosidad por averiguar los componentes de las tecnologías que se explicarán en las siguientes sesiones de cada tema. GAMIFICACIÓN Se ilustrará el proceso de publicación científica mediante un juego de roles. El alumnado deberán formar equipos en los que adquirirá los siguientes roles: de edición, revisión o evaluación y autoría. Se proporcionarán unas guías con requisitos y formularios para realizar las labores propias de cada rol junto con una fechas tope (deadlines para las fases de revisión, respuesta y decisión). Se asignará un artículo a cada equipo (que todos los alumnos de la asignatura deberán leer) y se expondrá en clase el proceso debatiendo sobre aspectos del estado del arte de las tecnologías del habla aplicadas a la salud. De esta manera se promociona el trabajo en equipo, se incorpora la lectura crítica y activa de artículos de investigación y se soluciona el problema del número excesivo de estudiantes necesario para evaluar y sacar provecho colectivo de las presentaciones individuales anterior. Además, el resto de estudiantes realizarán un cuestionario al final para evaluar la comprensión del artículo y promover el seguimiento e interés durante la exposición. PROYECTO FINAL Cada pareja de estudiantes realizará un proyecto en el que programarán un sistema modular completo relacionado con las temáticas explicadas en clase. Se proporcionará al alumnado unas guías básicas y se impartirán unas sesiones preparatorias utilizando las técnicas del Problem Based Learning.
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100

Calendario de Evaluación Continua


Bibliografía básica
  • Ben Gold (Author), Nelson Morgan (Author), Dan Ellis (Author) . Speech and Audio Signal Processing: Processing and Perception of Speech and Music. Wiley. 2011
  • Dan Jurafsky and James H. Martin . Speech and Language Processing (3rd ed.). Prentice Hall. 2018
  • Yu, Dong, Deng, Li . Automatic Speech Recognition. Springer. 2015
Bibliografía complementaria
  • Amy Neustein (Editor), Jenay M. Beer (Contributor), Conrad Bzura (Contributor) et al. Speech and Automata in Health Care. De Gruyter. 2014
  • Amy Neustein (Editor), Hemant A. Patil (Editor) . Acoustic Analysis of Pathologies: From Infancy to Young Adulthood. De Gruyter. 2020
  • Deborah Dahl (Author), Katharine Beals (Author), Marcia Linebarger (Author), Ruth Fink (Author). Speech and Language Technology for Language Disorders . De Gruyter. 2015
  • Rupayan Chakraborty, Meghna Pandharipande, Sunil Kumar Kopparapu. Analyzing Emotion in Spontaneous Speech. Springer. 2018

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.