Última actualización: 28/04/2023


Curso Académico: 2024/2025

Tecnologías del Habla para Salud
(18848)
Máster Universitario en Ingeniería de la información para la salud (Plan: 427 - Estudio: 359)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: PELAEZ MORENO, CARMEN

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Optativa
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Objetivos
En Tecnologías del Habla para la Salud se adquirirán conocimientos sobre: · Los mecanismos de producción y percepción de la voz y sus categorías lingüísticas. · El estado del arte y los fundamentos de los codificadores de voz y audio, el reconocimiento automático de voz, la síntesis de voz o conversión texto-voz, reconocimiento e identificación de locutor y sistemas diálogo. · Sus aplicaciones para la salud. Además se adquirirán las siguientes habilidades: · Destrezas básicas para la investigación en codificadores de voz y audio, el reconocimiento automático de voz, la síntesis de voz o conversión texto-voz, reconocimiento e identificación de locutor y sistemas diálogo. · Capacidad para aplicar los conocimientos sobre Tecnologías del Habla para la investigación en salud. Del catálogo de competencias definidas en la titulación se abordan: Competencias Básicas CB6 Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación. CB7 Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio. CB8 Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios. CB9 Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades. CB10 Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo. Competencias generales: CG2 Capacidad para aplicar los conocimientos de las habilidades y métodos de investigación relacionados con las Ingenierías. CG3 Capacidad para aplicar los conocimientos de las habilidades y métodos de investigación relacionados con las Ciencias de la Vida. CG4 Capacidad para contribuir a la ampliación de las fronteras del conocimiento a través de una investigación original, parte de la cual merezca la publicación referenciada a nivel internacional. CG5 Habilidad para realizar un análisis crítico y de evaluación y síntesis de ideas nuevas y complejas. CG6 Habilidad para comunicarse con la comunidad académica y científica y con la sociedad en general acerca de sus ámbitos de conocimiento en los modos e idiomas de uso habitual en su comunidad científica internacional. Competencias específicas: CE8 Habilidad para manejar con soltura los conceptos y fundamentos matemáticos necesarios para el análisis, diseño e implementación de algoritmos de aprendizaje automático para su funcionamiento bajo unas especificaciones dadas y en particular en el ámbito del habla y el lenguaje natural. CE9 Habilidad en el manejo de técnicas avanzadas de aprendizaje automático para su aplicación en el ámbito de la biomedicina.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
Unidad 0. Introducción a las tecnologías del habla Unidad 1. El Sistema auditivo y la perpeción de la voz Unidad 2. El sistema fonador. Codificación de voz y audio. Unidad 3. Reconocimiento de habla. · Extracción de características. · Modelos acústicos y de lenguaje. · Reconocimiento de extremo a extremo y modelos con aprendizaje profundo. Unidad 4. Reconocimiento de hablante y biometría. Unidad 5. Síntesis de voz Unidad 6. Applicaciones a salud · Computación afectiva: Detección e identificación de emociones y sentimientos · Detección de patologías
Actividades formativas, metodología a utilizar y régimen de tutorías
Se proponen varios tipos de actividades formativas: clases de teorico-prácticas, prácticas guiadas en laboratorio y proyecto final de laboratorio. Se adoptarán varios tipos de metodologías: clases magistrales, aprendizaje invertido y aprendizaje basado en problemas (con cantidad variable de supervisión y alcance) y gamificación. CLASES DE TEÓRICO-PRÁCTICAS (1.5 ECTS) Las clases de teoría proporcionan una visión general de los principales conceptos teóricos y matemáticos en la representación y procesado del habla así como de las herramientas analíticas utilizadas para su procesado. En estas clases se introducirán ejemplos en el laboratorio dentro de las exposiciones teóricas: todas las sesiones formativas que sea posible se van a llevar a cabo en el laboratorio lo que nos permite que todos los alumnos puedan utilizar un ordenador. Los ejemplos estarán imbricados en la exposición teórica proporcionando gran dinamismo a la clase. Por otra parte, esto nos permite introducir conceptos y herramientas básicas que solucionen las diferencias en formación previa. Además todos los temas se iniciarán con un debate sobre sus implicaciones tecnológicas. Para hacerlo efectivo se utilizaran técnicas de aprendizaje invertido (flipping the classroom). En concreto, se proporcionará previamente a los alumnos un vídeo seleccionado para provocar el debate y la participación, junto con una serie de preguntas que les ayuden a reflexionar y que el profesor no responderá de forma concluyente. De esta manera se pretende provocar curiosidad por averiguar los componentes de las tecnologías que se explicarán en las siguientes sesiones de cada tema. GAMIFICACIÓN (0.75 ECTS) Se ilustrará el proceso de publicación científica mediante un juego de roles. Los alumnos deberán formar equipos en los que adquirirán los siguientes roles: editor, revisores y autores. Se proporcionarán unas guías con requisitos y formularios para realizar las labores propias de cada rol junto con una fechas tope (deadlines para las fases de revisión, respuesta y decisión del editor). Se asignará un artículo a cada equipo (que todos los alumnos de la asignatura deberán leer) y se expondrá en clase el proceso. De esta manera se promociona el trabajo en equipo, se incorpora la lectura crítica y activa de artículos de investigación y se soluciona el problema del número excesivo de alumnos necesario para evaluar y sacar provecho colectivo de las presentaciones individuales anterior. Además, el resto de alumnos realizarán un cuestionario al final para evaluar la comprensión del artículo y promover el seguimiento e interés durante la exposición. PROYECTO FINAL (0.75 ECTS) Los alumnos realizarán un proyecto en el que programarán un sistema modular completo relacionado con las temáticas explicadas en clase. Se proporcionará a los alumnos unas guías básicas y se impartirán unas sesiones preparatorias utilizando las técnicas del Problem Based Learning.
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100

Calendario de Evaluación Continua


Bibliografía básica
  • Ben Gold (Author), Nelson Morgan (Author), Dan Ellis (Author) . Speech and Audio Signal Processing: Processing and Perception of Speech and Music. Wiley. 2011
  • Dan Jurafsky and James H. Martin . Speech and Language Processing (3rd ed.). Prentice Hall. 2018
  • Yu, Dong, Deng, Li . Automatic Speech Recognition. Springer. 2015
Bibliografía complementaria
  • Amy Neustein (Editor), Jenay M. Beer (Contributor), Conrad Bzura (Contributor) et al. Speech and Automata in Health Care. De Gruyter. 2014
  • Amy Neustein (Editor), Hemant A. Patil (Editor) . Acoustic Analysis of Pathologies: From Infancy to Young Adulthood. De Gruyter. 2020
  • Deborah Dahl (Author), Katharine Beals (Author), Marcia Linebarger (Author), Ruth Fink (Author). Speech and Language Technology for Language Disorders . De Gruyter. 2015
  • Rupayan Chakraborty, Meghna Pandharipande, Sunil Kumar Kopparapu. Analyzing Emotion in Spontaneous Speech. Springer. 2018

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.