Ficha

English version

Curso Académico: 2025/2026

Tecnologías del habla para salud

(19293)

Máster Universitario en Aprendizaje Automático para la Salud (Plan: 480 - Estudio: 359)

Escuela de Ingeniería y Ciencias Básicas

Coordinador/a: PELAEZ MORENO, CARMEN

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Optativa

Créditos: 3.0 ECTS

Curso: 1º

Cuatrimestre: 2º

Objetivos

En Tecnologías del Habla para la Salud se adquirirán conocimientos sobre: · Los mecanismos de producción y percepción de la voz y sus categorías lingüísticas. · El estado del arte y los fundamentos de los codificadores de voz y audio, el reconocimiento automático de voz, la síntesis de voz o conversión texto-voz, reconocimiento e identificación de locutor y sistemas diálogo. · Sus aplicaciones para la salud. Además se adquirirán las siguientes habilidades: · Destrezas básicas para la investigación en codificadores de voz y audio, el reconocimiento automático de voz, la síntesis de voz o conversión texto-voz, reconocimiento e identificación de locutor y sistemas diálogo. · Capacidad para aplicar los conocimientos sobre Tecnologías del Habla para la investigación en salud.

Resultados del proceso de formación y aprendizaje

Enlace al documento

Descripción de contenidos: Programa

Unidad 0. Introducción a las tecnologías del habla Unidad 1. El Sistema auditivo y la percepción de la voz Unidad 2. El sistema fonador. Codificación de voz y audio. Unidad 3. Reconocimiento de habla. · Extracción de características. · Modelos acústicos y de lenguaje. · Reconocimiento de extremo a extremo y modelos con aprendizaje profundo. Unidad 4. Reconocimiento de hablante y biometría. Unidad 5. Síntesis de voz. Unidad 6. Análisis clínico del habla y paralingüística. Unidad 7. IA conversacional para tecnología de asistencia. Unidad 8. Trastornos del habla y neuroprótesis. Unidad 9. Trastornos auditivos y audífonos e implantes.

Actividades formativas, metodología a utilizar y régimen de tutorías

Se proponen varios tipos de actividades formativas: clases de teorico-prácticas (AF3) que incluyen prácticas guiadas en laboratorio (AF4 y AF6), proyecto final de laboratorio (AF6) y discusiones o debates sobre cuestiones clave del estado del arte basadas en la lectura de artículos y materiales audiovisuales (AF6-AF7-AF8). Se establecen 2 horas a la semana de tutorias para el alumnado donde el profesorado está disponible en su despacho (AF5) Se adoptarán varios tipos de metodologías: clases magistrales (MD1), aprendizaje invertido (MD2) y aprendizaje basado en problemas (con cantidad variable de supervisión y alcance, MD3) y gamificación (MD4 y MD5). CLASES DE TEÓRICO-PRÁCTICAS Las clases de teoría proporcionan una visión general de los principales conceptos teóricos y matemáticos en la representación y procesado del habla así como de las herramientas analíticas utilizadas para su procesado. En estas clases se introducirán ejemplos en el laboratorio dentro de las exposiciones teóricas: todas las sesiones formativas que sea posible se van a llevar a cabo en el laboratorio lo que nos permite que todo el alumnado pueda utilizar un ordenador. Los ejemplos estarán imbricados en la exposición teórica proporcionando gran dinamismo a la clase. Por otra parte, esto nos permite introducir conceptos y herramientas básicas que solucionen las diferencias en formación previa. Además todos los temas se iniciarán con un debate sobre sus implicaciones tecnológicas. Para hacerlo efectivo se utilizaran técnicas de aprendizaje invertido (flipping the classroom). En concreto, se proporcionará previamente al alumnado un vídeo seleccionado para provocar el debate y la participación, junto con una serie de preguntas que les ayuden a reflexionar y que la profesora no responderá de forma concluyente. De esta manera se pretende provocar curiosidad por averiguar los componentes de las tecnologías que se explicarán en las siguientes sesiones de cada tema. GAMIFICACIÓN Se ilustrará el proceso de adquisición de conocimiento científico mediante un debate en el estilo de Oxford. El alumnado deberán formar equipos en los que adquirirá el rol de defensor o detractor de una moción relacionada con algún aspecto tratado en las clases. Se proporcionarán unas guías con requisitos y formularios para realizar las labores propias de cada rol. El alumnado deberá argumentar sus posiciones en base a evidencias científicas adquiridas a través de la lectura de artículos u otras fuentes solventes. De esta manera se promociona el trabajo en equipo, se incorpora la lectura crítica y activa de artículos de investigación. PROYECTO FINAL Cada pareja de estudiantes realizará un proyecto en el que programarán un sistema modular completo relacionado con las temáticas explicadas en clase. Se proporcionará al alumnado unas guías básicas y se impartirán unas sesiones preparatorias utilizando las técnicas del Problem Based Learning.

Sistema de evaluación

Peso porcentual del Examen/Prueba Final 0
Peso porcentual del resto de la evaluación 100

Calendario de Evaluación Continua

Convocatoria ordinaria:
· Presentación y discusión de artículos de investigación (debate) (30%, SE1-SE2)
· Prácticas de laboratorio (30%, SE3) 
· Participación en clase, tests wooclap (10%, SE1)
· Proyecto final (30%, SE2) 
Convocatoria extraordinaria:
· Presentación de artículos de investigación (30%, SE2) 
· Prácticas de laboratorio (30%, SE3) 
· Proyecto final (40%, SE2)

Bibliografía básica

Ben Gold (Author), Nelson Morgan (Author), Dan Ellis (Author) . Speech and Audio Signal Processing: Processing and Perception of Speech and Music. Wiley. 2011
Dan Jurafsky and James H. Martin . Speech and Language Processing (3rd ed.). Prentice Hall. 2025
Yu, Dong, Deng, Li . Automatic Speech Recognition. Springer. 2015

Bibliografía complementaria

Amy Neustein (Editor), Jenay M. Beer (Contributor), Conrad Bzura (Contributor) et al. Speech and Automata in Health Care. De Gruyter. 2014
Amy Neustein (Editor), Hemant A. Patil (Editor) . Acoustic Analysis of Pathologies: From Infancy to Young Adulthood. De Gruyter. 2020
Deborah Dahl (Author), Katharine Beals (Author), Marcia Linebarger (Author), Ruth Fink (Author). Speech and Language Technology for Language Disorders . De Gruyter. 2015
Rupayan Chakraborty, Meghna Pandharipande, Sunil Kumar Kopparapu. Analyzing Emotion in Spontaneous Speech. Springer. 2018

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.