Ficha

English version

Curso Académico: 2025/2026

Aplicaciones del Tratamiento de Voz, Audio, Imagen y Vídeo

(15936)

Máster Universitario en Ingeniería de Telecomunicación (Plan: 171 - Estudio: 227)

Escuela de Ingeniería y Ciencias Básicas

Coordinador/a: GALLARDO ANTOLIN, ASCENSION

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Optativa

Créditos: 3.0 ECTS

Curso: 2º

Cuatrimestre: 1º

Objetivos

OBJETIVOS Al igual que en el resto de asignaturas optativas del Máster, el alumno adquirirá una mayor especialización en áreas concretas de las tecnologías del ámbito de las Telecomunicaciones. Particularmente, en esta asignatura se cubrirán los siguientes conocimientos específicos en Tratamiento de Señal: - Fundamentos matemáticos del tratamiento de señales. - Conocimiento generales sobre potenciales aplicaciones del tratamiento de voz, audio, imagen y vídeo. - Subsistemas básicos de las aplicaciones de tratamiento de voz, audio, imagen y vídeo. - Utilización de software para el tratamiento de voz, audio, imagen y vídeo. - Manejo de las herramientas básicas de procesado. - Resolución de problemas de tratamiento de voz, audio, imagen y vídeo mediante combinación de herramientas básicas.

Resultados del proceso de formación y aprendizaje

Enlace al documento

Descripción de contenidos: Programa

El objetivo de esta asignatura es proporcionar una introducción a las técnicas más recientes de tratamiento de señales con aplicación a voz, audio, imagen y vídeo, siguiendo para ello una aproximación de Aprendizaje Basado en Proyectos. Por tanto, su orientación será práctica, alternándose las sesiones de teoría con sesiones de prácticas en el laboratorio; de este modo, el alumno estará capacitado para realizar un mini proyecto de cierta entidad sobre el que será evaluado. 1.- Presentación de la asignatura 2.- Introducción al aprendizaje profundo (Deep Learning) 2.1. Redes Neuronales 2.2. Redes Neuronales Profundas (DNNs) 3.- Fundamentos y técnicas de tratamiento de imagen 3.1. Representación digital de la imagen. Espacios de color. 3.2. Operaciones punto a punto. Filtrado. 3.3. Redes Neuronales Convolucionales (CNNs) 4.- Fundamentos y técnicas de tratamiento de voz y audio 4.1. Representación digital de señales de voz y audio. El espectrograma. 4.2. DNNs para procesado de voz y audio. 4.3. Redes Neuronales Recurrentes (RNNs) 5.- Inteligencia artificial interpretable y sostenible para datos audiovisuales 6.- Casos de estudio y aplicaciones del tratamiento de voz, audio, imagen y vídeo

Actividades formativas, metodología a utilizar y régimen de tutorías

La asignatura se impartirá mediante clases de dos tipos: teoría y prácticas de laboratorio. TEORÍA (2 ECTS) Las clases de teoría serán lecciones magistrales con uso de transparencias u otros medios audiovisuales para presentar e ilustrar conceptos (AF1, MD1). Las clases de teoría podrán combinarse con la realización de ejercicios, demostraciones software y realización de presentaciones por parte de los alumnos (AF3, MD3). PRÁCTICAS (1 ECTS) Conceptos básicos seleccionados se ilustrarán mediante prácticas de laboratorio. El alumno participará activamente en su implementación. Las prácticas serán de dos tipos: - Prácticas guiadas: iniciación al tratamiento de voz, audio, imagen y vídeo con Python (AF2, AF4, MD4). - Proyecto Final: resolución de un problema de tratamiento de imagen o voz/audio a realizar por grupos (AF6, AF7, MD2, MD5).

Sistema de evaluación

Peso porcentual del Examen/Prueba Final 0
Peso porcentual del resto de la evaluación 100

Calendario de Evaluación Continua

SE2.- Presentación y exposición oral de trabajos individuales o en grupo realizados durante el curso.
SE5.- Examen parcial.

En la convocatoria ordinaria, la calificación final de la asignatura será la obtenida en los siguientes entregables:

- 3 cuestionarios sobre las prácticas guiadas (30%)
- Proyecto final (50%)
- Examen parcial tipo test (20%)

En la convocatoria extraordinaria, la calificación final de la asignatura se establece por medio del examen tipo test y la entrega de las prácticas de laboratorio y del proyecto final.

Bibliografía básica

Aurélien Géron. Hands-On Machine Learning with Scikit-Learn and TensorFlow. O'Reilly Media. 2017
Francois Chollet. Deep Learning with Python. Manning Publications. 2017
Ian Goodfellow, Yoshua Bengio, Aaron Courville . Deep Learning. MIT Press. 2016
Pradeepta Mishra. PyTorch Recipes A Problem-Solution Approach. Berkeley, CA : Apress : Imprint: Apress. 2019

Bibliografía complementaria

Ben Gold (Author), Nelson Morgan (Author), Dan Ellis (Author). Speech and Audio Signal Processing: Processing and Perception of Speech and Music.. Wiley. 2011
Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer. 2006
Forsyth & Ponce. Computer Vision: A Modern Approach. Pearson. 2012
Gonzalez and Woods. Digital Image Processing 4th Edition. Pearson. 2018
Wilhelm Burger and Mark J. Burge. Principles of Digital Image Processing: Core Techniques. Springer-Verlag. 2009

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.