Los datos audiovisuales son de vital importancia para la industria del entretenimiento (medios digitales, televisión, radio, podcasts, videojuegos, música, etc.) en las que su combinación con las telecomunicaciones ha cambiado de forma radical nuestras vidas, especialmente en la manera en la que interactuamos con dichos datos (asistentes inteligentes como Siri, Alexa, Google Assistant, etc).
Además, estos datos son cada vez más relevantes en áreas como la medicina en donde la sofisticación cada vez mayor de dispositivos de sensado e incluso de dispositivos wearable tales como relojes inteligentes, gafas de realidad virtual y aumentada, etc., generan cada vez más tipos de datos con una inmensa potencialidad de transformación de la sociedad y de creación de nuevos mercados.
Pero la tecnología clave que se ha hecho imprescindible para transformar esta gran cantidad de datos audiovisuales en información y conocimiento útiles es la inteligencia artificial o el aprendizaje máquina, incluyendo redes neuronales y aprendizaje profundo.
Por ello, el objetivo de esta asignatura es proporcionar a los estudiantes el conocimiento teórico y metodológico sobre algoritmos y métodos para el análisis de la información audiovisual incluyendo recuperación e indexado de información multimedia para navegación y búsqueda, perfilado de usuarios, minería de opinión y posicionamiento, personalización de recomendaciones, etc.
Además, se adoptará un punto de vista eminentemente práctico proporcionando las herramientas para poner en práctica los conocimientos teóricos en el laboratorio, de manera que acaben siendo capaces de desarrollar un proyecto de análisis de datos audiovisuales basado en el aprendizaje máquina.
Finalmente, esto permitirá establecer conexiones con la gran cantidad de aplicaciones que poseen y los productos y servicios comerciales que soportan (por ejemplo, varios servicios de Google, plataformas como Twitter, Instagram, TikTok, Spotify, Netflix, YouTube, Twitch, Shazam y un largo etc.).
Tras la finalización satisfactoria del curso, el alumnado habrá adquirido (o progresado en la adquisición -en el caso de las transversales-) las siguientes competencias:
1. COMPETENCIAS TRANVERSALES/GENÉRICAS:
1.1. Capacidad de trabajo personal.
1.2. Capacidad de análisis y síntesis.
1.3. Capacidad para aplicar conceptos teóricos en casos prácticos.
1.4. Destrezas relacionadas con el trabajo en grupo y la colaboración con otros compañeros.
1.5. Destrezas relacionadas con la realización de presentaciones orales y escritas.
2. OBJETIVOS ESPECÍFIC0S:
2.1. Comprender los fundamentos del análisis de datos audio-visuales y sus aplicaciones.
2.2. Comprender los métodos básicos de representación y descripción de la voz, el audio, la imagen y el vídeo.
2.3. Comprender los métodos y tecnologías empleados para clasificación, detección, indexado, recuperación, filtrado, personalización o reconocimiento de voz, audio, imagen o vídeo.
2.4. Capacidad para diseñar e implementar los métodos y tecnologías anteriores en problemas prácticos de análisis automático de voz, audio, imagen y vídeo.