Última actualización: 17/05/2019


Curso Académico: 2019/2020

Análisis de datos audiovisuales
(18469)
Grado en Ingeniería en Tecnologías de Telecomunicación (Plan 2010) (Plan: 238 - Estudio: 252)


Coordinador/a: DIAZ DE MARIA, FERNANDO

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Optativa
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




El objetivo del curso es proporcionar a los estudiantes el conocimiento teórico y metodológico sobre algoritmos y métodos para recuperación e indexado de información multimedia. Tras la finalización satisfactoria del curso, el alumno habrá adquirido (o progresado en la adquisición -en el caso de las transversales-) las siguientes competencias: 1. COMPETENCIAS TRANVERSALES/GENÉRICAS: 1.1. Capacidad de trabajo personal. 1.2. Capacidad de análisis y síntesis. 1.3. Capacidad para aplicar conceptos teóricos en casos prácticos. 1.4. Destrezas relacionadas con el trabajo en grupo y la colaboración con otros compañeros. 1.5. Destrezas relacionadas con la realización de presentaciones orales y escritas. 2. OBJETIVOS ESPECÍFIC0S: 2.1 Comprender los fundamentos del análisis de datos audio-visuales y sus aplicaciones. 2.2. Comprender los métodos básicos de representación y descripción de la voz, el audio, la imagen y el vídeo. 2.3. Comprender los métodos y tecnologías para el análisis de datos audiovisuales. 2.4. Comprender, diseñar e implementar tecnologías y métodos de indexado, recuperación y filtrado de información multimedia. CB1, CB2 CG3, CG11 ETEGITT9, ETEGITT3
Descripción de contenidos: Programa
El problema moderno de la sobrecarga de información provocado por la disponibilidad de cantidades inabarcables de información a través de internet hace que sean necesarios sistemas que nos permitan encontrar la información que buscamos y filtrarla o personalizarla en función de nuestras necesidades. Para ello es fundamental poder indexar automáticamente contenidos no sólo textuales sino también de audio (música, voz, etc.), imagen o vídeo, recurriendo a métodos basados en el propio contenido o en etiquetado colaborativo como el que tiene lugar en las redes sociales. Ejemplos de estos sistemas de gestión de la información multimedia son: buscadores como Google (así como sus variantes multimedia Google Image, Google Goggles, etc.), sistemas de recomendación y perfilado de usuarios como los de Amazon. 0. Panorámica del análisis de datos audiovisuales (audio & visual analytics) 1. Descriptores de voz, audio, imagen y vídeo 2. Métodos para el análisis de datos audiovisuales 3. Sistemas de recuperación y filtrado de información multimedia
Actividades formativas, metodología a utilizar y régimen de tutorías
Se proponen varios tipos de actividades formativas: clases de teoría y problemas, prácticas en laboratorio y proyecto final de laboratorio. Se adoptarán varios tipos de metodologías: clases magistrales y aprendizaje basado en problemas (con cantidad variable de supervisión y alcance) CLASES DE TEORÍA (2.5 ECTS) Las clases de teoría proporcionan una visión general de los principales conceptos teóricos y matemáticos así como de las herramientas básicas de análisis de voz, audio, imagen y vídeo PRÁCTICAS GUIADAS DE LABORATORIO (1.75 ECTS) Las prácticas de laboratorio se han diseñado con el propósito de que los alumnos apliquen las herramientas matemáticas presentadas en las clases teóricas a casos prácticos. Los estudiantes aprenderán a utilizar diferentes métodos de análisis de audio e imagen, como clustering de audio, reconocimiento de caras o indexado de texto, y a interpretar los resultados que obtengan en las prácticas. PROYECTO FINAL (1.75 ECTS) Los alumnos realizarán por grupos un sistema sencillo de análisis de audio o imagen (a su elección).
Sistema de evaluación
  • Peso porcentual del Examen Final 30
  • Peso porcentual del resto de la evaluación 70

Bibliografía básica
  • C. D. Manning, P. Raghavan and H. Schultze. Introduction to Information Retrieval. MIT press. 2008
  • N. Morgan and B. Gold. Speech and Audio Signal Processing: Processing and Perception of Speech and Music. John Wiley & Sons, Inc. New York, NY, USA. 1999
  • Rafael C. González and Richard E. Woods. Digital Image Processing. Fourth Edition, Pearson. 2018
Bibliografía complementaria
  • Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Modern Information Retrieval: the concepts and technology behind search. 2nd Edition, Pearson. 2011
  • S. Theodoridis and K. Koutroumbas. Pattern Recognition. 4th ed., Academic Press. 2008
  • Wilhelm Burger and Mark J. Burge. Principles of Digital Image Processing: Fundamental Techniques. Springer-Verlag. 2009

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.