Última actualización: 20/05/2022


Curso Académico: 2022/2023

Aprendizaje profundo para el análisis de imágenes
(18496)
Grado en Ingeniería de Sonido e Imagen (Plan: 441 - Estudio: 214)


Coordinador/a: GONZALEZ DIAZ, IVAN

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Optativa
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Se recomienda haber cursado Sistemas Lineales Aunque se realizará una introducción pertinente, se recomiendan conocimientos básicos de Tratamiento Digital de Imagen
Objetivos
Resultados del Aprendizaje y su relación con los contenidos de la asignatura - Conocer las imágenes digitales y la operación del filtrado espacial en imágenes. - Conocer conceptos básicos del aprendizaje máquina: funciones de pérdida, regularización, hiperparámetros, aumento de datos. - Entender las redes neuronales profundas y conocer los algoritmos utilizados para su entrenamiento: algoritmos de descenso por gradiente y retro-propagación. - Conocer las Redes Neuronales Convolucionales (CNN) y sus bloques de procesado más habituales. - Entender, diseñar y entrenar arquitecturas de CNN para la clasificación de imágenes. - Entender, diseñar y entrenar arquitecturas avanzadas basadas en CNN para resolver otras tareas del reconocimiento visual: detección de objetos, titulación de imágenes (captioning), segmentación de imágenes, síntesis de imágenes¿
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
Tema 1. Conceptos básicos del reconocimiento visual 1.1 Imágenes digitales 1.2 Filtrado Espacial 1.3 Modelos de partes para el reconocimiento de objetos Tema 2. Conceptos básicos del aprendizaje profundo 2.1 Algoritmos de aprendizaje máquina 2.2 Funciones de pérdida 2.3 Regularización 2.4 Hiperparámetros y validación 2.5 Redes Neuronales Profundas 2.6 Algoritmos de descenso por gradiente 2.7 Retropropagación (Backpropagation) Tema 3 Redes Neuronales Convolucionales (CNNs) para la clasificación de imágenes 3.1 Introducción 3.2 Etapas básicas de procesado en una CNN 3.3 Arquitecturas de red para clasificación de imágenes 3.4 Entrenamiento de una CNN para la clasificación de imágenes: preprocesado de datos, generación artificial de muestras (data augmentation) e inicialización Tema 4 Redes Profundas para otras aplicaciones con imágenes: 4.1 Redes para detección de objetos 4.2 Redes para segmentación de imágenes 4.3 Redes para matching entre imágenes 4.4 Redes para descripción de imágenes (image captioning) 4.5 Redes para síntesis de imágenes
Actividades formativas, metodología a utilizar y régimen de tutorías
Se proponen dos tipos de actividades formativas: clases de teoría, y prácticas de laboratorio. CLASES DE TEORÍA Las clases de teoría serán lecciones magistrales con uso de transparencias u otros medios audiovisuales para ilustrar determinados conceptos. Mediante estas sesiones el alumno adquirirá los contenidos básicos de la asignatura. Es importante destacar que estas clases requerirán iniciativa y trabajo personal y en grupo por parte del alumno (habrá conceptos que deberán estudiar personalmente a partir de algunas indicaciones, casos particulares de tendrán que desarrollar, etc.) PRÁCTICAS Es una asignatura de elevado componente práctico, en lo que los alumnos tendrán asistirán asiduamente a sesiones de laboratorio. En ellas, los conceptos adquiridos en las clases de teoría se pondrán en práctica utilizando bibliotecas software de aprendizaje profundo (por ej. pytorch). En los laboratorio se dispone de máquinas equipadas con GPUs de altas prestaciones y se utilziarán también sistemas de computación distribuidos y gratuitos como Google Colab.
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100
Calendario de Evaluación Continua
Bibliografía básica
  • Francois Chollet. Deep Learning with Python. Manning Publications. 2017
  • Ian Goodfellow, Yoshoua Bengio, and Aaron Courville. Deep Learning. The MIT Press. 2016
Bibliografía complementaria
  • Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer. 2006
  • Forsyth & Ponce. Computer Vision. Pearson. 2012

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.