Ficha

English version

Curso Académico: 2022/2023

Aprendizaje profundo para el análisis de imágenes

(18496)

Grado en Ingeniería de Sonido e Imagen (Plan 2019) (Plan: 441 - Estudio: 214)

Coordinador/a: GONZALEZ DIAZ, IVAN

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Optativa

Créditos: 3.0 ECTS

Curso:

Cuatrimestre:

Requisitos (Asignaturas o materias cuyo conocimiento se presupone)

Se recomienda haber cursado Sistemas Lineales Aunque se realizará una introducción pertinente, se recomiendan conocimientos básicos de Tratamiento Digital de Imagen

Objetivos

Resultados del Aprendizaje y su relación con los contenidos de la asignatura - Conocer las imágenes digitales y la operación del filtrado espacial en imágenes. - Conocer conceptos básicos del aprendizaje máquina: funciones de pérdida, regularización, hiperparámetros, aumento de datos. - Entender las redes neuronales profundas y conocer los algoritmos utilizados para su entrenamiento: algoritmos de descenso por gradiente y retro-propagación. - Conocer las Redes Neuronales Convolucionales (CNN) y sus bloques de procesado más habituales. - Entender, diseñar y entrenar arquitecturas de CNN para la clasificación de imágenes. - Entender, diseñar y entrenar arquitecturas avanzadas basadas en CNN para resolver otras tareas del reconocimiento visual: detección de objetos, titulación de imágenes (captioning), segmentación de imágenes, síntesis de imágenes¿

Resultados del proceso de formación y aprendizaje

Enlace al documento

Descripción de contenidos: Programa

Tema 1. Conceptos básicos del reconocimiento visual 1.1 Imágenes digitales 1.2 Filtrado Espacial 1.3 Modelos de partes para el reconocimiento de objetos Tema 2. Conceptos básicos del aprendizaje profundo 2.1 Algoritmos de aprendizaje máquina 2.2 Funciones de pérdida 2.3 Regularización 2.4 Hiperparámetros y validación 2.5 Redes Neuronales Profundas 2.6 Algoritmos de descenso por gradiente 2.7 Retropropagación (Backpropagation) Tema 3 Redes Neuronales Convolucionales (CNNs) para la clasificación de imágenes 3.1 Introducción 3.2 Etapas básicas de procesado en una CNN 3.3 Arquitecturas de red para clasificación de imágenes 3.4 Entrenamiento de una CNN para la clasificación de imágenes: preprocesado de datos, generación artificial de muestras (data augmentation) e inicialización Tema 4 Redes Profundas para otras aplicaciones con imágenes: 4.1 Redes para detección de objetos 4.2 Redes para segmentación de imágenes 4.3 Redes para matching entre imágenes 4.4 Redes para descripción de imágenes (image captioning) 4.5 Redes para síntesis de imágenes

Actividades formativas, metodología a utilizar y régimen de tutorías

Se proponen dos tipos de actividades formativas: clases de teoría, y prácticas de laboratorio. CLASES DE TEORÍA Las clases de teoría serán lecciones magistrales con uso de transparencias u otros medios audiovisuales para ilustrar determinados conceptos. Mediante estas sesiones el alumno adquirirá los contenidos básicos de la asignatura. Es importante destacar que estas clases requerirán iniciativa y trabajo personal y en grupo por parte del alumno (habrá conceptos que deberán estudiar personalmente a partir de algunas indicaciones, casos particulares de tendrán que desarrollar, etc.) PRÁCTICAS Es una asignatura de elevado componente práctico, en lo que los alumnos tendrán asistirán asiduamente a sesiones de laboratorio. En ellas, los conceptos adquiridos en las clases de teoría se pondrán en práctica utilizando bibliotecas software de aprendizaje profundo (por ej. pytorch). En los laboratorio se dispone de máquinas equipadas con GPUs de altas prestaciones y se utilziarán también sistemas de computación distribuidos y gratuitos como Google Colab.

Sistema de evaluación

Peso porcentual del Examen/Prueba Final 0
Peso porcentual del resto de la evaluación 100

Calendario de Evaluación Continua

La evaluación de la asignatura se realizará en su totalidad mediante el trabajo contínuo del alumno a lo largo del cuatrimestre. Para ello, se evaluará la realización de 2 Prácticas (5 ptos cada una), asociadas a los bloques principales de la asignatura:

    1) Práctica de clasificación de imágenes con CNNs (5 puntos).
    2) Práctica de otra aplicación del aprendizaje profundo sobre imágenes (5 puntos).

Bibliografía básica

Francois Chollet. Deep Learning with Python. Manning Publications. 2017
Ian Goodfellow, Yoshoua Bengio, and Aaron Courville. Deep Learning. The MIT Press. 2016

Bibliografía complementaria

Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer. 2006
Forsyth & Ponce. Computer Vision. Pearson. 2012

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.