Última actualización: 20/01/2025


Curso Académico: 2024/2025

Aprendizaje profundo para el análisis de imágenes
(18520)
Grado en Ingeniería de Comunicaciones Móviles y Espaciales (Plan: 442 - Estudio: 217)


Coordinador/a: FERNANDEZ TORRES, MIGUEL ANGEL

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Optativa
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Se recomienda haber cursado Sistemas Lineales Aunque se realizará una introducción pertinente, se recomiendan conocimientos básicos de Tratamiento Digital de Imagen
Objetivos
Resultados del Aprendizaje y su relación con los contenidos de la asignatura - Conocer las imágenes digitales y la operación del filtrado espacial en imágenes. - Conocer conceptos básicos del aprendizaje máquina: funciones de pérdida, regularización, hiperparámetros, aumento de datos. - Entender las redes neuronales profundas y conocer los algoritmos utilizados para su entrenamiento: algoritmos de descenso por gradiente y retro-propagación. - Conocer las Redes Neuronales Convolucionales (CNN) y sus bloques de procesado más habituales. - Entender, diseñar y entrenar arquitecturas de CNN para la clasificación de imágenes. - Entender, diseñar y entrenar arquitecturas avanzadas basadas en CNN para resolver otras tareas del reconocimiento visual: detección de objetos, titulación de imágenes (captioning), segmentación de imágenes, síntesis de imágenes¿
Competencias y resultados del aprendizaje
CB1: Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio. CB2: Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio. CG3: Conocimiento de materias básicas y tecnologías, que le capacite para el aprendizaje de nuevos métodos y tecnologías, así como que le dote de una gran versatilidad para adaptarse a nuevas situaciones. ETEGISC1: Capacidad para construir, explotar y gestionar las redes, servicios, procesos y aplicaciones de telecomunicaciones, entendidas éstas como sistemas de captación, transporte, representación, procesado, almacenamiento, gestión y presentación de información multimedia, desde el punto de vista de los sistemas de transmisión. ETEGISC6: Capacidad para analizar, codificar, procesar y transmitir información multimedia empleando técnicas de procesado analógico y digital de señal. RA1: Conocimiento y comprensión de los fundamentos básicos generales de la ingeniería, los principios científicos y matemáticos, así como los de su rama o especialidad, incluyendo algún conocimiento a la vanguardia de su campo. RA3: Los egresados tendrán la capacidad de realizar diseños de ingeniería de acuerdo a su nivel de conocimiento y comprensión, trabajando en equipo. El diseño abarca dispositivos, procesos, métodos y objetos, y especificaciones más amplias que las estrictamente técnicas, lo cual incluye conciencia social, salud y seguridad, y consideraciones medioambientales y comerciales. RA5: Los egresados tendrán la capacidad de aplicar su conocimiento y comprensión para poder resolver problemas, dirigir investigaciones y diseñar dispositivos o procesos de ingeniería. Estas habilidades incluyen el conocimiento, uso y limitaciones de materiales, modelos informáticos, ingeniería de procesos, equipos, trabajo práctico, bibliografía técnica y fuentes de información. Deben tener conciencia de todas las implicaciones de la práctica de la ingeniería: éticas, medioambientales, comerciales e industriales.
Descripción de contenidos: Programa
Tema 1. Conceptos básicos del reconocimiento visual 1.1 Imágenes digitales 1.2 Filtrado Espacial 1.3 Modelos de partes para el reconocimiento de objetos Tema 2. Conceptos básicos del aprendizaje profundo 2.1 Algoritmos de aprendizaje máquina 2.2 Funciones de pérdida 2.3 Regularización 2.4 Hiperparámetros y validación 2.5 Redes Neuronales Profundas 2.6 Algoritmos de descenso por gradiente 2.7 Retropropagación (Backpropagation) Tema 3 Redes Neuronales Convolucionales (CNNs) para la clasificación de imágenes 3.1 Introducción 3.2 Etapas básicas de procesado en una CNN 3.3 Arquitecturas de red para clasificación de imágenes 3.4 Entrenamiento de una CNN para la clasificación de imágenes: preprocesado de datos, generación artificial de muestras (data augmentation) e inicialización Tema 4 Redes Profundas para otras aplicaciones con imágenes: 4.1 Redes para detección de objetos 4.2 Redes para segmentación de imágenes 4.3 Redes para generación de imágenes: GANs, Diffusion models, VAEs 4.4 Redes para matching entre imágenes
Actividades formativas, metodología a utilizar y régimen de tutorías
Se proponen dos tipos de actividades formativas: clases de teoría, y prácticas de laboratorio. CLASES DE TEORÍA Las clases de teoría serán lecciones magistrales con uso de transparencias u otros medios audiovisuales para ilustrar determinados conceptos. Mediante estas sesiones el alumno adquirirá los contenidos básicos de la asignatura. Es importante destacar que estas clases requerirán iniciativa y trabajo personal y en grupo por parte del alumno (habrá conceptos que deberán estudiar personalmente a partir de algunas indicaciones, casos particulares de tendrán que desarrollar, etc.) PRÁCTICAS Es una asignatura de elevado componente práctico, en lo que los alumnos tendrán asistirán asiduamente a sesiones de laboratorio. En ellas, los conceptos adquiridos en las clases de teoría se pondrán en práctica utilizando bibliotecas software de aprendizaje profundo (por ej. pytorch). En los laboratorio se dispone de máquinas equipadas con GPUs de altas prestaciones y se utilziarán también sistemas de computación distribuidos y gratuitos como Google Colab.
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100

Calendario de Evaluación Continua


Convocatoria extraordinaria: normativa
Bibliografía básica
  • Francois Chollet. Deep Learning with Python. Manning Publications. 2017
  • Ian Goodfellow, Yoshoua Bengio, and Aaron Courville. Deep Learning. The MIT Press. 2016
Bibliografía complementaria
  • Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer. 2006
  • Forsyth & Ponce. Computer Vision. Pearson. 2012

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.