Última actualización: 27/04/2023


Curso Académico: 2023/2024

Visión por Computador
(19112)
Grado en Ingeniería Robótica (Plan: 478 - Estudio: 381)


Coordinador/a: AL-KAFF , ABDULLA HUSSEIN ABDULRAHMAN

Departamento asignado a la asignatura: Departamento de Ingeniería de Sistemas y Automática

Tipo: Obligatoria
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Objetivos
a. Conocimiento y comprensión a.1. Tener una visión integral del procesamiento de imágenes, desde la adquisición hasta la extracción de los datos de interés. a.2. Aplicar diferentes filtros digitales a.3. Aplique métodos de Machine Learning y Deep Learning para el reconocimiento de patrones, la detección de objetos y más problemas de IA b. Habilidades intelectuales b.1. Trabaje y procese las imágenes utilizando algoritmos clásicos. b.2. Utilizar redes neuronales en aplicaciones reales y compararlas con los métodos clásicos. b.3. Integrar diferentes sistemas de percepción y procesos de control tanto desde el punto de vista del hardware como del software. C. Habilidades profesionales y prácticas c.1. Utilizar conocimientos de programación y simulación de sistemas de percepción y control a varios niveles (alto-intermedio-bajo): Python, OpenCV, ROS, etc. c.2. Trabajar con varios sensores visuales y aplicar procesamiento en tiempo real d. Habilidades generales y transferibles d.1. Aplicar los conocimientos y la capacidad adquiridos a la resolución de problemas en entornos nuevos o desconocidos dentro de contextos amplios (o multidisciplinarios) relacionados con su campo de estudio. d.2. Integrar saberes y afrontar la complejidad de formular juicios a partir de información incompleta o limitada incluyendo reflexiones sobre las responsabilidades sociales y éticas relacionadas con la aplicación de sus saberes y juicios d.3. Comunicar sus conclusiones y conocimientos a personas especializadas y no especializadas de forma clara e inequívoca.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
1- Conceptos Introductorios: Introducción a la Imagen, Geometría proyectiva, Imágenes como funciones, Procesamiento de imágenes, Espacio de color, Visión 3D 2- Histogramas de imágenes y operaciones de puntos: Histogramas de imágenes, Brillo de imágenes, Operaciones de puntos, Rango dinámico, Inversión de imágenes, Umbral y Ecualización de histogramas 3- Filtrado de imágenes: Tipos de transformaciones de imágenes. Procesamiento de imágenes puntuales. Filtrado de imágenes invariante por desplazamiento lineal. Convolución y Correlación. Gradientes de imagen. 4- Pirámides de imagen y dominio de frecuencia: Reducción de resolución de imagen. Alias. Pirámide de imágenes gaussianas. Pirámide de imágenes laplacianas. Series de Fourier. Dominio de la frecuencia. Transformada de Fourier. Filtrado en el dominio de la frecuencia. Revisando el muestreo. 5- Transformada de Hough: Detectar líneas. Ajuste de línea. Parametrizaciones de línea. Hough transforma. Círculos de Hough. Algunas aplicaciones. 6- Detección de esquinas: ¿Por qué detectar esquinas? Visualización de cuadráticas., Detector de esquinas Harris., Detección multiescala., Detección de manchas multiescala. 7- Detección y descripción de características: ¿Por qué necesitamos descriptores de características? Diseño de descriptores de características. Descriptor MOPS. Descriptor GIST. Histograma del descriptor Textons. Descriptor HOG. TAMIZAR. 8- Transformación 2D: Transformaciones 2D. geometría proyectiva. Transformaciones en geometría proyectiva. Clasificación de transformaciones 2D. Determinación de transformaciones 2D desconocidas. Determinación de deformaciones de imagen desconocidas. 9- Homografías de imagen: Motivación: panorámicas. Volviendo a la deformación: homografías de imágenes. Computación con homografías. La transformada lineal directa (DLT). Consenso de Muestra Aleatoria (RANSAC). 10- Clasificación de imágenes: Introducción a la visión basada en el aprendizaje. Clasificación de imágenes. Bolsa de palabras. K-significa agrupamiento. Clasificación. K vecinos más cercanos. Bayes ingenuo. Máquinas de vectores soporte. 11- Redes Neuronales: Perceptrón. Redes neuronales. Perceptrones de entrenamiento. Descenso de gradiente. Backpropagation. Descenso de gradiente estocástico. 12- Redes Neuronales Convolucionales: Arquitectura de las Redes Convolucionales, Capas Convolucionales, Capas Pooling, Capas Totalmente Conectadas, Implementación CNN con TensorFlow, CNN con Nombre Propio, Herramientas, Aplicaciones Prácticas. 13- Detección y clasificación de objetos: Detección y clasificación de objetos, modelos R-CNN, YOLO, Detectron y SegmenTron
Actividades formativas, metodología a utilizar y régimen de tutorías
El curso se divide en diferentes actividades formativas de la siguiente forma: - 1. Teoría: clases magistrales, presentaciones de los alumnos, tutorías individuales y trabajo personal del alumno; orientados a la adquisición de conocimientos teóricos. 2. Prácticas: Sesiones en las aulas de informática, tutorías individuales y trabajo personal del alumno; orientados a la adquisición de habilidades prácticas.
Sistema de evaluación
  • Peso porcentual del Examen Final 30
  • Peso porcentual del resto de la evaluación 70

Bibliografía básica
  • Géron, A. Hands-on machine learning with scikit-learn, keras, and tensorflow: Concepts, tools, and techniques to build intelligent systems. O¿Reilly Media. 2019
  • Szeliski, R. Computer vision: Algorithms and applications. Springer International Publishing. 2022
Bibliografía complementaria
  • Gonzalez, R., & Woods, R. Digital image processing. Prentice Hall. Pearson Education. 2002
  • Svoboda, T., Kybic, J., & Hlavac, V. Image processing, analysis, and machine vision: A matlab companion. Thomson Learning. 2008

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.