Última actualización: 23/04/2024


Curso Académico: 2024/2025

Tratamiento de Datos
(14311)
Máster Universitario en Ingeniería de Telecomunicación (Plan: 171 - Estudio: 227)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: ARENAS GARCIA, JERONIMO

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Obligatoria
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Ninguna (en relación a otras asignaturas del Máster), ya que es una asignatura del primer cuatrimestre. Sin embargo, es altamente aconsejable disponer de conocimientos básicos sobre estadística.
Objetivos
Al finalizar el curso el alumno comprenderá la naturaleza de los problemas de regresión, clasificación y, en general, de análisis de datos, y conocerá distintas aproximaciones para su resolución. Tomará conciencia de la importancia que tiene en la comprensión de estos problemas el dominio de tres elementos básicos de la teoría de la probabilidad: la verosimilitud, la diferencia entre incertidumbre a priori y a posteriori y el teorema de Bayes. Desde un punto de vista procedimental, el alumno abordará la resolución de estos problemas mediante diferentes técnicas de aprendizaje a partir de datos: técnicas de tipo no paramétrico, basadas en la minimización de riesgo empírico, o en el tratamiento bayesiano del problema. De forma específica, los objetivos que se persiguen en la asignatura, enumerados como competencias, son los siguientes: - capacitar al estudiante en los principios teóricos en que se basan distintas herramientas analíticas y algorítmicas básicas y avanzadas para el Tratamiento de Datos - familiarizar al estudiante con la aplicación de dichas herramientas a casos reales y la extracción de conclusiones - adquirir conocimiento y destreza en el manejo de herramientas clásicas de estimación y clasificación - adquirir conocimiento y destreza en el manejo de herramientas de aprendizaje máquina: procesos gaussianos, máquinas de vectores soporte, métodos no paramétricos, etc. - conocer otras aplicaciones del análisis de datos, en particular en el ámbito del procesamiento de lenguaje. natural.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
Tema 0: Introducción general al tratamiento de datos Tema 1: Preprocesamiento de datos 1.1. Normalizacion de datos 1.2. Reducción de dimensionalidad 1.3. Agrupamiento de datos Tema 2: Regresión. 2.1. El problema de regresión 2.2. Regresión no paramétrica: k-NN 2.3. Regresión de mínimos cuadrados lineal y polinómica 2.4. Regresión bayesiana 2.5. Otros algoritmos de regresión Tema 3: Clasificación. 3.1. Problema de clasificación. 3.2. Métodos no paramétricos: k-NN 3.3. Regresión logística 3.4. Otros algoritmos de clasificación Tema 4: Deep learning 4.1. Introducción a pytorch 4.2. Redes neuronales de múltiples capas. 4.3. Redes convolucionales Tema 5: Procesamiento de Lenguaje Natural 5.1. Preprocesamiento de textos. 5.2. Word embeddings 5.3. Transformers 5.4. Modelos de tópicos neuronales
Actividades formativas, metodología a utilizar y régimen de tutorías
CLASES TEÓRICO - PRÁCTICAS Serán sesiones magistrales en las que se presentarán los conceptos básicos de la asignatura, ilustrándolos con numerosos ejemplos. Se dedicarán también numerosas sesiones a la resolución de ejercicios y problemas de carácter similar a los que se plantearán en los exámenes. PRÁCTICAS DE LABORATORIO Sesiones en aula informática de aplicación de los conceptos presentados en la asignatura. El alumno resolverá con ayuda del ordenador problemas de tratamiento de datos reales, evaluando las prestaciones de los sistemas implementados.
Sistema de evaluación
  • Peso porcentual del Examen Final 50
  • Peso porcentual del resto de la evaluación 50
Calendario de Evaluación Continua
Bibliografía básica
  • Denis Rothman. Transformers for Natural Language Processing. Packt>. 2022 (2nd ed)
  • R. O. Duda, P. E. Hart, D. G. Stork. Pattern Classification (2nd ed.). Wiley Interscience. 2001
Recursos electrónicosRecursos Electrónicos *
Bibliografía complementaria
  • A.C. Müller, S. Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists. O'Reilly Media, Inc. 2016
  • C. M. Bishop. Pattern Recognition and Machine Learning. Springer. 2006
  • Trevor Hastie, Robert Tibshirani, Jerome H. Friedman. The Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer Series in Statistics. 2009
(*) El acceso a algunos recursos electrónicos puede estar restringido a los miembros de la comunidad universitaria mediante su validación en campus global. Si esta fuera de la Universidad, establezca una VPN


El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.