Última actualización: 21/07/2020


Curso Académico: 2020/2021

Tratamiento de Datos
(14311)
Titulación: Master Universitario en Ingenieria de Telecomunicación (227)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: CID SUEIRO, JESUS

Departamento asignado a la asignatura: Departamento de Teoría de la Señal y Comunicaciones

Tipo: Obligatoria
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Materias que se recomienda haber superado
Ninguna (en relación a otras asignaturas del Máster), ya que es una asignatura del primer cuatrimestre. Sin embargo, es altamente aconsejable disponer de conocimientos básicos sobre estadística.
Competencias que adquiere el estudiante y resultados del aprendizaje.Más información en este enlace
Al finalizar el curso el alumno comprenderá la naturaleza de los problemas de regresión, clasificación y, en general, de análisis de datos, y conocerá distintas aproximaciones para su resolución. Tomará conciencia de la importancia que tiene en la comprensión de estos problemas el dominio de tres elementos básicos de la teoría de la probabilidad: la verosimilitud, la diferencia entre incertidumbre a priori y a posteriori y el teorema de Bayes. Desde un punto de vista procedimental, el alumno abordará la resolución de estos problemas mediante diferentes técnicas de aprendizaje a partir de datos: técnicas de tipo no paramétrico, basadas en la minimización de riesgo empírico, o en el tratamiento bayesiano del problema. De forma específica, los objetivos que se persiguen en la asignatura, enumerados como competencias, son los siguientes: - capacitar al estudiante en los principios teóricos en que se basan distintas herramientas analíticas y algorítmicas básicas y avanzadas para el Tratamiento de Datos - familiarizar al estudiante con la aplicación de dichas herramientas a casos reales y la extracción de conclusiones - adquirir conocimiento y destreza en el manejo de herramientas clásicas de estimación y clasificación - adquirir conocimiento y destreza en el manejo de herramientas de aprendizaje máquina: procesos gaussianos, máquinas de vectores soporte, métodos no paramétricos, etc. - conocer otras aplicaciones del análisis de datos como el modelado de tópicos o los sistemas de recomendación
Descripción de contenidos: Programa
Tema 0: Introducción general al tratamiento de datos Tema 1: Preprocesamiento de datos 1.1. Normalizacion de datos 1.2. Reducción de dimensionalidad 1.3. Agrupamiento de datos Tema 2: Regresión. 2.1. El problema de regresión 2.2. Regresión no paramétrica: k-NN 2.3. Regresión de mínimos cuadrados lineal y polinómica 2.4. Regresión bayesiana 2.5. Otros algoritmos de regresión Tema 3: Clasificación. 3.1. Problema de clasificación. 3.2. Métodos no paramétricos: k-NN 3.3. Regresión logística 3.4. Redes Neuronales 3.5. Otros algoritmos de clasificación Tema 4: Modelos de tópicos 4.1. Análisis de textos. 4.2. Algoritmo LDA (Latent Dirichlet Allocation)
Actividades formativas, metodología a utilizar y régimen de tutorías
CLASES TEÓRICO - PRÁCTICAS Serán sesiones magistrales en las que se presentarán los conceptos básicos de la asignatura, ilustrándolos con numerosos ejemplos. Se dedicarán también numerosas sesiones a la resolución de ejercicios y problemas de carácter similar a los que se plantearán en los exámenes. PRÁCTICAS DE LABORATORIO Sesiones en aula informática de aplicación de los conceptos presentados en la asignatura. El alumno resolverá con ayuda del ordenador problemas de tratamiento de datos reales, evaluando las prestaciones de los sistemas implementados.
Sistema de evaluación
  • Peso porcentual del Examen Final 50
  • Peso porcentual del resto de la evaluación 50
Bibliografía básica
  • R. O. Duda, P. E. Hart, D. G. Stork. Pattern Classification (2nd ed.). Wiley Interscience. 2001
Bibliografía complementaria
  • A.C. Müller, S. Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists. O'Reilly Media, Inc. 2016
  • C. M. Bishop. Pattern Recognition and Machine Learning. Springer. 2006
  • Trevor Hastie, Robert Tibshirani, Jerome H. Friedman. The Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer Series in Statistics. 2009

El programa de la asignatura y la planificación semanal podrían sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.