Última actualización: 10/06/2021


Curso Académico: 2021/2022

Modelos de predicción
(17233)
Máster Universitario en Métodos Analíticos para Datos Masivos: Big Data/Master in Big Data Analytics (Plan: 352 - Estudio: 322)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: GARCIA PORTUGUES, EDUARDO

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Obligatoria
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Matemáticas para el Análisis de Datos Estadística para el Análisis de Datos
Objetivos
* Competencias básicas - CB6: Poseer y comprender los conocimientos que proporcionan una base u oportunidad para ser original en el desarrollo y/o aplicación de las ideas, a menudo en un contexto de investigación. - CB9: Que los estudiantes sepan cómo comunicar sus conclusiones y el conocimiento y las razones últimas que las sustentan a audiencias especializadas y no especializadas de una manera clara e inequívoca. - CB10: Que los estudiantes tengan las habilidades de aprendizaje que les permitan continuar estudiando de manera que sean en gran medida autodirigidos o autónomos. * Competencias generales - CG1: Capacidad de aplicar las técnicas de análisis y representación de la información, para adaptarla a problemas reales. - CG4: Sintetizar las conclusiones obtenidas del análisis de datos y presentarlas de forma clara y convincente en un entorno bilingüe (español e inglés) tanto escrito como oral. - CG5: Ser capaz de generar nuevas ideas (creatividad) y anticiparse a nuevas situaciones, en los contextos de análisis de datos y toma de decisiones. - CG6: Utilizar las habilidades sociales para el trabajo en equipo y para relacionarse con los demás de forma autónoma. - CG7: Aplicar técnicas avanzadas de análisis y representación de información, para adaptarla a problemas reales. * Competencias específicas - CE1: Aplicar en el desarrollo de métodos de análisis de problemas reales, conocimientos avanzados de inferencia estadística. - CE2: Usar software libre como R y Python para la implementación de análisis estadísticos. - CE5: Aplicar los fundamentos estadísticos avanzados para el desarrollo y análisis de problemas reales, que implican la predicción de una respuesta variable. - CE6: Aplicar modelos no paramétricos para la interpretación y predicción de fenómenos aleatorios. - CE10: Aplicar la modelización estadística en el tratamiento de problemas relevantes en el campo científico.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
Este curso está diseñado para dar una visión panorámica de varias herramientas disponibles para la modelización predictiva, a un nivel intermedio-avanzado. Esta visión abarca en profundidad los principales conceptos de los modelos lineales y los modelos lineales generalizados (con sus versiones penalizadas), y más superficialmente el enfoque de la regresión no paramétrica. Se hace hincapié en proporcionar las principales ideas sobre los fundamentos estadísticos/matemáticos de los modelos y en mostrar la aplicación efectiva de los métodos mediante el uso de software estadístico. Esto se logra mediante una mezcla de teoría y código reproducible. 1. Introducción 1.1. Resumen del curso 1.2. Notación general y repaso 1.3. ¿Qué es la modelización predictiva? 2. Modelos lineales I: modelo lineal múltiple 2.1. Formulación de modelos y mínimos cuadrados 2.2. Supuestos del modelo 2.3. Inferencia para los parámetros del modelo 2.4. Predicción 2.5. ANOVA 2.6. Ajuste del modelo 3. Modelos lineales II: selección de modelos, extensiones y diagnósticos 3.1. Selección del modelo 3.2. Utilización de predictores cualitativos 3.3. Relaciones no lineales 3.4. Diagnóstico de modelos 3.5. Técnicas reductoras de la dimensión 4. Modelos lineales III: penalización y big data 4.1. Penalización 4.2. Consideraciones sobre big dataa 5. Modelos lineales generalizados 5.1. Formulación y estimación de modelos 5.2. Inferencia para los parámetros del modelo 5.3. Predicción 5.4. Deviance 5.5. Selección de modelos 5.6. Diagnóstico de modelos 5.7. Penalización 5.8. Consideraciones sobre big data 6. Regresión no paramétrica 6.1. Estimación núcleo de la densidad 6.2. Estimación núcleo de la regresión 6.3. Regresión núcleo con datos multivariantes mixtos 6.4. Predicción e intervalos de confianza 6.5. Verosimilitud local El programa está sujeto a modificaciones debido al desarrollo del curso y/o al calendario académico.
Actividades formativas, metodología a utilizar y régimen de tutorías
Las clases consisten en una mezcla de teoría (descripción de los métodos) y práctica (implementación y aplicación de los métodos). Se emplea el lenguaje estadístico R, por lo que una buena capacidad de programación en él es fundamental para comprender las aplicaciones. Se espera que los estudiantes traigan sus propios portátiles para experimentar con el código durante algunas partes de las clases.
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100
Calendario de Evaluación Continua
Bibliografía básica
  • James, G., Witten, D., Hastie, T. y Tibshirani, R.. An Introduction to Statistical Learning with Applications in R. Springer-Verlag. 2013
Bibliografía complementaria
  • Kuhn, M. and Johnson, K.. Applied Predictive Modeling. Springer. 2013
  • Li, Q. and Racine, J. S.. Nonparametric Econometrics. Princeton University Press. 2007
  • Peña, D.. Regresión y Diseño de Experimentos. Alianza Editorial. 2002
  • Wasserman, L.. All of Statistics. Springer-Verlag. 2004
  • Wood, S. N.. Generalized Additive Models: An Introduction with R. Chapman & Hall/CRC. 2006

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.