Última actualización: 21/07/2020


Curso Académico: 2020/2021

Modelos de predicción
(17233)
Titulación: Máster U. en Métodos Analíticos para Datos Masivos: Big Data / Master in Big Data Analytics (322)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: GARCIA PORTUGUES, EDUARDO

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Obligatoria
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Materias que se recomienda haber superado
Matemáticas para el Análisis de Datos Estadística para el Análisis de Datos
Competencias que adquiere el estudiante y resultados del aprendizaje.
* Competencias básicas - CB6: Poseer y comprender los conocimientos que proporcionan una base u oportunidad para ser original en el desarrollo y/o aplicación de las ideas, a menudo en un contexto de investigación. - CB9: Que los estudiantes sepan cómo comunicar sus conclusiones y el conocimiento y las razones últimas que las sustentan a audiencias especializadas y no especializadas de una manera clara e inequívoca. - CB10: Que los estudiantes tengan las habilidades de aprendizaje que les permitan continuar estudiando de manera que sean en gran medida autodirigidos o autónomos. * Competencias generales - CG1: Capacidad de aplicar las técnicas de análisis y representación de la información, para adaptarla a problemas reales. - CG4: Sintetizar las conclusiones obtenidas del análisis de datos y presentarlas de forma clara y convincente en un entorno bilingüe (español e inglés) tanto escrito como oral. - CG5: Ser capaz de generar nuevas ideas (creatividad) y anticiparse a nuevas situaciones, en los contextos de análisis de datos y toma de decisiones. - CG6: Utilizar las habilidades sociales para el trabajo en equipo y para relacionarse con los demás de forma autónoma. - CG7: Aplicar técnicas avanzadas de análisis y representación de información, para adaptarla a problemas reales. * Competencias específicas - CE1: Aplicar en el desarrollo de métodos de análisis de problemas reales, conocimientos avanzados de inferencia estadística.   - CE2: Usar software libre como R y Python para la implementación de análisis estadísticos.   - CE5: Aplicar los fundamentos estadísticos avanzados para el desarrollo y análisis de problemas reales, que implican la predicción de una respuesta variable.   - CE6: Aplicar modelos no paramétricos para la interpretación y predicción de fenómenos aleatorios.   - CE10: Aplicar la modelización estadística en el tratamiento de problemas relevantes en el campo científico.
Descripción de contenidos: Programa
Este curso está diseñado para dar una visión panorámica de varias herramientas disponibles para la modelización predictiva, a un nivel intermedio-avanzado. Esta visión abarca en profundidad los principales conceptos de los modelos lineales y los modelos lineales generalizados (con sus versiones penalizadas), y más superficialmente el enfoque de la regresión no paramétrica. Se hace hincapié en proporcionar las principales ideas sobre los fundamentos estadísticos/matemáticos de los modelos y en mostrar la aplicación efectiva de los métodos mediante el uso de software estadístico. Esto se logra mediante una mezcla de teoría y código reproducible. 1. Introducción 1.1 Resumen del curso 1.2 ¿Qué es la modelización predictiva? 1.3 Notación general y repaso 2. Modelos lineales I: modelo lineal múltiple 2.1 Formulación de modelos y mínimos cuadrados 2.2 Supuestos del modelo 2.3 Inferencia para los parámetros del modelo 2.4 Predicción 2.5 ANOVA 2.6 Ajuste del modelo 3. Modelos lineales II: selección de modelos, extensiones y diagnósticos 3.1 Selección del modelo 3.2 Utilización de predictores cualitativos 3.3 Relaciones no lineales 3.4 Diagnóstico de modelos 3.5 Técnicas reductoras de la dimensión 4. Modelos lineales III: penalización y big data 4.1 Penalización 4.2 Consideraciones sobre big dataa 5. Modelos lineales generalizados 5.1 Formulación y estimación de modelos 5.2 Inferencia para los parámetros del modelo 5.3 Predicción 5.4 Deviance 5.5 Selección de modelos 5.6 Diagnóstico de modelos 5.7 Penalización 5.8 Consideraciones sobre big data 6. Regresión no paramétrica 6.1 Estimación núcleo de la densidad 6.2 Estimación núcleo de la regresión 6.3 Regresión núcleo con datos multivariantes mixtos 6.4 Predicción e intervalos de confianza 6.5 Verosimilitud local El programa está sujeto a modificaciones debido al desarrollo del curso y/o al calendario académico.
Actividades formativas, metodología a utilizar y régimen de tutorías
Las clases consisten en una mezcla de teoría (descripción de los métodos) y práctica (implementación y aplicación de los métodos). Se emplea el lenguaje estadístico R, por lo que una buena capacidad de programación en él es fundamental para comprender las aplicaciones. Se espera que los estudiantes traigan sus propios portátiles para experimentar con el código durante algunas partes de las clases.
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100
Bibliografía básica
  • James, G., Witten, D., Hastiee, T. and Tibshirani, R. . An Introduction to Statistical Learning with Applications in R. Springer-Verlag. 2013
Bibliografía complementaria
  • Kuhn, M. and Johnson, K.. Applied Predictive Modeling. Springer. 2013
  • Li, Q. and Racine, J. S.. Nonparametric Econometrics. Princeton University Press. 2007
  • Peña, D.. Regresión y Diseño de Experimentos. Alianza Editorial. 2002
  • Wand, M. P. and Jones, M. C.. Kernel Smoothing. Chapman & Hall. 1995
  • Wasserman, L.. All of Statistics. Springer-Verlag. 2004
  • Wasserman, L.. All of Nonparametric Statistics. Springer-Verlag. 2006
  • Wood, S. N.. Generalized Additive Models: An Introduction with R. Chapman & Hall/CRC. 2006

El programa de la asignatura y la planificación semanal podrían sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.


Dirección web para más información: https://bookdown.org/egarpor/PM-UC3M/