Última actualización: 19/05/2022


Curso Académico: 2022/2023

Modelización Predictiva
(16494)
Titulación: Grado en Ciencia e Ingeniería de Datos (350)


Coordinador/a: GARCIA PORTUGUES, EDUARDO

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Obligatoria
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Cálculo I y II Algebra Lineal Programación Probabilidad y Análisis de Datos Introducción a la Modelización Estadística Aprendizaje Estadístico
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
Este curso está diseñado para dar una visión panorámica de varias herramientas disponibles para la modelización predictiva, a un nivel intermedio-introductivo. Esta visión cubre en profundidad los principales conceptos de los modelos lineales y da una visión general de sus extensiones. Se hace hincapié en proporcionar los principales conocimientos sobre los fundamentos estadísticos/matemáticos de los modelos y en mostrar la aplicación efectiva de los métodos mediante el uso del software estadístico R. 1. Introducción   1.1. Resumen del curso   1.2. Repaso de probabilidad   1.3. Vectores aleatorios   1.4. Repaso de inferencia estadística   1.5. ¿Qué es la modelización predictiva? 2. Regresión lineal simple   2.1. Formulación y estimación de modelos   2.2. Supuestos del modelo   2.3. Inferencia para los parámetros del modelo   2.4. Predicción   2.5. ANOVA y ajuste del modelo 3. Regresión lineal múltiple   3.1. Formulación y estimación de modelos   3.2. Supuestos de los modelos   3.3. Inferencia para los parámetros del modelo   3.4. ANOVA y ajuste del modelo   3.5. Selección de modelos   3.6. Manejo de relaciones no lineales   3.7. Utilización de predictores cualitativos   3.8. Diagnóstico de modelos y multicolinealidad 4. Extensiones de la regresión lineal   4.1. Repaso del análisis de componentes principales   4.2. Regresión de componentes principales   4.3. Regresión por mínimos cuadrados parciales   4.4. Modelos lineales regularizados   4.5. Regresión ridge y lasso 5. Regresión logística   5.1. Formulación e interpretación del modelo   5.2. Estimación por máxima verosimilitud   5.3. Inferencia para los parámetros del modelo   5.4. Selección del modelo y multicolinealidad   5.5. Modelos logísticos regularizados El programa está sujeto a modificaciones menores debido al desarrollo del curso y/o el calendario académico.
Actividades formativas, metodología a utilizar y régimen de tutorías
Las lecciones magistrales consisten principalmente en exposiciones teóricas sobre los métodos estadísticos del curso. Estas exposiciones se complementan con ejemplos ilustrativos. Los laboratorios están diseñados para realizar ejercicios y estudios de casos que profundizan en el uso práctico de los métodos vistos. La implementación de los métodos se realiza con el lenguaje estadístico R. * Actividades formativas CLASES TEÓRICO-PRÁCTICAS. En ellas se presentarán los conocimientos que deben adquirir los alumnos. Estos recibirán las notas de clase y tendrán textos básicos de referencia para facilitar el seguimiento de las clases y el desarrollo del trabajo posterior. Se resolverán ejercicios, prácticas y problemas por parte del alumno. Para asignaturas de 6 ECTS se dedicarán 44 horas como norma general con un 100% de presencialidad (excepto aquellas que no tengan examen que dedicarán 48 horas). TUTORÍAS. Asistencia individualizada (tutorías individuales) o en grupo (tutorías colectivas) a los estudiantes por parte del profesor. Para asignaturas de 6 créditos se dedicarán 4 horas con un 100% de presencialidad. TRABAJO INDIVIDUAL O EN GRUPO DEL ESTUDIANTE. Para asignaturas de 6 créditos se dedicarán 98 horas con un 0% presencialidad. TALLERES Y LABORATORIOS. Para asignaturas de 3 créditos se dedicarán 3 horas con un 100% de presencialidad. Para las asignaturas de 6 créditos se dedicarán 6 horas con un 100% de presencialidad. EXAMEN FINAL. Se valorarán de forma global los conocimientos, destrezas y capacidades adquiridas a lo largo del curso. Se dedicarán 4 horas con 100% presencialidad. * Metodologías docentes CLASE TEORÍA. Exposiciones en clase del profesor con soporte de medios informáticos y audiovisuales, en las que se desarrollan los conceptos principales de la materia y se proporcionan los materiales y la bibliografía para complementar el aprendizaje de los alumnos. PRÁCTICAS. Resolución de casos prácticos, problemas, etc. planteados por el profesor de manera individual o en grupo. TUTORÍAS. Asistencia individualizada (tutorías individuales) o en grupo (tutorías colectivas) a los estudiantes por parte del profesor. Para asignaturas de 6 créditos se dedicarán 4 horas con un 100% de presencialidad. PRÁCTICAS DE LABORATORIO. Docencia aplicada/experimental a talleres y laboratorios bajo la supervisión de un tutor.
Sistema de evaluación
  • Peso porcentual del Examen Final 60
  • Peso porcentual del resto de la evaluación 40
Calendario de Evaluación Continua
Bibliografía básica
  • James, G., Witten, D., Hastie, T. y Tibshirani, R.. An Introduction to Statistical Learning. Springer-Verlag. 2013
  • Papoulis, A. y Pillai, S. U.. Probability, Random Variables, and Stochastic Processes. McGraw-Hill. 2002
Bibliografía complementaria
  • Hastie, T., Tibshirani, R. y Friedman, J.. The Elements of Statistical Learning. Springer. 2013
  • Kuhn, M. y Johnson, K.. Applied Predictive Modeling. Springer. 2013
  • Panaretos, V. M.. Statistics for Mathematicians. Springer. 2016
  • Peña, D.. Regresión y Diseño de Experimentos. Alianza Editorial. 2002
  • Seber, G. A. F.. Linear Regression Analysis. John Wiley & Sons. 1977
  • Wood, S. N.. Generalized Additive Models: An Introduction with R. Chapman & Hall/CRC. 2006

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.


Dirección web para más información: https://www.uc3m.es/ss/Satellite/Grado/en/Detalle/Estudio_C/1371241688824/1371212987094/Bachelor_s_Degree_in_Data_Science_and_Engineering