Última actualización: 21/04/2025 16:24:29


Curso Académico: 2025/2026

Depuración de Datos y Generación de Informes
(17774)
Máster Universitario en Estadística para la Ciencia de Datos (Plan: 386 - Estudio: 345)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: GARCIA PORTUGUES, EDUARDO

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Optativa
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Programación en R Programación Avanzada
Objetivos
Los principales objetivos del curso son: 1. Mejorar las habilidades de programación en R. 2. Adquirir habilidades para la creación de informes estadísticos de alta calidad. 3. Aprender a desarrollar aplicaciones interactivas con Shiny. 4. Aprender a aplicar herramientas de AutoML para una rápida modelización. 5. Dominar el entorno tidyverse para la manipulación de datos. 6. Dominar el entorno tidymodels para la modelización estadística.
Resultados del proceso de formación y aprendizaje
Descripción de contenidos: Programa
Este curso abarca diversas herramientas para optimizar el proceso de consultoría estadística en R: desde la manipulación de datos hasta la presentación de resultados, pasando por un modelado estadístico rápido. El enfoque se centra en ofrecer una visión general de las principales características de numerosos paquetes y soluciones. 1. Mejorando la programación en R   1.1. GitHub Copilot   1.2. Trucos y herramientas útiles de RStudio   1.3. Estilo de código   1.4. Depuración (debugging)   1.5. Perfilado (profiling) 2. Quarto para la elaboración de informes   2.1. R Markdown y Quarto   2.2. Ejemplos de documentos en Quarto   2.3. Personalizaciones avanzadas   2.4. Cómo redactar buenos informes: estilo, contenido, errores comunes   2.5. Otros temas 3. Aplicaciones Shiny   3.1. Paradigma principal   3.2. Ejemplos de aplicaciones sencillas   3.3. Reacciones y apariencia   3.4. Aplicaciones más avanzadas   3.5. Otros temas 4. Modelado rápido con AutoML   4.1. Introducción a AutoML   4.2. Explicabilidad (explainability)   4.3. Ejemplos en regresión con h2o   4.4. Ejemplos en clasificación binaria con h2o   4.5. Ejemplos en clasificación multiclase con h2o 5. Manipulación de datos con tidyverse I   5.1. dplyr   5.2. tidyr   5.3. readr   5.4. tibble   5.5. Otros paquetes 6. Manipulación de datos con tidyverse II   6.1. stringr   6.2. forcats   6.3. lubridate y hms   6.4. purrr y furrr   6.5. Otros paquetes 7. Modelado rápido con tidymodels I   7.1. broom   7.2. rsample   7.3. parsnip   7.4. yardstick   7.5. Otros paquetes 8. Modelado rápido con tidymodels II   8.1. recipes   8.2. workflows   8.3. dials y tune   8.4. agua y discrim   8.5. Otros paquetes El programa está sujeto a modificaciones menores debido al desarrollo del curso y/o al calendario académico.
Actividades formativas, metodología a utilizar y régimen de tutorías
Las clases consisten en una mezcla de exposiciones referentes al software visto y del uso práctico del mismo. Se emplea el lenguaje estadístico R. Se espera que los estudiantes traigan sus propios portátiles para experimentar con el código durante las clases. * Actividades formativas   - AF1: Clase teórica.   - AF2: Clase práctica.   - AF5: Tutorías.   - AF6: Trabajo en grupo.   - AF7: Trabajo individual.   - AF8: Pruebas de evaluación presenciales. * Metodologías docentes   - MD1: Exposiciones en clase del profesor con soporte de medios informáticos y audiovisuales, en las que se desarrollan los conceptos principales de la materia y se proporciona la bibliografía para complementar el aprendizaje de los alumnos.   - MD2: Lectura crítica de textos recomendados por el profesor de la asignatura: Artículos de prensa, informes, manuales y/o artículos académicos, bien para su posterior discusión en clase, bien para ampliar y consolidar los conocimientos de la asignatura.   - MD3: Resolución de casos prácticos, problemas, etc. planteados por el profesor de manera individual o en grupo.   - MD4: Exposición y discusión en clase, bajo la moderación del profesor de temas relacionados con el contenido de la materia, así como de casos prácticos.   - MD5: Elaboración de trabajos e informes de manera individual o en grupo.
Sistema de evaluación
  • Peso porcentual del Examen/Prueba Final 0
  • Peso porcentual del resto de la evaluación 100

Calendario de Evaluación Continua


Bibliografía básica
  • Hadley, W. y Grolemund, G.. R for Data Science. O'Reilly. 2017
  • Xie, Y., Allaire, J.J. y Grolemund, G.. R Markdown. CRC Press/Chapman & Hall. 2019
Recursos electrónicosRecursos Electrónicos *
(*) El acceso a algunos recursos electrónicos puede estar restringido a los miembros de la comunidad universitaria mediante su validación en campus global. Si esta fuera de la Universidad, establezca una VPN


El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.