Última actualización: 20/03/2024


Curso Académico: 2024/2025

Depuración de Datos y Generación de Informes
(17774)
Máster Universitario en Estadística para la Ciencia de Datos (Plan: 386 - Estudio: 345)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: GARCIA PORTUGUES, EDUARDO

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Optativa
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Programación en R Programación Avanzada
Objetivos
El estudiante adquirirá los siguientes conocimientos: - Conocimiento de técnicas de presentación automática de resultados en informes. - Capacidad de desarrollar aplicaciones Shiny. - Conocimiento del entorno tidyverse. - Conocimiento del entorno tidymodels.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
Este curso cubre varias herramientas para agilizar el proceso de consultoría en R: desde la organización y el manejo de datos hasta la presentación de resultados, pasando por un rápido modelado estadístico. El énfasis se encuentra en ver las principales características de muchos paquetes y soluciones diferentes. 1. R Markdown avanzado para la creación de informes   1.1. Temas avanzados en R Markdown   1.2. Escribiendo buenos informes   1.3. Presentaciones personalizadas   1.4. Otros documentos y temas 2. Aplicaciones Shiny   2.1. Paradigma principal   2.2. Examples of simple applications   2.3. Reactions and appearance   2.4. More advanced applications   2.5. flexdashboard   2.6. Otros temas 3. Manejo de datos dentro del tidyverse I   3.1. dplyr   3.2. tidyr   3.3. readr   3.4. tibble   3.5. Otros paquetes 4. Manejo de datos dentro del tidyverse II   4.1. stringr   4.2. forcats   4.3. lubridate y hms   4.4. glue   4.5. purrr   4.6. Otros paquetes 5. Modelización rápida usando AutoML   5.1. Introducción al AutoML   5.2. Explicabilidad   5.3. Ejemplos en regresión   5.4. Ejemplos en clasificación binaria   5.5. Ejemplos en clasificación multiclase 6. Modelización rápida con tidymodels I   6.1. broom   6.2. rsample   6.3. parsnip   6.4. yardstick   6.5. Otros paquetes 7. Modelización rápida con tidymodels II   7.1. recipes   7.2. workflows   7.3. tune   7.4. infer   7.5. Otros paquetes El programa está sujeto a modificaciones menores debido al desarrollo del curso y/o al calendario académico.
Actividades formativas, metodología a utilizar y régimen de tutorías
Las clases consisten en una mezcla de exposiciones referentes al software visto y del uso práctico del mismo. Se emplea el lenguaje estadístico R. Se espera que los estudiantes traigan sus propios portátiles para experimentar con el código durante las clases. * Actividades formativas   - AF1: Clase teórica.   - AF2: Clase práctica.   - AF5: Tutorías.   - AF6: Trabajo en grupo.   - AF7: Trabajo individual.   - AF8: Pruebas de evaluación presenciales. * Metodologías docentes   - MD1: Exposiciones en clase del profesor con soporte de medios informáticos y audiovisuales, en las que se desarrollan los conceptos principales de la materia y se proporciona la bibliografía para complementar el aprendizaje de los alumnos.   - MD2: Lectura crítica de textos recomendados por el profesor de la asignatura: Artículos de prensa, informes, manuales y/o artículos académicos, bien para su posterior discusión en clase, bien para ampliar y consolidar los conocimientos de la asignatura.   - MD3: Resolución de casos prácticos, problemas, etc. planteados por el profesor de manera individual o en grupo.   - MD4: Exposición y discusión en clase, bajo la moderación del profesor de temas relacionados con el contenido de la materia, así como de casos prácticos.   - MD5: Elaboración de trabajos e informes de manera individual o en grupo.
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100

Calendario de Evaluación Continua


Bibliografía básica
  • Hadley, W. y Grolemund, G.. R for Data Science. O'Reilly. 2017
  • Xie, Y., Allaire, J.J. y Grolemund, G.. R Markdown. CRC Press/Chapman & Hall. 2019
Recursos electrónicosRecursos Electrónicos *
(*) El acceso a algunos recursos electrónicos puede estar restringido a los miembros de la comunidad universitaria mediante su validación en campus global. Si esta fuera de la Universidad, establezca una VPN


El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.