Última actualización: 18/05/2022


Curso Académico: 2022/2023

Programación de Datos
(19138)
Titulación: M.U Ciencias Sociales Computacionales (375)
Escuela de Economía y Ciencia Política


Coordinador/a: UCAR MARQUES, IÑAKI

Departamento asignado a la asignatura: Instituto UC3M-Santander de Big Data

Tipo: Obligatoria
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Introducción a la Programación con R (19151)
Objetivos
Competencias Básicas: - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación. - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio. - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios. - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades. - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo. Competencias Generales: - Capacidad para comprender y analizar las principales teorías sociales de carácter global y cómo están cambiando con la aplicación de herramientas computacionales. - Capacidad para identificar, definir y formular problemas de las ciencias sociales y resolverlos mediante técnicas computacionales. Esta capacidad incluye la valoración simultánea de todos los factores en juego, no sólo técnicos, sino también legales. - Capacidad de recopilar y analizar los conocimientos existentes en las diferentes áreas de las ciencias sociales computacionales y de hacer una propuesta de posibles soluciones a los problemas planteados. - Capacidad para aplicar los conocimientos teóricos y metodológicos propios de las ciencias sociales computacionales al análisis y resolución de casos y problemas empíricos concretos. - Capacidad para abordar de manera proactiva los problemas planteados bajo entornos nuevos o poco conocidos, dentro del contexto de las ciencias sociales computacionales. Competencias Específicas: - Capacidad de utilizar con nivel avanzado las herramientas computacionales específicas de las ciencias sociales computacionales. Resultados del Aprendizaje: - Conocimiento de las herramientas propias de las ciencias sociales computacionales. - Conocimiento de las estructuras y procedimientos propios de la programación con datos. - Capacidad de importar datos tabulares en una variedad de formatos con el lenguaje de programación R. - Capacidad de trabajar con bases de datos remotas. - Capacidad de preparar, limpiar, transformar y enriquecer datos tabulares para su posterior modelado y visualización con los lenguajes de programación R y SQL.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
1. Programación en R 1.1. Tipos de datos y operaciones principales 1.2. Condicionales and control de flujo 1.3. Bucles y programación vectorial 1.4. Funciones 1.5. Entender errores y depurar el código 2. Manejo de datos 2.1. Importar y exportar datos tabulares 2.2. Filtrado y reordenación de datos 2.3. Análisis exploratorio básico 2.4. Agregación de datos. La familia "apply" 2.5. Combinar data frames 2.6. Formatos largo y ancho 3. Ecosistema R 3.1. Paquetes y CRAN 3.2. Tendencias y referentes 4. Tidyverse 4.1. El operador "Pipe" 4.2. Paquete tidyr 4.3. Paquete dplyr 5. Tipos de datos avanzados 5.1. Factores 5.2. Fechas y horas: paquete lubridate 5.3. Cadenas de texto: expresiones regulares y paquete stringr
Actividades formativas, metodología a utilizar y régimen de tutorías
Actividades Formativas: - Clases teórico-prácticas - Tutorías - Trabajo en grupo - Trabajo individual del estudiante - Exámenes parciales y finales Metodologías Docentes: - Exposiciones en clase del profesor con soporte de medios informáticos y audiovisuales, en las que se desarrollan los conceptos principales de la materia y se proporciona la bibliografía para complementar el aprendizaje de los alumnos. - Resolución de casos prácticos, problemas, etc., planteados por el profesor de manera individual o en grupo.
Sistema de evaluación
  • Peso porcentual del Examen Final 50
  • Peso porcentual del resto de la evaluación 50
Bibliografía básica
  • Hadley Wickham. R for Data Science. O¿Reilly. 2017
Bibliografía complementaria
  • Chester Ismay and Albert Y. Kim. Statistical Inference via Data Science: a Modern Dive into R and the tidyverse. Chapman & Hall. 2022
  • Steph Locke. Data Manipulation in R. Locke Data. 2017

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.