Última actualización: 15/07/2023


Curso Académico: 2023/2024

Extracción de Datos
(19145)
Máster Universitario en Ciencias Sociales Computacionales/ Computational Social Science (Plan: 472 - Estudio: 375)
Escuela de Economía y Ciencia Política


Coordinador/a: GENOVA FUSTER, GONZALO

Departamento asignado a la asignatura: Departamento de Informática

Tipo: Obligatoria
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Programación de Datos (19138)
Objetivos
- Conocimiento de los principios generales del diseño y funcionamiento de APIs, así como de los formatos más comunes de intercambio de información. - Capacidad de identificar y acceder a APIs online para la descarga de datos observacionales de tipo social. - Capacidad de compilar bases de datos estructuradas a partir de fuentes no estructuradas.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
1. Introducción al Web Scraping - ¿Qué es el Web Scraping? - Tipos de Web Scraping - Formatos de datos: XML y HTML - Acceso práctico a XML y HTML - Automatización de los programas de Web Scraping - Selenium y scraping basado en JavaScript - Cuestiones éticas del Web Scraping - Ejercicios prácticos 2. APIs de datos - Qué es una API - Fundamentos de la comunicación de la API - Introducción al formato JSON - Crea tu propia API (y compártela) - Arquitectura REST - Las API como forma de compartir y obtener datos (de cualquier tipo) - Automatización de las solicitudes de la API - Hablar con las bases de datos - Autenticación y acceso ético a las APIs - Ejercicios prácticos 3. Automatización de la adquisición de datos - ¿Por qué necesitamos la automatización? - Acceso a los servidores - Tecnologías para la automatización de programas - Automatización de trabajos cron - Tareas de registro - Ejercicios prácticos
Actividades formativas, metodología a utilizar y régimen de tutorías
Actividades Formativas: - Clases teórico-prácticas - Tutorías - Trabajo en grupo - Trabajo individual del estudiante - Exámenes parciales y finales Metodologías Docentes: - Exposiciones en clase del profesor con soporte de medios informáticos y audiovisuales, en las que se desarrollan los conceptos principales de la materia y se proporciona la bibliografía para complementar el aprendizaje de los alumnos. - Lectura crítica de textos recomendados por el profesor de la asignatura: Artículos de prensa, informes, manuales y/o artículos académicos, bien para su posterior discusión en clase, bien para ampliar y consolidar los conocimientos de la asignatura. - Resolución de casos prácticos, problemas, etc., planteados por el profesor de manera individual o en grupo. - Exposición y discusión en clase, bajo la moderación del profesor de temas relacionados con el contenido de la materia, así como de casos prácticos. - Elaboración de trabajos e informes de manera individual o en grupo.
Sistema de evaluación
  • Peso porcentual del Examen Final 20
  • Peso porcentual del resto de la evaluación 80

Bibliografía básica
  • Barberá, P. & Steinert-Threlkeld, Z. . How to use social media data for political science research. In The SAGE handbook of research methods in political science and international relations (Vol. 2, pp. 404-423). . SAGE Publications Ltd, https://dx.doi.org/10.4135/9781526486387. 2020
  • Freelon, D.. Computational research in the post-API age. . Political Communication, 35(4), 665-668.. 2018
  • Nyhuis, D. . Web data collection: potentials and challenges. In: The SAGE handbook of research methods in political science and international relations (Vol. 2, pp. 387-403). . SAGE Publications Ltd, https://dx.doi.org/10.4135/9781526486387. 2020
  • Perriam, J., Birkbak, A., & Freeman, A. . Digital methods in a post-API environment. . International Journal of Social Research Methodology, 23(3), 277-290.. 2020
Recursos electrónicosRecursos Electrónicos *
Bibliografía complementaria
  • Aydin, O. . R Web Scraping Quick Start Guide: Techniques and tools to crawl and scrape data from websites.. -. 2018
  • Munzert, S., Rubba, C., Meißner, P., & Nyhuis, D. . Automated data collection with R: A practical guide to web scraping and text mining. . John Wiley & Sons.. 2014
(*) El acceso a algunos recursos electrónicos puede estar restringido a los miembros de la comunidad universitaria mediante su validación en campus global. Si esta fuera de la Universidad, establezca una VPN


El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.