Última actualización: 16/05/2022


Curso Académico: 2022/2023

Introducción a la ciencia de datos
(16475)
Titulación: Doble Grado Ciencia e Ingeniería de Datos - Ingeniería en Tecnologías de Telecomunicación (371)


Coordinador/a: MINGUEZ SOLANA, ROBERTO

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Formación Básica
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:

Rama de Conocimiento: Ingeniería y Arquitectura



Objetivos
A la finalización del curso los estudiantes serán capaces de: Conocer la importancia de la ciencia de datos en la sociedad del conocimiento actual. Utilizar técnicas de visualización de datos para entender el problema al que se enfrentan un científico de datos, así como para presentar los resultados obtenidos. Conocer cuando utilizar una técnica de análisis de datos supervisada y cuando una no supervisada. Conocer algunas de las principales técnicas del análisis de datos, así como aplicaciones donde han sido utilizadas exitosamente. Conocer los principales problemas con los que se puede encontrar un científico de datos y como enfrentarlos. Conocer cuáles son las diferentes herramientas que utiliza un científico de datos. Ser capaces de realizar sus primeros análisis de datos empleando R-Studio.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
1. Importancia de la Ciencia de Datos 2. Introducción a R-Studio 3. Entendiendo los datos: Casos de estudio de análisis exploratorio de datos y técnicas de visualización I 4. Entendiendo los datos: Casos de estudio de análisis exploratorio de datos y técnicas de visualización II 5. Importancia de un buen diseño de experimentos y selección de las medidas de rendimiento: precisión, sensibilidad, especificidad. Sobreajuste 6. Introducción a la clasificación supervisada: casos de estudio sobre árboles de decisión y bosques aleatorios 7. Introducción a las técnicas no supervisadas: casos de estudio de técnicas de agrupación
Actividades formativas, metodología a utilizar y régimen de tutorías
La asignatura se imparte en 14 clases teórico-prácticas y 14 clases prácticas. La asignatura es eminentemente práctica, y por ese motivo en las clases magistrales se explicarán los conceptos principales teóricos de la asignatura, pero también se pondrán en práctica con ejercicios con ordenador. Estos conceptos se profundizarán en las clases prácticas en las que se realizarán análisis adicionales de datos con ordenador. Los estudiantes dispondrán además de tutorías donde pondrán resolver las dudas que tengan, tanto de las clases teóricas, prácticas o sobre los trabajos que tienen que entregar.
Sistema de evaluación
  • Peso porcentual del Examen Final 60
  • Peso porcentual del resto de la evaluación 40
Calendario de Evaluación Continua
Bibliografía básica
  • PATHAK, Manas A.. "Beginning Data Science with R". Springer. 2014
Bibliografía complementaria
  • Bruce, P. C. & Bruce, A.. Practical statistics for data scientists: 50 essential concepts.. O'Reilly. 2017
  • Irizarry, R. A.. Introduction to data science: data analysis and prediction algorithms with R.. CRC Press. 2020
  • Peng, R. D.. R programming for data science.. Leanpub. 2016

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.