Última actualización: 30/04/2025 12:40:36


Curso Académico: 2025/2026

Introducción a la ciencia de datos
(16475)
Grado en Ciencia e Ingeniería de Datos (Plan: 566 - Estudio: 350)


Coordinador/a: DELGADO GOMEZ, DAVID

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Formación Básica
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:

Rama de Conocimiento: Ingeniería y Arquitectura



Objetivos
A la finalización del curso los estudiantes serán capaces de: Conocer la importancia de la ciencia de datos en la sociedad del conocimiento actual. Utilizar técnicas de visualización de datos para entender los problemas a los que se enfrenta un científico de datos, así como para presentar los resultados obtenidos. Conocer cuando utilizar una técnica de análisis de datos supervisada y cuando una no supervisada. Conocer algunas de las principales técnicas del análisis de datos, así como aplicaciones donde han sido utilizadas exitosamente. Conocer los principales problemas con los que se puede encontrar un científico de datos y como enfrentarlos. Conocer cuáles son las diferentes herramientas que utiliza un científico de datos. Ser capaces de realizar sus primeros análisis de datos empleando R-Studio.
Resultados del proceso de formación y aprendizaje
K5: Comprender y relacionar conceptos fundamentales de probabilidad y estadística y ser capaz de representar y manipular datos para extraer información significativa de los mismos. K7: Conocer los conceptos básicos de la programación, incluyendo estructuras de control, tipos de datos y funciones, y su aplicación en el desarrollo de programas orientados al análisis, procesamiento y visualización de datos en el ámbito de la Ciencia e Ingeniería de Datos. S1: Planificar y organizar trabajos en equipo tomando las decisiones correctas basadas en la información disponible y reuniendo datos en entornos digitales. S2: Utilizar la información interpretando datos relevantes evitando el plagio, y de acuerdo con las convenciones académicas y profesionales del área de estudio, siendo capaz de evaluar la fiabilidad y la calidad de dicha información. S16: Ser capaz de sintetizar las conclusiones obtenidas de los análisis realizados y presentarlas de manera clara y convincente tanto por escrito como oralmente, y tanto ante un público especializado como no especializado C5: Ser capaz de analizar y sintetizar problemas básicos relacionados con la ingeniería y la ciencia de datos, elaborar, defender y comunicar eficientemente soluciones de forma individual y profesional, aplicando los conocimientos, habilidades, herramientas y estrategias adquiridas o desarrolladas en su área de estudio.
Descripción de contenidos: Programa
1. Importancia de la Ciencia de Datos 2. Introducción a R-Studio 3. Entendiendo los datos: Casos de estudio de análisis exploratorio de datos y técnicas de visualización I 4. Entendiendo los datos: Casos de estudio de análisis exploratorio de datos y técnicas de visualización II 5. Importancia de un buen diseño de experimentos y selección de las medidas de rendimiento: precisión, sensibilidad, especificidad. Sobreajuste 6. Introducción a la clasificación supervisada: casos de estudio sobre árboles de decisión y bosques aleatorios 7. Introducción a las técnicas no supervisadas: casos de estudio de técnicas de agrupación
Actividades formativas, metodología a utilizar y régimen de tutorías
La asignatura se imparte en 14 clases teórico-prácticas y 14 clases prácticas. La asignatura es eminentemente práctica, y por ese motivo en las clases magistrales se explicarán los conceptos principales teóricos de la asignatura, pero también se pondrán en práctica con ejercicios con ordenador. Estos conceptos se profundizarán en las clases prácticas en las que se realizarán análisis adicionales de datos con ordenador. Los estudiantes dispondrán además de tutorías donde pondrán resolver las dudas que tengan, tanto de las clases teóricas, prácticas o sobre los trabajos que tienen que entregar.
Sistema de evaluación
  • Peso porcentual del Examen/Prueba Final 0
  • Peso porcentual del resto de la evaluación 100

Calendario de Evaluación Continua


Convocatoria extraordinaria: normativa
Bibliografía básica
  • PATHAK, Manas A.. "Beginning Data Science with R". Springer. 2014
Bibliografía complementaria
  • Bruce, P. C. & Bruce, A. . Practical statistics for data scientists: 50 essential concepts.. O'Reilly. 2017
  • Irizarry, R. A.. Introduction to data science: data analysis and prediction algorithms with R.. CRC Press. 2020
  • Peng, R. D.. R programming for data science.. Leanpub. 2016

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.