Última actualización: 07/05/2018


Curso Académico: 2018/2019

Introducción a la ciencia de datos
(16475)
Grado en Ciencia e Ingeniería de Datos (Plan: 392 - Estudio: 350)


Coordinador/a: DELGADO GOMEZ, DAVID

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Formación Básica
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:

Rama de Conocimiento: Ingeniería y Arquitectura



A la finalización del curso los estudiantes serán capaces de: Conocer la importancia de la ciencia de datos en la sociedad del conocimiento actual. Utilizar técnicas de visualización de datos para entender el problema al que se enfrentan un científico de datos así como para presentar los resultados obtenidos. Conocer cuando utilizar una técnica de análisis de datos supervisada y cuando una no supervisada. Conocer algunas de las principales técnicas del análisis de datos así como aplicaciones donde han sido utilizadas exitosamente. Conocer los principales problemas con los que se puede encontrar un científico de datos y como enfrentarlos Conocer cuales son las diferentes herramientas que utiliza un científico de datos.
Descripción de contenidos: Programa
1. Importancia de la Ciencia de Datos 2. Entendiendo los datos: Casos de estudio de análisis exploratorio de datos y técnicas de visualización I 3. Entendiendo los datos: Casos de estudio de análisis exploratorio de datos y técnicas de visualización II 4. Importancia de un buen diseño del experimento y selección de las medidas de rendimiento: precisión, sensibilidad, especificidad, curvas ROC. Sobreajuste. 5. Introducción a las técnicas no supervisadas: casos de estudio de clustering I 6. Casos de estudio de clustering II 7. Introducción a la clasificación no supervisada: casos de estudio sobre arboles de decisión y bosques aleatorios. 8. Casos de estudio sobre técnicas de reducción de datos (Análisis de Componentes Principales, Análisis de Componentes Independientes, Análisis discriminante de Fisher). 9. Introducción a la regresión: Casos de estudio de Regresión Lineal. 10. Casos de estudio de Regresión Logística. 11. Casos de estudio sobre modelos probabilísticos. 12. Introducción al estado del arte:casos de estudio sobre máquinas de vectores Soporte. 13. Casos de estudio sobre aprendizaje profundo.
Actividades formativas, metodología a utilizar y régimen de tutorías
La asignatura se imparte en 14 clases teóricas y 14 clases practicas. En las clases teóricas se explicarán los conceptos principales de la asignatura. Estos conceptos se profundizaran en las clases prácticas en las que se realizarán diversos análisis de datos con ordenador. Los estudiantes dispondrán además de una tutoría colectiva donde pondrán resolver las dudas que tengan tanto de las clases teóricas, prácticas o sobre los trabajos que tienen que entregar.
Sistema de evaluación
  • Peso porcentual del Examen Final 50
  • Peso porcentual del resto de la evaluación 50

Bibliografía básica
  • Peter Bruce & Andrew Bruce. Practical Statistics for data scientists:50 essential concepts. O'really. 2018

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.