Última actualización: 26/04/2023


Curso Académico: 2023/2024

Big Data para la empresa
(14476)
Grado en Estadística y Empresa (Plan: 400 - Estudio: 203)


Coordinador/a: AUSIN OLIVERA, MARIA CONCEPCION

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Optativa
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Métodos de Regresión Análisis Multivariante No se recomienda cursar esta asignatura si ya se ha cursado Aprendizaje Estadístico
Objetivos
1. Comprender la importancia de transformar grandes volúmenes de datos en información relevante para la toma de decisiones y desarrollo de negocio en organizaciones, empresas y particulares. 2. Aprender las técnicas básicas de preprocesamiento y visualización de datos. Conocer métodos para trabajar con datos faltantes y atípicos. Adquirir el manejo de técnicas de reducción de la dimensión. 3. Conocer los principales métodos de aprendizaje supervisado en regresión y su utilidad en problemas de predicción. Distinguir entre modelos lineales y no lineales y comprender la importancia de los métodos de selección de modelos. 4. Familiarizarse con los procedimientos habituales de aprendizaje supervisado para clasificación. Entender los clasificadores más habituales y sus limitaciones. Conocer métodos avanzados en clasificación y sus beneficios en la empresa. 5. Ser capaz de identificar las técnicas adecuadas del Big Data en problemas reales en la empresa: clasificación de clientes, scoring, gestión de riesgos, detección de fraude, predicción de bancarrota, etc.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
1. Introducción. 2. Recopilación, muestreo y preprocesamiento de datos. 2.1. Tipos de datos 2.2. Muestreo 2.3. Herramientas de visualización de datos 2.4. Valores perdidos 2.5. Detección y tratamiento de atípicos. 2.6. Transformaciones de datos. 2.7. Reducción de la dimensión. 2.8. Aplicación: Gestión de riesgos en el Mercado de valores. 3. Aprendizaje supervisado: Regresión. 3.1. Regresión lineal y polinómica. 3.2. Validación cruzada. 3.3. Selección de modelos y métodos de regularización (ridge y lasso). 3.4. Modelos no lineales, splines y modelos aditivos generalizados. 3.5. Aplicación: Predicción de credit-scoring. 4. Aprendizaje supervisado: Clasificación. 4.1. Clasificadores de Bayes 4.2. Regresión logística. 4.3. K-vecinos más cercanos. 4.4. Random forest 4.5. Máquinas de vector soporte. 4.6. Boosting. 4.7. Aplicación: Riesgo de créditos 4.8. Aplicación: detección de fraude 4.9. Aplicación: Predicción de bancarrota.
Actividades formativas, metodología a utilizar y régimen de tutorías
Teoría (2 ECTS). Clases teóricas con material de apoyo disponible en la Web. Prácticas (4 ECTS) Clases de resolución de problemas. Prácticas computacionales en aulas informáticas. Trabajos a realizar en grupo. Tutorías semanales para asesorar a los estudiantes individualmente o en grupos.
Sistema de evaluación
  • Peso porcentual del Examen Final 60
  • Peso porcentual del resto de la evaluación 40

Bibliografía básica
  • Daniel Peña. Análisis de datos multivariantes.. McGraw-Hill. 2002

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.