Última actualización: 04/05/2018


Curso Académico: 2018/2019

Big data para la empresa
(13483)
Titulación: Grado en Administración de Empresas (204)


Coordinador/a: AUSIN OLIVERA, MARIA CONCEPCION

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Optativa
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Materias que se recomienda haber superado
Estadística I Estadística I Técnicas de análisis de datos para la empresa Introducción a la minería de datos para la inteligencia de negocios
Competencias que adquiere el estudiante y resultados del aprendizaje.Más información en este enlace
1. Comprender la importancia de transformar grandes volúmenes de datos en información relevante para la toma de decisiones y desarrollo de negocio en organizaciones, empresas y particulares. 2. Aprender las técnicas básicas de preprocesamiento y visualización de datos. Conocer métodos para trabajar con datos faltantes y atípicos. Adquirir el manejo de técnicas de reducción de la dimensión. 3. Conocer los principales métodos de aprendizaje supervisado en regresión y su utilidad en problemas de predicción. Distinguir entre modelos lineales y no lineales y comprender la importancia de los métodos de selección de modelos. 4. Familiarizarse con los procedimientos habituales de aprendizaje supervisado para clasificación. Entender los clasificadores más habituales y sus limitaciones. Conocer métodos avanzados en clasificación y sus beneficios en la empresa. 5. Ser capaz de identificar las técnicas adecuadas del Big Data en problemas reales en la empresa: clasificación de clientes, scoring, gestión de riesgos, detección de fraude, predicción de bancarrota, etc.
Descripción de contenidos: Programa
1. Introducción. 2. Recopilación, muestreo y preprocesamiento de datos. 2.1. Tipos de datos 2.2. Muestreo 2.3. Herramientas de visualización de datos 2.4. Valores perdidos 2.5. Detección y tratamiento de atípicos. 2.6. Transformaciones de datos. 2.7. Reducción de la dimensión. 2.8. Aplicación: Gestión de riesgos en el Mercado de valores. 3. Aprendizaje supervisado: Regresión. 3.1. Regresión lineal y polinómica. 3.2. Validación cruzada. 3.3. Selección de modelos y métodos de regularización (ridge y lasso). 3.4. Modelos no lineales, splines y modelos aditivos generalizados. 3.5. Aplicación: Predicción de credit-scoring. 4. Aprendizaje supervisado: Clasificación. 4.1. Clasificadores de Bayes 4.2. Regresión logística. 4.3. K-vecinos más cercanos. 4.4. Random forest 4.5. Máquinas de vector soporte. 4.6. Boosting. 4.7. Aplicación: Riesgo de créditos 4.8. Aplicación: detección de fraude 4.9. Aplicación: Predicción de bancarrota.
Actividades formativas, metodología a utilizar y régimen de tutorías
Teoría (2 ECTS). Clases teóricas con material de apoyo disponible en la Web. Prácticas (4 ECTS) Clases de resolución de problemas. Prácticas computacionales en aulas informáticas. Trabajos a realizar en grupo. Tutorías semanales para asesorar a los estudiantes individualmente o en grupos.
Sistema de evaluación
  • Peso porcentual del Examen Final 50
  • Peso porcentual del resto de la evaluación 50
Bibliografía básica
  • Daniel Peña. Análisis de datos multivariantes.. McGraw-Hill. 2002

El programa de la asignatura y la planificación semanal podrían sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.