Última actualización: 29/04/2024


Curso Académico: 2024/2025

Introduccion al data mining para la empresa
(13478)
Grado en Administración de Empresas (Plan: 395 - Estudio: 204)


Coordinador/a: MUÑOZ GARCIA, ALBERTO

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Optativa
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Esta asignatura asume que el alumno conoce la materia impartida en: a) Estadística I (http://www3.uc3m.es/reina/Fichas/Idioma_1/204.13154.html), b) Estadística II (http://www3.uc3m.es/reina/Fichas/Idioma_1/204.13160.html), y el tema de Propiedades de Matrices en c) Matemáticas para la economía II (http://www3.uc3m.es/reina/Fichas/Idioma_1/204.13156.html) del grado de Administración de Empresas. Es deseable tener algunas nociones en Estadística Multiva
Objetivos
1. Conocer y utilizar técnicas estadísticas avanzadas, con soporte informático de última generación. 2. Extraer y analizar información de grandes conjuntos de datos. 3. Adquirir las habilidades estadísticas para el análisis de datos multivariantes socio-económicos, tales como los que aparecen en investigación de mercados. 4. Habilidad de describir y analizar conjuntos de datos reales con las técnicas mencionadas. 5. Capacidad de elaborar informes de resultados de los análisis sobre estudios de caso reales. 1. Capacidad de análisis y síntesis de la información en problemas de Data Mining. 2. Resolución de problemas reales. 3. Conocimiento y adiestramiento en el uso de software estadístico para la resolución de problemas reales. 4. Razonamiento crítico y selectivo frente a la resolución de problemas. 5. Habilidades de presentación de resultados
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
1. Aprendizaje del paquete estadístico R. 1.1 Comandos básicos. 1.2 Visualización de datos en R. 1.3 Funciones de análisis de datos en R. 2. Técnicas de visualización para datos complejos de empresa y finanzas 2.1 Teoría del análisis de componentes principales. 2.2 Ejemplos básicos e implementación en R. 2.3 Caso de estudio. 3. Escalado multidimensional. 3.1 Teoría del escalado métrico. 3.2 Ejemplos en R. 3.3 Mapas perceptuales en R. 4. Análisis de cluster (detección de grupos en datos complejos). 4.1 Métodos jerárquicos. 4.2 Métodos de centroides: k-medias. 4.3 Casos de estudio. 5. Árboles de clasificación. 6.1 Teoría de la información. 6.2 Algoritmos de construcción de árboles. 6.3 Caso de estudio: credit scoring. 6. Casos de estudio reales adicionales. 6.1 Casos reales comprehensivos que utilizan todas las técnicas estudiadas.
Actividades formativas, metodología a utilizar y régimen de tutorías
1. Clases teóricas (4 créditos ECTS) 2. Clases prácticas con ordenador (2 créditos ECTS) 3. Trabajo final.
Sistema de evaluación
  • Peso porcentual del Examen Final 60
  • Peso porcentual del resto de la evaluación 40

Calendario de Evaluación Continua


Convocatoria extraordinaria: normativa
Bibliografía básica
  • Cesar Perez Lopez, Daniel Santin Gonzalez. Minería de datos. Técnicas y herramientas. Paraninfo . 2007
  • Eva Laude, Henri Laude. Data Scientist y lenguaje R. Ediciones ENI. 2022
Bibliografía complementaria
  • Peter Bruce. Estadística práctica para ciencia de datos con R y Python. O'Reilly. 2022

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.