Última actualización: 07/07/2020


Curso Académico: 2020/2021

Aprendizaje estadístico
(17234)
Máster Universitario en Métodos Analíticos para Datos Masivos: Big Data/Master in Big Data Analytics (Plan: 352 - Estudio: 322)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: GALEANO SAN MIGUEL, PEDRO

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Obligatoria
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Modelos estadísticos para análisis de datos Matemáticas aplicadas para análisis de datos
Objetivos
Competencias Básicas Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo. Competencias Generales Aplicar los fundamentos teóricos de las técnicas de recogida, almacenamiento, tratamiento y presentación de información, especialmente para grandes volúmenes de datos, como base para el desarrollo y adaptación de dichas técnicas a problemas concretos Identificar diferentes técnicas para almacenar, replicar y distribuir grandes cantidades de datos, y diferenciarlas en función de sus características teóricas y prácticas Identificar las técnicas de análisis de datos mas adecuadas para cada problema y saber aplicarlas para el análisis, diseño y solución de los mismos Obtener soluciones prácticas y eficientes para problemas de tratamiento de grandes volúmenes de datos, tanto individualmente como en equipo Sintetizar las conclusiones obtenidas de estos análisis y presentarlas de manera clara y convincente en un entorno bilingüe (español e inglés) tanto por escrito como oralmente Ser capaz de generar nuevas ideas (creatividad) y de anticipar nuevas situaciones, en los contextos del análisis de datos y de la toma de decisiones Utilizar habilidades para el trabajo en equipo y para relacionarse con otros de forma autónoma Competencias Específicas Emplear los resultados básicos de inferencia y regresión como fundamento para métodos avanzados de predicción y clasificación Identificar y seleccionar las herramientas software adecuadas para el tratamiento de grandes cantidades de datos Utilizar procedimientos estadísticos avanzados para el tratamiento de grandes volúmenes de datos en áreas como la estimación, la inferencia, la predicción o la clasificación, así como la manera de aplicarlos de forma eficiente Identificar correctamente el tipo de problema estadístico correspondiente a unos objetivos y unos datos determinados Saber diseñar sistemas para el procesamiento de los datos, desde la obtención y filtrado inicial de los mismos, su análisis estadístico, hasta la presentación de los resultados finales Utilizar técnicas y herramientas de investigación operativa utilizables con datos masivos en procedimientos para su análisis, visualización de sus resultados o dentro de sistemas de apoyo a decisiones
Descripción de contenidos: Programa
1. Datos multidimensionales 1.1 ¿Que son datos multidimensionales? 1.2 Ejemplos con datos reales. 1.3 Matriz de datos. 1.4 Visualización de datos. 1.5 Medidas descriptivas. 1.6 Distribuciones multivariantes. 1.7 Estimación máximo verosimil. 1.8 Estimación sparse de la matriz de covarianzas. 2. Técnicas de reducción de dimensión 2.1 Introducción. 2.2 Componentes principales. 2.3 Análisis de componentes independientes. 3. Clasificación no supervisada 3.1 Introducción. 3.2 El problema del clustering. 3.3 Clustering de partición. 3.4 Clustering jerárquico. 3.5 Clustering basado en modelos. 4. Clasificación supervisada 4.1 Introducción. 4.2 Métodos basados en el Teorema de Bayes. 4.3 Métodos basados en k vecinos. 4.4 Regresión logística. 4.5 Clustering jerárquico. 5. Análisis de datos funcionales 5.1 Introducción al análisis de datos funcionales. 5.2 Análisis descriptivo. 5.3 Suavizado de datos funcionales. 5.4 Componentes principales funcionales. 5.5 Clasificación supervisada para datos funcionales. 5.6 Clasificación no supervisada para datos funcionales.
Actividades formativas, metodología a utilizar y régimen de tutorías
Actividades formativas Clase teórica Clases prácticas Prácticas de laboratorio Trabajo individual del estudiante Metodologías docentes Exposiciones en clase del profesor con soporte de medios informáticos y audiovisuales, en las que se desarrollan los conceptos principales de la materia y se proporciona la bibliografía para complementar el aprendizaje de los alumnos. Lectura crítica de textos recomendados por el profesor de la asignatura: Artículos de prensa, informes, manuales y/o artículos académicos, bien para su posterior discusión en clase, bien para ampliar y consolidar los conocimientos de la asignatura. Resolución de casos prácticos, problemas, etc. planteados por el profesor de manera individual o en grupo Elaboración de trabajos e informes de manera individual o en grupo
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100

Bibliografía básica
  • Daniel Peña. Análisis de datos multivariantes. McGraw Hill. 2002

El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.