Última actualización: 10/06/2021


Curso Académico: 2021/2022

Aprendizaje automático para el análisis de datos
(13728)
Grado en Estadística y Empresa (Plan 2008) (Plan: 146 - Estudio: 203)


Coordinador/a: ALER MUR, RICARDO

Departamento asignado a la asignatura: Departamento de Informática

Tipo: Optativa
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Programación II
Objetivos
1.) DE CONOCIMIENTO: - Dominar los conceptos básicos sobre la extracción de conocimiento a partir de datos - Conocer las diferentes tareas que se pueden resolver con aprendizaje automático - Conocer las técnicas de aprendizaje automático y su tipología - Conocer la metodología de extracción de conocimiento y las fases que conlleva - Conocer herramientas disponibles para la extracción de conocimiento 2.) DE COMPRENSION: - Comprender los conceptos básicos de la extracción del conocimiento - Comprender los fundamentos y las motivaciones de la minería de datos - Comprender la metodología de trabajo y las distintas fases de extracción de conocimiento - Comprender la utilidad de las diferentes técnicas de extracción de conocimiento - Comprender las diferencias de diferentes representaciones: proposicionales y relacionales - Comprender la relación entre complejidad del modelo, cantidad de datos, características del problema y sobreaprendizaje 3.) DE APLICACIÓN: - Analizar los dominios y diseñar procesos de extracción de conocimiento acordes al problema. - Evaluar las prestaciones y eficiencia de los distintos métodos de extracción de conocimiento - Trabajar sobre dominios específicos y contrastar distintas técnicas para comprobar su rendimiento en la extracción de conocimiento 4.) CRITICA O VALORACIÓN - Selección de algoritmos, selección de modelos y ajuste de parámetros. - Considerar la relación entre coste computacional y mejora marginal de diferentes soluciones - Valoración de si los resultados obtenidos son adecuados, comparados con el azar o algoritmos básicos
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
1. Introduccion al aprendizaje automático 2. Métodos básicos para clasificación y regresión: 2.1 Vecino más cercano (KNN) 2.2 Árboles y reglas 3. Metodología en aprendizaje automático 3.1. Entrenamiento de modelos 3.2. Ajuste de hiper-parámetros 3.3. Evaluación de modelos 3.4. Preproceso de datos y selección de atributos 4. Aprendizaje automático con R y con la librería MLR (mlr3). 5. Métodos avanzados para clasificación y regresión: 5.1. Conjuntos de modelos (ensembles): bagging, Random Forests, boosting 5.2. Máquinas de vectores de soporte 6. Breve introducción al aprendizaje automático en Python (librería scikit-learn)
Actividades formativas, metodología a utilizar y régimen de tutorías
La asignatura se impartirá mediante lecciones magistrales las clases de teoría y mediante clases tutoradas las clases prácticas. Las clases magistrales estarán enfocadas a enseñar todos los conceptos relativos a aprendizaje automático. Las clases prácticas (grupos reducidos) se desarrollarán para que, de un modo tutorado, el alumno aprenda a resolver problemas reales . Las prácticas se realizarán en grupos de 2 personas. Existirán varias prácticas relacionadas con los distintos temas de la asignatura. Se realizarán tutorías para ayudar en una comprensión mas personalizada de los temas teóricos y prácticos
Sistema de evaluación
  • Peso porcentual del Examen Final 20
  • Peso porcentual del resto de la evaluación 80
Calendario de Evaluación Continua
Bibliografía básica
  • Aurélien Géron. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. O'Reilly Media. 2019
  • Brett Lantz. Machine Learning with R. Packt Publishing. 2019
  • Hefin I. Rhy. Machine Learning with R, the tidyverse, and mlr. Manning Publications. 2019
  • Max Kuhn. Applied Predictive Modeling. Springer. 2013
Recursos electrónicosRecursos Electrónicos *
Bibliografía complementaria
  • Hadley Wickham, Garrett Grolemund, . R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media. 2016
Recursos electrónicosRecursos Electrónicos *
Contenido detallado de la asignatura o información adicional para TFM
(*) El acceso a algunos recursos electrónicos puede estar restringido a los miembros de la comunidad universitaria mediante su validación en campus global. Si esta fuera de la Universidad, establezca una VPN


El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.