Última actualización: 10/06/2021


Curso Académico: 2021/2022

Estadística No Paramétrica
(17764)
Titulación: Máster Universitario en Estadística para la Ciencia de Datos (345)
Escuela de Ingeniería y Ciencias Básicas


Coordinador/a: GARCIA PORTUGUES, EDUARDO

Departamento asignado a la asignatura: Departamento de Estadística

Tipo: Obligatoria
Créditos: 3.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
Matemáticas para Data Science Probabilidad Inferencia Estadística Programación en R Análisis Multivariante Modelos de Regresión Programación Avanzada
Objetivos
* Competencias básicas - CB6: Poseer y comprender los conocimientos que proporcionan una base u oportunidad para ser original en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación. - CB9: Que los estudiantes sepan cómo comunicar sus conclusiones y el conocimiento y las razones últimas que las sustentan a audiencias especializadas y no especializadas de una manera clara e inequívoca. - CB10: Que los estudiantes tengan las habilidades de aprendizaje que les permitan continuar estudiando de manera que sean en gran medida autodirigidos o autónomos. * Competencias generales - CG1: Capacidad de aplicar las técnicas de análisis y representación de la información, para adaptarla a problemas reales. - CG4: Sintetizar las conclusiones obtenidas del análisis de datos y presentarlas de forma clara y convincente en un entorno bilingüe (español e inglés) tanto escrito como oral. - CG5: Ser capaz de generar nuevas ideas (creatividad) y anticiparse a nuevas situaciones, en los contextos de análisis de datos y toma de decisiones. - CG6: Utilizar las habilidades sociales para el trabajo en equipo y para relacionarse con los demás de forma autónoma. * Competencias específicas - CE1: Aplicar en el desarrollo de métodos de análisis de problemas reales, conocimientos avanzados de inferencia estadística. - CE2: Usar software libre como R y Python para la implementación de análisis estadísticos. - CE5: Aplicar los fundamentos estadísticos avanzados para el desarrollo y análisis de problemas reales, que implican la predicción de una respuesta variable. - CE6: Aplicar modelos no paramétricos para la interpretación y predicción de fenómenos aleatorios. - CE10: Aplicar la modelización estadística en el tratamiento de problemas relevantes en el campo científico.
Competencias y resultados del aprendizaje
Descripción de contenidos: Programa
Este curso está diseñado para dar una visión panorámica de varias herramientas disponibles en la estadística no paramétrica, a un nivel intermedio-avanzado. Esta visión abarca en profundidad los principales conceptos en la estimación de las funciones de densidad y regresión mediante métodos núcleo (con sus correspondientes aplicaciones), y la descripción de varias pruebas no paramétricas comunes. Se hace hincapié en proporcionar las principales ideas sobre los fundamentos estadísticos/matemáticos de los métodos y en mostrar la aplicación efectiva de los métodos mediante el uso de software estadístico. Esto se logra mediante una mezcla de teoría y código reproducible. 1. Introducción 1.1. Repaso de probabilidad 1.2. Repaso de distribuciones 1.3. Repaso de la convergencia estocástica 1.4. Notación OP y oP 1.5. Repaso de herramientas analíticas básicas 1.6. ¿Por qué la estadística no paramétrica? 2. Estimación núcleo de la densidad I 2.1. Histogramas 2.2. Estimación núcleo de la densidad 2.3. Propiedades asintóticas 2.4. Selección del ancho de banda 2.5. Cuestiones prácticas 2.6. Estimación núcleo de la densidad con ks 3. Estimación núcleo de la densidad II 3.1. Estimación núcleo de la densidad multivariante 3.2. Propiedades asintóticas 3.3. Selección del ancho de banda 3.4. Aplicaciones de la estimación núcleo de la densidad 4. Estimación núcleo de la regresión I 4.1. Estimación núcleo de la regresión 4.2. Propiedades asintóticas 4.3. Selección del ancho de banda 4.4. Regresograma 4.5. Estimación núcleo de la regresión con np 5. Estimación núcleo de la regresión II 5.1. Regresión núcleo con datos multivariantes mixtos 5.2. Selección del ancho de banda 5.3. Predicción e intervalos de confianza 5.4. Verosimilitud local 6. Tests no paramétricos 6.1. Tests de bondad de ajuste para distribuciones 6.2. Comparación de distribuciones 6.3. Tests de independencia El programa está sujeto a modificaciones debido al desarrollo del curso y/o al calendario académico.
Actividades formativas, metodología a utilizar y régimen de tutorías
Las clases consisten en una mezcla de teoría (descripción de los métodos) y práctica (implementación y aplicación de los métodos). Se emplea el lenguaje estadístico R, por lo que una buena capacidad de programación en él es fundamental para comprender las aplicaciones. Se espera que los estudiantes traigan sus propios portátiles para experimentar con el código durante algunas partes de las clases.
Sistema de evaluación
  • Peso porcentual del Examen Final 0
  • Peso porcentual del resto de la evaluación 100
Calendario de Evaluación Continua
Bibliografía básica
  • Chacón, J. E. y Duong, T.. Multivariate Kernel Smoothing and Its Applications. Chapman and Hall/CRC. 2018
  • Fan, J. y Gijbels, I.. Local polynomial modelling and its applications. 1996. Chapman & Hall
  • Li, Q. y Racine, J. S.. Nonparametric Econometrics. Princeton University Press. 2007
  • Wand, M. P. y Jones, M. C.. Kernel Smoothing. Chapman & Hall. 1995
  • Wasserman, L.. All of Nonparametric Statistics. Springer-Verlag. 2006
  • Wasserman, L.. All of Statistics. Springer-Verlag. 2004

El programa de la asignatura y la planificación semanal podrían sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.