Última actualización: 26/04/2020


Curso Académico: 2019/2020

Recuperación y acceso a la información
(15760)
Doble Grado en Ingeniería Informática y Administración de Empresas (Plan 2011) (Plan: 258 - Estudio: 233)


Coordinador/a: MORATO LARA, JORGE LUIS

Departamento asignado a la asignatura: Departamento de Informática

Tipo: Obligatoria
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
- Ficheros y Bases de Datos (Obligatoria, 2º Curso, 2º Semestre) - Programación Orientada a Objetos (Obligatoria, 1er Curso, 2º Semestre)
(Las competencias relacionadas con el programa ABET se muestran entre paréntesis) Competencias Transversales/Genéricas: - Adquisición sistemática de conocimientos (PO: i) - Capacidad de organizar, planificar y comunicar resultados (PO:g) - Aplicar los conocimientos adquiridos (PO:a, b, c, e, k) - Trabajo en equipo (PO:d) - Integrar los conocimientos adquiridos (PO:a, b, c) - Capacidad de aplicar los conocimientos en la práctica (PO:c) - Resolución de problemas en un contexto multidisciplinar (PO:c) Competencias Específicas: - Cognitivas (Saber) (PO:a, c, j, k) 1. Conocimiento de los modelos de recuperación 2. Conocimientos de las técnicas de procesamiento del lenguaje natural 3. Conocimiento de sistemas para formalizar, sintetizar y estructurar la información 4. Sistemas de seguimiento de trazas 5. Conocimiento una presentación de resultados óptima 6. Conocimiento de los sistemas de mejora en la recuperación y reutilización de conocimiento en la Web y en la Ingeniería del Software - Procedimentales/Instrumentales (Saber hacer) (PO:a, b, c, e, j) 1. Diseño de sistemas de recuperación 2. Diseño de analizadores del lenguaje natural 3. Utilización de minería de textos para mejorar la representación y ordenación de resultados - Actitudinales (Ser) (PO: c, e, i) 1. Preocupación por la calidad 2. Capacidad de buscar soluciones de forma autónoma 3. Interés por investigar y buscar soluciones a nuevos problemas de forma autónoma
Descripción de contenidos: Programa
Se presentan los descriptores asociados a la asignatura: Modelos de recuperación, Procesamiento del Lenguaje Natural, Análisis Semántico, metadatos, linked data, Recuperación de información, reutilización de conocimiento, minería de datos La asignatura muestra los fundamentos para crear sistemas de recuperación de información. Esto incluye la utilización de sistemas de organización del conocimiento, procesamiento del lenguaje natural, algoritmos de posicionamiento y evaluación mediante métricas. La asignatura también incluye la creación de páginas Web posicionables y accesibles. Contenido del curso, 3 unidades: Unidad 1: Recuperación de información - Tema 1. Fundamentos de la búsqueda en los distintos tipos de web: web semántica, web social, web de datos, dark y deep web, pregunta-respuesta y web comercial. - Tema 2. Optimización en motores de búsqueda web (SEO/SEM) - Tema 3. Modelos de recuperación - Tema 4. Acceso, adquisición y limpieza de datos procedentes de la web semántica y bigdata - Tema 5. Crawlers y scrapers Unidad 2. Evaluación de la recuperación - Tema 6. Métricas para evaluar la recuperación Unidad 3. Técnicas de recuperación de información avanzadas - Tema 7. Procesamiento del lenguaje (PLN) - Tema 8. Técnicas de extracción de información - Tema 9. Realimentación y expansión de consultas
Actividades formativas, metodología a utilizar y régimen de tutorías
Clases Teóricas: 1.5 ECTS. Tienen por objetivo alcanzar las competencias específicas cognitivas de la asignatura (PO: a, c, j, k) Clases Prácticas: 1.5 ECTS. Desarrollan las competencias específicas instrumentales y la mayor parte de las transversales, como son la de trabajo en equipo, capacidad de aplicar los conocimientos a la práctica, de planificar y organizar y de análisis y síntesis. También tienen por objetivo desarrollar las capacidades específicas actitudinales. Consisten en el diseño y desarrollo de un sistema de recuperación de información en un entorno Web. Además deben elaborar una memoria con ejercicios propuestos en clase sobre algoritmos de posicionamiento, métricas de recuperación y tecnologías para recuperar información. (PO: a, b, c, d, e, i, j) Realización de Actividades Académicas Dirigidas - Con presencia del profesor: 1 ECTS Planteamiento de un trabajo en el que se mostrarán los conocimientos de la materia. (PO: a, b, c, d, e, g, k) - Sin presencia del profesor: 0.5 ECTS. Ejercicios y lecturas complementarias propuestas por el profesor (PO: j) Ejercicios y Examen: 1.5 ECTS. Tienen por objeto incidir y complementar en el desarrollo de las capacidades específicas cognitivas y procedimentales. Las clases prácticas y ejercicios se expondrán oralmente para su posterior discusión. (PO: a, c, g) Se establecerán dos tutorías semanales por semana.
Sistema de evaluación
  • Peso porcentual del Examen Final 40
  • Peso porcentual del resto de la evaluación 60

Bibliografía básica
  • Baeza-Yates, Ricardo and Berthier Ribeiro-Neto. Modern information retrieval. ACM Press, Addison-Wesley.
  • Dean Allemang, James Hendler. Semantic Web for the Working Ontologists: Effective Modeling in RDFS and OWL. Elservier. 2011
  • J. Urbano, M. Marrero, D. Martín y J. Morato. Bringing Undergraduate Students Closer to a Real-World Information Retrieval Setting: Methodology and Resources. ACM SIGCSE ITiCSE. 2011
  • Manning, Christopher D; Raghavan, Prabhakar; Schütze, Hinrich. Introduction to Information Retrieval. Cambridge University Press.
  • Verborgh, R., De Wilde, M., & Sawant, A.. Using OpenRefine: The essential OpenRefine guide that takes you from data analysis and error fixing to linking your dataset to the web. Packt Publishing. 2013
Recursos electrónicosRecursos Electrónicos *
Bibliografía complementaria
  • Dale R. Handbook of Natural Language Processing. Marcel Dekker. 2000
  • Ian H. Witten, Alistair Moffat and Timothy C. Bell. Managing Gigabytes: compressing and indexing documents. Morgan Kauffman. 1999
  • Moens Marie-Francine. Information Extraction: algorithms and prospects in a retrieval context (Chps. 1, 2 & 4). Springer. 2006
  • Morato, J, Sánchez-Cuadrado, S, Moreno, V Moreiro JA . Evolución de los factores de posicionamiento web y adaptación de las herramientas de optimización. Revista española de Documentación Científica, Vol 36, No 3. 2013
  • Nadeau D. and Sekine S.. A survey of named entity recognition and classification. Linguisticae Investigationes vol. 30 n.1. 2007
(*) El acceso a algunos recursos electrónicos puede estar restringido a los miembros de la comunidad universitaria mediante su validación en campus global. Si esta fuera de la Universidad, establezca una VPN


El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.