Última actualización: 11/07/2020


Curso Académico: 2019/2020

Recuperación y acceso a la información
(15760)
Grado en Ingeniería Informática (Plan 2018) (Plan: 431 - Estudio: 218)


Coordinador/a: MORATO LARA, JORGE LUIS

Departamento asignado a la asignatura: Departamento de Informática

Tipo: Optativa
Créditos: 6.0 ECTS

Curso:
Cuatrimestre:




Requisitos (Asignaturas o materias cuyo conocimiento se presupone)
- Ficheros y Bases de Datos (Obligatoria, 2º Curso, 2º Semestre) - Programación Orientada a Objetos (Obligatoria, 1er Curso, 2º Semestre)
(Las competencias relacionadas con el programa ABET se muestran entre paréntesis) Competencias Transversales/Genéricas: - Conocimientos básicos sobre programación, bases de datos, y programas informáticos - Herramientas informáticas para planificar y optimizar el trabajo - Elaboración, Coordinación y Discusión de trabajo en grupo (PO:d) - Uso de las TIC para redactar informes y memorias - Resolución de problemas, autonomía y creatividad - Adquisición sistemática de conocimientos (PO: i) - Capacidad de organizar, planificar y comunicar resultados (PO:g) - Aplicar los conocimientos adquiridos (PO:a, b, c, e, k) - Integrar los conocimientos adquiridos (PO:a, b, c) - Capacidad de aplicar los conocimientos en la práctica (PO:c) - Resolución de problemas en un contexto multidisciplinar (PO:c) Específicas - Integrar TIC con procesos empresariales - Participación activa en diseño e implementación de Sistemas de Información - Principios de técnicas de gestión de calidad e innovación tecnológica - Cognitivas (Saber) (PO:a, c, j, k) 1. Conocimiento de los modelos de recuperación 2. Conocimientos de las técnicas de procesamiento del lenguaje natural 3. Conocimiento de sistemas para formalizar, sintetizar y estructurar la información 4. Sistemas de seguimiento de trazas 5. Conocimiento una presentación de resultados óptima 6. Conocimiento de los sistemas de mejora en la recuperación y reutilización de conocimiento en la Web y en la Ingeniería del Software - Procedimentales/Instrumentales (Saber hacer) (PO:a, b, c, e, j) 1. Diseño de sistemas de recuperación 2. Diseño de analizadores del lenguaje natural 3. Utilización de minería de textos para mejorar la representación y ordenación de resultados - Actitudinales (Ser) (PO: c, e, i) 1. Preocupación por la calidad 2. Capacidad de buscar soluciones de forma autónoma 3. Interés por investigar y buscar soluciones a nuevos problemas de forma autónoma
Descripción de contenidos: Programa
Se presentan los descriptores asociados a la asignatura: Modelos de recuperación, Procesamiento del Lenguaje Natural, Análisis Semántico, metadatos, linked data, Recuperación de información, reutilización de conocimiento, minería de datos La asignatura muestra los fundamentos para crear sistemas de recuperación de información. Esto incluye la utilización de sistemas de organización del conocimiento, procesamiento del lenguaje natural, algoritmos de posicionamiento y evaluación mediante métricas. La asignatura también incluye la creación de páginas Web posicionables y accesibles. Contenido del curso, 3 unidades: Unidad 1: Recuperación de información - Tema 1. Fundamentos de la búsqueda en los distintos tipos de web: web semántica, web social, web de datos, dark y deep web, pregunta-respuesta y web comercial. - Tema 2. Optimización en motores de búsqueda web (SEO/SEM) - Tema 3. Modelos de recuperación - Tema 4. Acceso, adquisición y limpieza de datos procedentes de la web semántica y bigdata - Tema 5. Crawlers y scrapers Unidad 2. Evaluación de la recuperación - Tema 6. Métricas para evaluar la recuperación Unidad 3. Técnicas de recuperación de información avanzadas - Tema 7. Procesamiento del lenguaje (PLN) - Tema 8. Técnicas de extracción de información - Tema 9. Realimentación y expansión de consultas
Actividades formativas, metodología a utilizar y régimen de tutorías
Clases Teóricas: 1.5 ECTS. Tienen por objetivo alcanzar las competencias específicas cognitivas de la asignatura (PO: a, c, j, k) Clases Prácticas: 1.5 ECTS. Desarrollan las competencias específicas instrumentales y la mayor parte de las transversales, como son la de trabajo en equipo, capacidad de aplicar los conocimientos a la práctica, de planificar y organizar y de análisis y síntesis. También tienen por objetivo desarrollar las capacidades específicas actitudinales. Consisten en el diseño y desarrollo de un sistema de recuperación de información en un entorno Web. Además deben elaborar una memoria con ejercicios propuestos en clase sobre algoritmos de posicionamiento, métricas de recuperación y tecnologías para recuperar información. (PO: a, b, c, d, e, i, j) Realización de Actividades Académicas Dirigidas - Con presencia del profesor: 1 ECTS Planteamiento de un trabajo en el que se mostrarán los conocimientos de la materia. (PO: a, b, c, d, e, g, k) - Sin presencia del profesor: 0.5 ECTS. Ejercicios y lecturas complementarias propuestas por el profesor (PO: j) Ejercicios y Examen: 1.5 ECTS. Tienen por objeto incidir y complementar en el desarrollo de las capacidades específicas cognitivas y procedimentales. Las clases prácticas y ejercicios se expondrán oralmente para su posterior discusión. (PO: a, c, g) Se establecerán dos tutorías semanales por semana.
Sistema de evaluación
  • Peso porcentual del Examen Final 40
  • Peso porcentual del resto de la evaluación 60

Bibliografía básica
  • Aurelien Geron. Hands-On Machine Learning with Scikit-Learn and TensorFlow. O'Reilly. 2017
  • Baeza-Yates, Ricardo and Berthier Ribeiro-Neto. Modern information retrieval. ACM Press, Addison-Wesley. 2011
  • Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda. Applied Text Analysis with Python. O'Reilly. 2018
  • Verborgh, R., De Wilde, M., & Sawant, A.. Using OpenRefine: The essential OpenRefine guide that takes you from data analysis and error fixing to linking your dataset to the web. Packt Publishing. 2013
Recursos electrónicosRecursos Electrónicos *
Bibliografía complementaria
  • Anne Ahola Ward. The SEO battlefield: winning strategies for search marketing programs. OReilly . 2017
  • Dale R. Handbook of Natural Language Processing. Marcel Dekker. 2000
  • Dean Allemang, James Hendler . Semantic Web for the Working Ontologists: Effective Modeling in RDFS and OWL. Elservier. 2011
  • Gábor László Hajba . Website Scraping with Python: Using BeautifulSoup. Google Books. 2018
  • J. Urbano, M. Marrero, D. Martín y J. Morato. Bringing Undergraduate Students Closer to a Real-World Information Retrieval Setting: Methodology and Resources. ACM SIGCSE ITiCSE. 2011
  • Moens Marie-Francine. Information Extraction: algorithms and prospects in a retrieval context (Chps. 1, 2 & 4). Springer. 2006
  • Morato, J, Sánchez-Cuadrado, S, Moreno, V Moreiro JA . Evolución de los factores de posicionamiento web y adaptación de las herramientas de optimización. Revista española de Documentación Científica, Vol 36, No 3. 2013
  • Nadeau D. and Sekine S.. A survey of named entity recognition and classification. Linguisticae Investigationes vol. 30 n.1. 2007
  • Stuart Russell, Peter Norvig. Artificial Intelligence: A Modern Approach. Pearson. 2018
(*) El acceso a algunos recursos electrónicos puede estar restringido a los miembros de la comunidad universitaria mediante su validación en campus global. Si esta fuera de la Universidad, establezca una VPN


El programa de la asignatura podría sufrir alguna variación por causa de fuerza mayor debidamente justificada o por eventos académicos comunicados con antelación.