Checking date: 04/06/2021


Course: 2021/2022

Text Mining
(18189)
Study: Bachelor in Computer Science and Engineering (218)


Coordinating teacher: SEGURA BEDMAR, ISABEL

Department assigned to the subject: Department of Computer Science and Engineering

Type: Electives
ECTS Credits: 3.0 ECTS

Course:
Semester:




Objectives
- Understand the concepts of Natural Language Processing (NLP) and Text Mining. - Know the main PLN tasks - Use the main PLN libraries that support the NLP tasks. - Know and implement the main language models for the representation of texts. - Design and implement architectures based on knowledge and machine learning approaches to develop with natural language processing applications. Resultados del aprendizaje: R1. Conocimiento y comprensión: Tener conocimientos básicos y la compresión de los fundamentos científicos y tecnológicos de la Ingeniería Informática, así como un conocimiento específicos de las ciencias de la computación, la ingeniería de computadores y sistemas de información. R5 Aplicaciones de la Ingeniería: Los egresados serán capaces de aplicar su conocimiento y comprensión para resolver problemas, dirigir investigaciones y diseñar dispositivos o procesos del ámbito de la Ingeniería Informática de acuerdo con criterios de coste, calidad, seguridad, eficiencia, respeto por el medioambiente e implicaciones éticas. Estas habilidades incluyen el conocimiento, uso y limitaciones de sistemas informáticos, ingeniería de procesos, arquitecturas de computadores, modelos computacionales, equipos, trabajo práctico, bibliografía técnica y fuentes de información. Competencias básicas y generales: CGB3 - Capacidad para comprender y dominar los conceptos básicos de matemática discreta, lógica, algorítmica y complejidad computacional, y su aplicación para la resolución de problemas propios de la ingeniería. CGO9 - Capacidad para resolver problemas con iniciativa, toma de decisiones, autonomía y creatividad. Capacidad para saber comunicar y transmitir los conocimientos, habilidades y destrezas de la profesión de Ingeniero Técnico en Informática. CB1 - Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio CB3 - Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía Competencias específicas: CECRI5 - Conocimiento, administración y mantenimiento sistemas, servicios y aplicaciones informáticas. CECRI6 - Conocimiento y aplicación de los procedimientos algorítmicos básicos de las tecnologías informáticas para diseñar soluciones a problemas, analizando la idoneidad y complejidad de los algoritmos propuestos. CECRI15 - Conocimiento y aplicación de los principios fundamentales y técnicas básicas de los sistemas inteligentes y su aplicación práctica. - CECC4. Ability to know the fundamentals, paradigms and techniques of intelligent systems and analyze, design and build computer systems, services and applications that use these techniques in any field of application. - CECC5. Ability to acquire, obtain, formalize and represent human knowledge in a computable form for solving problems through a computer system in any field of application, particularly those related to aspects of computing, perception and performance in intelligent environments or environments. - CECC7. Ability to know and develop computational learning techniques and design and implement applications and systems that use them, including those dedicated to automatic extraction of information and knowledge from large volumes of data
Skills and learning outcomes
Description of contents: programme
1. Introduction 2. NLP basic tasks. 3. Language models for text representations. 4. Text classification. 5. Named entity recognition (NER). 6. Relation extraction (RE). 7. Text similarity
Assessment System
  • % end-of-term-examination 0
  • % of continuous assessment (assigments, laboratory, practicals...) 100
Calendar of Continuous assessment
Basic Bibliography
  • Edward Loper, Steven Bird, Ewan Klein. Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit. 0'REALLY. 2009
  • Yuli Vasiliev. Natural Language Processing With Python And Spacy: A Practical Introduction. No Starch Press. 2020
Recursos electrónicosElectronic Resources *
Additional Bibliography
  • Amandeep . Implement NLP use-cases using BERT: Explore the Implementation of NLP Tasks Using the Deep Learning Framework and Python. bpb. 2021
(*) Access to some electronic resources may be restricted to members of the university community and require validation through Campus Global. If you try to connect from outside of the University you will need to set up a VPN


The course syllabus may change due academic events or other reasons.