El pasado jueves 18 de julio de 2024 a las 11:00 tuvo lugar la lectura de tesis de D. Miguel Bermudo Bayo, titulada “On Data Engineering and Knowledge Graphs: A Reinforcement Learning System for Knowledge Graph Reasoning” en el Salón de Grados de la Facultad de Matemáticas. Los directores han sido Dª. Inmaculada Hernández y D. Daniel Ayala, y el tutor D. David Ruiz Cortés. Los miembros del tribunal han sido D. Kawtar Benghazi, D. Manuel Lama, D. Javier Berrocal, D. José María García y D. Miguel Toro.
El tema de la tesis ha girado en torno a los grafos de conocimiento, que han estado a la vanguardia del almacenamiento de información de dominio desde su creación. Estos grafos pueden servir de base para una serie de aplicaciones inteligentes, como la respuesta a preguntas o las recomendaciones de productos. Sin embargo, por lo general se construyen de forma automatizada y no supervisada, lo que a menudo da lugar a que falte información, normalmente en forma de enlaces que faltan entre entidades relacionadas en la fuente de datos original .
Las técnicas de compleción de grafos de conocimiento trata n de encontrar los elementos que faltan en un grafo de conocimiento . Una posible forma de hacerlo es encontrar caminos entre dos nodos que indiquen la presencia de una arista que falta. Esto puede lograrse mediante el Aprendizaje por Refuerzo, entrenando a un agente que aprenda a navegar por el grafo, comenzando en un nodo con una arista ausente e identificando qué arista de entre las disponibles en cada paso es más prometedora para alcanzar el objetivo de la arista ausente.
En esta tesis , se presenta una nueva propuesta para completar grafos usando aprendizaje por refuerzo, y proponen una nueva familia de funciones de recompensa basadas en la incrustación de nodos y la distancia estructural, aprovechando información adicional relacionada con la similitud semántica y eliminando la necesidad de alcanzar el nodo objetivo para obtener una medida de los beneficios de una acción.
SpaceRL es un marco integral en Python diseñado para la generación de agentes de aprendizaje por refuerzo (RL), que pueden utilizarse para completar grafos de conocimiento y descubrir enlaces. L a generación de tales agentes es una tarea
compleja, más aún para un usuario no experto, y hasta donde sabemos no existen herramientas que proporcionen ese tipo de ayuda. SpaceRL pretende superar estas limitaciones proporcionando un conjunto flexible de herramientas diseñadas con una amplia variedad de opciones de personalización, con el fin de ser lo suficientemente flexible como para adaptarse a las diferentes necesidades de los usuarios. También incluye una variedad de algoritmos RL de última generación y varios modelos de incrustación que pueden combinarse para optimizar el rendimiento del agente.
¡Enhorabuena a doctorando, directores y tutor!
Fuente: Dª. Inmaculada Hernández, directora de la tesis.