Desarrollo de un Chatbot multiagente basado en modelos LLM y arquitectura RAG para la interacción en lenguaje natural con bases de datos organizacionales
Loading...
Date
2025-09-24
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad de Cuenca
Abstract
In contemporary organizational environments, efficient access to information has become a critical factor for strategic decision making, process optimization, and service quality impro-vement. However, many organizations encounter challenges when querying both structured and unstructured data due to a reliance on specialized technical expertise. This dependency hinders the effective utilization of internal knowledge and limits the democratization of infor-mation access. To address this challenge, the present research proposes the development of a team of agent chatbot with conversational artificial intelligence capabilities, based on the Retrieval Augmented Generation (RAG) architecture and Large Language Models (LLMs). Unlike traditional rule based systems, the proposed solution enables open-ended queries in natural language, facilitating user interaction with databases without requiring technical knowledge. The system was evaluated across multiple architectural configurations including Vanilla RAG, Agentic RAG, and Fine Tuning as well as with several open source LLMs. Among these, the Mistral model stood out for its contextual accuracy. Additionally, techni-ques for the effective transformation of organizational data into semantic representations were validated, and optimal configurations for contextual retrieval and information structu-ring were identified. The results demonstrate the potential of this solution to democratize access to organizational knowledge and serve as a foundation for future advancements in applied artificial intelligence.
Resumen
En los entornos organizacionales actuales, el acceso eficiente a la información se ha con-vertido en un factor clave para la toma de decisiones estratégicas, la mejora de procesos y la calidad del servicio. No obstante, muchas organizaciones enfrentan dificultades para consultar tanto datos estructurados como no estructurados, debido a la dependencia de conocimientos técnicos especializados. Esta barrera limita el aprovechamiento del conoci-miento interno y restringe la democratización del acceso a la información. Ante este desafío, la presente investigación propone el desarrollo de un chatbot multiagente con capacidades de inteligencia artificial conversacional, basada en la arquitectura de generación aumentada por recuperación (RAG) y modelos grandes de lenguaje (LLM). A diferencia de los sistemas tradicionales basados en reglas, la solución propuesta permite realizar consultas abiertas en lenguaje natural, facilitando la interacción con bases de datos sin necesidad de conoci-mientos técnicos por parte del usuario. El sistema fue evaluado a través de distintas con-figuraciones arquitectónicas (Vanilla RAG, Agentic RAG y Ajuste fino), así como mediante varios modelos LLMs de código abierto, destacándose el modelo Mistral por su precisión contextual. Asimismo, se validaron técnicas para la transformación efectiva de datos or-ganizacionales en representaciones semánticas y se identificaron configuraciones óptimas para la recuperación contextual y estructuración de la información. Los resultados obteni-dos demuestran el potencial de esta solución para democratizar el acceso al conocimiento organizacional y servir como base para futuros desarrollos en inteligencia artificial aplicada.
Keywords
Ingeniería en Computación, Asistente conversacional, Modelos de lenguaje
Citation
Código de tesis
TS; 342
Código de tesis
Grado Académico
Ingeniero en Ciencias de la Computación
