Publication:
LOD-GF: an integral linked open data generation framework

Research Projects

Organizational Units

Journal Issue

Abstract

Linked Open Data (LOD) generation is a common activity within organizations due to its advantages for sharing and reusing information. Since these technologies require specialized knowledge, the development of technological and methodological tools that allows its implementation is limited. Most of the current solutions are built on top of specific tools which require considerable effort to consolidate into an integral solution. Moreover, those tools work on specific domains, or they do not support some of the phases required for LOD life cycle (e.g., data cleaning, data exploitation). In this paper, we present a framework for LOD management which follows methodological principles presented in the state of the art in scientific literature and provides an unified software tool for publishing LOD for multiple domains and technologies. Our platform leverages a modular ETL processor, allowing a transparent and flexible integration, providing an integral environment for LOD. This framework was tested, successfully, using data sources from different domains, e.g., digital repositories, libraries.

Description

La generación de datos abiertos vinculados (LOD) es una actividad común dentro de las organizaciones debido a sus ventajas para compartir y reutilizar información. Dado que estas tecnologías requieren conocimientos especializados, el desarrollo de herramientas tecnológicas y metodológicas que permitan su implementación es limitado. La mayoría de las soluciones actuales se basan en herramientas específicas que requieren un esfuerzo considerable para consolidarse en una solución integral. Además, esas herramientas funcionan en dominios específicos, o no admiten algunas de las fases requeridas para el ciclo de vida de LOD (por ejemplo, limpieza de datos, explotación de datos). En este documento, presentamos un marco para la gestión de LOD que sigue los principios metodológicos presentados en el estado del arte en la literatura científica y proporciona una herramienta de software unificada para publicar LOD para múltiples dominios y tecnologías. Nuestra plataforma aprovecha un procesador ETL modular, lo que permite una integración transparente y flexible, proporcionando un entorno integral para LOD. Este marco se probó con éxito utilizando fuentes de datos de diferentes dominios, por ejemplo, repositorios digitales, bibliotecas

Keywords

Data integration, Framework, Linked data, LOD life cycle, Methodological guidelines

Citation

Collections