Descripción de fuentes de datos heterogéneas utilizando tecnologías semánticas

dc.contributor.advisorTello Guerrero, Marco Andrés
dc.contributor.authorAngüisaca Landivar, Adrián Francisco
dc.contributor.authorJapa Loja, Juan Pablo
dc.contributor.tutorSaquicela Galarza, Víctor Hugo
dc.date.accessioned2018-05-10T12:32:33Z
dc.date.available2018-05-10T12:32:33Z
dc.date.issued2018
dc.descriptionLa Web Semántica, plantea potenciales oportunidades para dotar de significado a los contenidos web. Las ontologías constituyen una de las principales herramientas para especificar explícitamente los conceptos de un dominio concreto, sus propiedades y sus relaciones; de manera que la información se publique en formatos que sean entendibles por agentes máquinas que pueden localizar y gestionar de forma precisa la información. En esta tesis se presenta una aplicación para la generación un modelo ontológico común, el cual describe diferentes fuentes de datos mediante sus metadatos, específicamente se trabajó con fuentes de tipo Base de datos, CSV, XML y EXCEL. Para ello, se analizó diferentes ontologías de descripción de metadatos, entre las cuales se tienen DCAT, PHDD y DISCO. Estas tres fuentes se unieron en un solo modelo, sobre el cual se realizaron algunas modificaciones, siendo la más importante la incorporación de una estructura, la cual me permita describir los diferentes tipo de datos que tienen los atributos de las fuentes. Después se procedió a la creación de un modelo relacional común, donde se almacena temporalmente los metadatos extraídos, para su posterior mapeo con el modelo ontológico común. Finalmente se procedió a generar un archivo RDF sobre el modelo ontológico común y publicar el mismo para su explotación. Para validar experimentalmente el modelo creado, se planteó un escenario de integración de varias fuentes de datos, donde se realizó una comparación haciendo consultas al modelo ontológico común y haciendo una inspección de forma manual a los metadatos y datos de dichas fuentes, esto con la finalidad de obtener la utilidad del modelo ontológico común. Concluyendo que mediante el modelo ontológico común el usuario encargado de la integración puede extraer las posibles asignaciones semánticas en términos de integración de datos, de forma fácil y a un menor costo, ya que lo realiza sobre un solo repositorio común.es_ES
dc.description.abstractThe Semantic Web, propound potential opportunities to give meaning to web content. Ontologies are one of the main tools to explicitly specify the concepts of a particular domain, its properties and its relationships; so that the information is published in formats that are understandable by machine agents that can locate and manage the information accurately. This thesis presents an application for the generation of a common ontological model, which describes different data sources through its metadata, specifically worked with sources such as Database, CSV, XML and EXCEL. For this, different ontologies of metadata description were analyzed, among which DCAT, PHDD and DISCO are available. These three sources were united in a single model, on which some modifications were made, the most important being the incorporation of a structure, which allows me to describe the different types of data that have the attributes of the sources. Afterwards, a common relational model was created, where the extracted metadata is temporarily stored, for its subsequent mapping with the common ontological model. Finally, we proceeded to generate an RDF file on the common ontological model and publish the same for its exploitation. In order to experimentally validate the created model, an integration scenario was set up for several data sources, where a comparison was made by consulting the common ontological model and manually inspecting the metadata and data of said sources, this with the purpose to obtain the utility of the common ontological model. Concluding that through the common ontological model, the user in charge of integration can extract the possible semantic assignments in terms of data integration, easily and at a lower cost, since it is done on a single common repository.es_ES
dc.description.cityCuenca, Ecuadores_ES
dc.description.degreeIngeniero de Sistemases_ES
dc.formatapplication/pdfes_ES
dc.identifier.urihttp://dspace.ucuenca.edu.ec/handle/123456789/30352
dc.language.isospaes_ES
dc.relation.ispartofseriesTS;255
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectIngeniería en Sistemases_ES
dc.subjectWeb semánticaes_ES
dc.subjectSoftwarees_ES
dc.subjectMinería de datoses_ES
dc.subjectSistemas de controles_ES
dc.titleDescripción de fuentes de datos heterogéneas utilizando tecnologías semánticases_ES
dc.typebachelorThesises_ES
dc.ucuenca.id0704166818es_ES
dc.ucuenca.idautor0105507503es_ES
dc.ucuenca.idautor0105951271es_ES
dc.ucuenca.paginacion138 páginases_ES

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Versión presentada (texto completo)
Size:
6.24 MB
Format:
Adobe Portable Document Format
Description:
Versión presentada (texto completo)

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
19.88 KB
Format:
Item-specific license agreed upon to submission
Description: