Logo Repositorio Institucional

Please use this identifier to cite or link to this item: http://dspace.ucuenca.edu.ec/handle/123456789/26336
Full metadata record
DC FieldValueLanguage
dc.contributor.authorGualán, Ronald-
dc.contributor.authorFreire, Renán-
dc.contributor.authorTello, Andrés-
dc.contributor.authorEspinoza, Mauricio-
dc.contributor.authorSaquicela Galarza, Víctor Hugo-
dc.date.accessioned2017-01-17T14:09:10Z-
dc.date.available2017-01-17T14:09:10Z-
dc.date.issued2016-11-16-
dc.identifier.issn13906143-
dc.identifier.urihttp://dspace.ucuenca.edu.ec/handle/123456789/26336-
dc.descriptionLa adopción de Linked Data sigue creciendo en muchos campos a un ritmo considerable. Sin embargo, algunos de los conjuntos de datos más importantes por lo general permanecen des-semantificados debido a dos razones principales: el enorme volumen de los conjuntos de datos y la falta de métodos para la conversión automática a RDF. Este artículo presenta un enfoque automático para hacer frente a estos problemas mediante el aprovechamiento de nuevas herramientas de Big Data y un programa para la conversión automática de un modelo relacional a RDF. En general, el proceso implementado se puede resumir en tres pasos: 1) transferencia masiva de datos desde las diferentes fuentes hacia Hive/HDFS, 2) transformación de los datos en Hive a RDF utilizando D2RQ, y 3) almacenamiento del RDF resultante en CumulusRDF. De este modo, mediante el uso de estas herramientas de Big Data garantizamos que la plataforma sea capaz de hacer frente a las grandes cantidades de datos disponibles en diferentes fuentes, ya sea que contengan datos estructuradas o semi-estructurados. Además, puesto que los datos RDF se almacenan en CumulusRDF en la etapa final, los usuarios o aplicaciones pueden consumir los datos resultantes a través de servicios web o consultas SPARQL. Finalmente, una evaluación demuestra la solidez de nuestro enfoque.es_ES
dc.description.abstractLinked data adoption continues to grow in many fields at a considerable pace. However, some of the most important datasets usually remain underexploited because of two main reasons: the huge volume of the datasets and the lack of methods for automatic conversion to RDF. This paper presents an automatic approach to tackle these problems by leveraging recent Big Data tools and a program for automatic conversion from a relational model to RDF. Overall, the process can be summarized in three steps: 1) bulk transfer of data from different sources to Hive/HDFS; 2) transformation of data on Hive to RDF using D2RQ; and 3) storing the resulting RDF in CumulusRDF. By using these Big Data tools, the platform will cope with the handling of big amounts of data available in different sources, which can include structured or semi-structured data. Moreover, since the RDF data are stored in CumulusRDF in the final step, users or applications can consume the resulting data by means of web services or SPARQL queries. Finally, an evaluation in the hydro-meteorological domain demonstrates the soundness of our approach.es_ES
dc.formatapplication/pdfes_ES
dc.language.isospaes_ES
dc.publisherUniversidad de Cuencaes_ES
dc.relation.ispartofseries378.05;116287-
dc.subjectTransformacion Automatica A Rdfes_ES
dc.subjectIntegracion De Datoses_ES
dc.subjectWeb Semanticaes_ES
dc.subjectNosqles_ES
dc.subjectRdfes_ES
dc.subjectFuentes Semi-Estructuradases_ES
dc.subjectBig Dataes_ES
dc.subjectD2rqes_ES
dc.subjectApache Hivees_ES
dc.subjectCumulosrdfes_ES
dc.subjectApache Servicemixes_ES
dc.titleAutomatic RDF-ization of big data semi-structured datasetses_ES
dc.title.alternativeMaskana. Revista Científicaes_ES
dc.typeArticlees_ES
dc.ucuenca.paginacionPáginas 117-137es_ES
dc.description.cityCuencaes_ES
dc.description.numberSequencenúmero especiales_ES
Appears in Collections:Volumen 7 No. especial (2016) - TIC.EC: Congreso Ecuatoriano de Tecnologías de la Información y Comunicaciones

Files in This Item:
File Description SizeFormat 
TICEC_2016_12.pdf504.01 kBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00