Logo Repositorio Institucional

Please use this identifier to cite or link to this item: http://dspace.ucuenca.edu.ec/handle/123456789/40630
Title: Clasificación de artículos académicos sobre la pandemia de la COVID-19, a través de técnicas de minería de texto
Authors: Vásquez Vanegas, Bayron Fernando
metadata.dc.contributor.advisor: Orellana Cordero, Marcos Patricio
metadata.dc.ucuenca.correspondencia: bayron.vasquezv@hotmail.com
metadata.dc.subject.other: Minería de datos
Keywords: Ingeniería de Sistemas
Inteligencia artificial
Programación informática
metadata.dc.audience.educationLevel: Tesis de Maestría en Gestión Estratégica de Tecnologías de la Información
metadata.dc.ucuenca.areaconocimientounescoamplio: 33 Ciencias Tecnológicas
metadata.dc.ucuenca.areaconocimientounescodetallado: 3304.13 Dispositivos de Transmisión de Datos
metadata.dc.ucuenca.areaconocimientounescoespecifico: 3304 Tecnología de los Ordenadores
Issue Date: 6-Jan-2023
metadata.dc.format.extent: 101 páginas
Publisher: Universidad de Cuenca
metadata.dc.description.city: 
Cuenca
Series/Report no.: TM4;2026
metadata.dc.type: masterThesis
Abstract: 
exactitud del 74%, en comparación con los modelos Word2Vec y Glove que alcanzaron el 72% y 65% respectivamente, siendo esta técnica una de las mejores opciones al momento de emplear modelos de representación semántica del texto.
Description: 
Debido a la aparición del virus SARS-CoV-2, y a la enfermedad del COVID-19 que provoca este virus, la comunidad científica así como los distintos actores y organizaciones, han visto la necesidad de obtener información que pueda aportar conocimiento sobre cómo evoluciona esta enfermedad y enfrentar los distintos problemas que la misma ha traído a la población mundial. El estudio propone realizar la clasificación de artículos científicos mediante la aplicación de técnicas de Machine Learning, a través de mecanismos de representación semántica de palabras como es Word Embeddings y tecnologías basadas en redes neuronales, analizando los abstracts de artículos científicos disponibles en las fuentes de información como lo es LitCovid. El desarrollo del presente estudio está basado en la aplicación de la metodología CRISP-DM (CRoss-Industry Standard Process for Data Mining) (Wirth, 2000), la cual describe un modelo de procesos jerárquico que consta de seis fases que describen de manera natural el ciclo de vida de un proyecto de minería de datos, y debido a que tanto la minería de datos como la de texto buscan obtener conocimiento sea de grandes volúmenes de datos y de grandes volúmenes de documentos de texto respectivamente, se adopta como base para el desarrollo del presente estudio esta metodología. Para lograr los objetivos propuestos se emplea la metodología adoptada y se evalúan los resultados de desempeño de aplicar dicha metodología y modelos propuestos. Los resultados obtenidos demuestran que al aplicar la metodología propuesta se obtuvieron resultados aceptables para la clasificación, dando como resultado, que, al emplear FastText como modelo de representación semántica, se consiguieron métricas de exactitud del 74%, en comparación con los modelos Word2Vec y Glove que alcanzaron el 72% y 65% respectivamente, siendo esta técnica una de las mejores opciones al momento de emplear modelos de representación semántica del texto.
metadata.dc.description.degree: 
Magíster en Gestión Estratégica de Tecnologías de la Información
URI: http://dspace.ucuenca.edu.ec/handle/123456789/40630
Appears in Collections:Tesis Maestrías

Files in This Item:
File Description SizeFormat 
Trabajo-de-Titulacion.pdfVersión presentada (texto completo)3.02 MBAdobe PDFView/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00