Clasificación de artículos académicos sobre la pandemia de la COVID-19, a través de técnicas de minería de texto

dc.audience.educationLevelTesis de Maestría en Gestión Estratégica de Tecnologías de la Informaciónen_US
dc.contributor.advisorOrellana Cordero, Marcos Patricio
dc.contributor.authorVásquez Vanegas, Bayron Fernando
dc.date.accessioned2023-01-09T13:06:16Z
dc.date.available2023-01-09T13:06:16Z
dc.date.issued2023-01-06
dc.descriptionDebido a la aparición del virus SARS-CoV-2, y a la enfermedad del COVID-19 que provoca este virus, la comunidad científica así como los distintos actores y organizaciones, han visto la necesidad de obtener información que pueda aportar conocimiento sobre cómo evoluciona esta enfermedad y enfrentar los distintos problemas que la misma ha traído a la población mundial. El estudio propone realizar la clasificación de artículos científicos mediante la aplicación de técnicas de Machine Learning, a través de mecanismos de representación semántica de palabras como es Word Embeddings y tecnologías basadas en redes neuronales, analizando los abstracts de artículos científicos disponibles en las fuentes de información como lo es LitCovid. El desarrollo del presente estudio está basado en la aplicación de la metodología CRISP-DM (CRoss-Industry Standard Process for Data Mining) (Wirth, 2000), la cual describe un modelo de procesos jerárquico que consta de seis fases que describen de manera natural el ciclo de vida de un proyecto de minería de datos, y debido a que tanto la minería de datos como la de texto buscan obtener conocimiento sea de grandes volúmenes de datos y de grandes volúmenes de documentos de texto respectivamente, se adopta como base para el desarrollo del presente estudio esta metodología. Para lograr los objetivos propuestos se emplea la metodología adoptada y se evalúan los resultados de desempeño de aplicar dicha metodología y modelos propuestos. Los resultados obtenidos demuestran que al aplicar la metodología propuesta se obtuvieron resultados aceptables para la clasificación, dando como resultado, que, al emplear FastText como modelo de representación semántica, se consiguieron métricas de exactitud del 74%, en comparación con los modelos Word2Vec y Glove que alcanzaron el 72% y 65% respectivamente, siendo esta técnica una de las mejores opciones al momento de emplear modelos de representación semántica del texto.en_US
dc.description.abstractexactitud del 74%, en comparación con los modelos Word2Vec y Glove que alcanzaron el 72% y 65% respectivamente, siendo esta técnica una de las mejores opciones al momento de emplear modelos de representación semántica del texto.en_US
dc.description.cityCuencaen_US
dc.description.degreeMagíster en Gestión Estratégica de Tecnologías de la Informaciónen_US
dc.formatapplication/pdfen_US
dc.format.extent101 páginasen_US
dc.identifier.urihttp://dspace.ucuenca.edu.ec/handle/123456789/40630
dc.language.isospaen_US
dc.publisherUniversidad de Cuencaen_US
dc.relation.ispartofseriesTM4;2026
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.accessRightsopenAccessen_US
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectIngeniería de Sistemasen_US
dc.subjectInteligencia artificialen_US
dc.subjectProgramación informáticaen_US
dc.subject.otherMinería de datosen_US
dc.titleClasificación de artículos académicos sobre la pandemia de la COVID-19, a través de técnicas de minería de textoen_US
dc.typemasterThesisen_US
dc.ucuenca.areaconocimientounescoamplio33 Ciencias Tecnológicasen_US
dc.ucuenca.areaconocimientounescodetallado3304.13 Dispositivos de Transmisión de Datosen_US
dc.ucuenca.areaconocimientounescoespecifico3304 Tecnología de los Ordenadoresen_US
dc.ucuenca.correspondenciabayron.vasquezv@hotmail.comen_US
dc.ucuenca.id0102668209en_US
dc.ucuenca.idautor0104742424en_US
dc.ucuenca.responsablerecepcionCajamarca Quintuña Sergio Rubénen_US

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Trabajo-de-Titulacion.pdf
Size:
2.95 MB
Format:
Adobe Portable Document Format
Description:
Versión presentada (texto completo)

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: