Logo Repositorio Institucional

Por favor, use este identificador para citar o enlazar este ítem: http://dspace.ucuenca.edu.ec/handle/123456789/40630
Título : Clasificación de artículos académicos sobre la pandemia de la COVID-19, a través de técnicas de minería de texto
Autor: Vásquez Vanegas, Bayron Fernando
Director(es): Orellana Cordero, Marcos Patricio
Correspondencia: bayron.vasquezv@hotmail.com
Materia: Minería de datos
Palabras clave : Ingeniería de Sistemas
Inteligencia artificial
Programación informática
Nivel de audiencia: Tesis de Maestría en Gestión Estratégica de Tecnologías de la Información
Área de conocimiento UNESCO amplio: 33 Ciencias Tecnológicas
ÁArea de conocimiento UNESCO detallado: 3304.13 Dispositivos de Transmisión de Datos
Área de conocimiento UNESCO específico: 3304 Tecnología de los Ordenadores
Fecha de publicación : 6-ene-2023
Paginación: 101 páginas
Editor: Universidad de Cuenca
Ciudad: 
Cuenca
Código Interno : TM4;2026
Tipo: masterThesis
Abstract: 
exactitud del 74%, en comparación con los modelos Word2Vec y Glove que alcanzaron el 72% y 65% respectivamente, siendo esta técnica una de las mejores opciones al momento de emplear modelos de representación semántica del texto.
Resumen : 
Debido a la aparición del virus SARS-CoV-2, y a la enfermedad del COVID-19 que provoca este virus, la comunidad científica así como los distintos actores y organizaciones, han visto la necesidad de obtener información que pueda aportar conocimiento sobre cómo evoluciona esta enfermedad y enfrentar los distintos problemas que la misma ha traído a la población mundial. El estudio propone realizar la clasificación de artículos científicos mediante la aplicación de técnicas de Machine Learning, a través de mecanismos de representación semántica de palabras como es Word Embeddings y tecnologías basadas en redes neuronales, analizando los abstracts de artículos científicos disponibles en las fuentes de información como lo es LitCovid. El desarrollo del presente estudio está basado en la aplicación de la metodología CRISP-DM (CRoss-Industry Standard Process for Data Mining) (Wirth, 2000), la cual describe un modelo de procesos jerárquico que consta de seis fases que describen de manera natural el ciclo de vida de un proyecto de minería de datos, y debido a que tanto la minería de datos como la de texto buscan obtener conocimiento sea de grandes volúmenes de datos y de grandes volúmenes de documentos de texto respectivamente, se adopta como base para el desarrollo del presente estudio esta metodología. Para lograr los objetivos propuestos se emplea la metodología adoptada y se evalúan los resultados de desempeño de aplicar dicha metodología y modelos propuestos. Los resultados obtenidos demuestran que al aplicar la metodología propuesta se obtuvieron resultados aceptables para la clasificación, dando como resultado, que, al emplear FastText como modelo de representación semántica, se consiguieron métricas de exactitud del 74%, en comparación con los modelos Word2Vec y Glove que alcanzaron el 72% y 65% respectivamente, siendo esta técnica una de las mejores opciones al momento de emplear modelos de representación semántica del texto.
Grado Académico: 
Magíster en Gestión Estratégica de Tecnologías de la Información
URI : http://dspace.ucuenca.edu.ec/handle/123456789/40630
Aparece en las colecciones: Tesis Maestrías

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Trabajo-de-Titulacion.pdfVersión presentada (texto completo)3.02 MBAdobe PDFVisualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00