Logo Repositorio Institucional

Please use this identifier to cite or link to this item: http://dspace.ucuenca.edu.ec/handle/123456789/39576
Title: Generación de un corpus para detección de competidores en el idioma español mediante minería de opiniones comparativas. Caso de estudio: sector textil en la provincia del Azuay
metadata.dc.ucuenca.titulouniforme: Generación de un corpus para detección de competidores en el idioma español mediante minería de opiniones comparativas. Caso de estudio: Sector Textil en la provincia del Azuay
Authors: Bravo Chuqui, Néstor Ariel
Fajardo Cárdenas, Ángel Patricio
metadata.dc.contributor.advisor: Auquilla Sangolquí, Andrés Vinicio
metadata.dc.contributor.tutor: Vanegas Peña, Paúl Fernando
metadata.dc.ucuenca.correspondencia: arielbravo.ec@gmail.com
apatricio.fajardoc@gmail.com
metadata.dc.subject.other: Minería de datos
Keywords: Ingeniería de Sistemas
inteligencia competitiva
Redes sociales
Sector textil
metadata.dc.ucuenca.areaconocimientounescoamplio: 33 Ciencias Tecnológicas
metadata.dc.ucuenca.areaconocimientounescodetallado: 3304.13 Dispositivos de Transmisión de Datos
metadata.dc.ucuenca.areaconocimientounescoespecifico: 3304 Tecnología de los Ordenadores
Issue Date: 4-Aug-2022
metadata.dc.format.extent: 149 páginas
Publisher: Universidad de Cuenca
metadata.dc.description.city: 
Cuenca
Series/Report no.: TS;297
metadata.dc.type: bachelorThesis
Abstract: 
Currently, with the advancement of technology and even more so with the arrival of the pandemic, the use of digital platforms has increased. A study presented by the Ecuadorian Chamber of Electronic Commerce for the year 2020 shows that electronic commerce has increased the use of online digital platforms by at least 15 times compared to 2019 with the arrival of the pandemic. Due to this, companies to do market research must look for new sources of information. Therefore, the internet has become an intangible input for any business strategy. A fundamental part of a commercial strategy is to analyze the competition, this analysis in previous years according to the literature was generally carried out through surveys, but with the arrival of digital platforms this method has changed and today the data can be extracted from the web to then implement a Competitive Intelligence (CI) process, which allows a complete analysis to have a competitive advantage. CI comprises several steps, this research addresses all these steps, but focuses mainly on the initial step, data collection and data analysis, which is a fundamental step for CI, where there are currently problems such as: lack of corpus in Spanish specialized for CI, so researchers do not have the facility to implement machine learning models that help them to have a competitive advantage. This research presents a methodology for the creation of a corpus in the Spanish language that allows algorithms to be trained in order to detect competitors in the context of the textile sector. Two main results have been generated: 1) A methodology using text mining techniques (comparative opinion mining and named entity recognition) to build a corpus focused on Competitive Intelligence. 2) A corpus in Spanish, within the domain of social network comments, which serves as a basis for future research related to competitive intelligence, specifically in the detection of competitors in the Spanish language, where the CI was strictly restricted by the lack of a corpus. Finally, the usefulness of the corpus developed has been evaluated through a Dashboard created based on a case study carried out in the context of the textile sector in social networks. It has been shown that it is indeed useful for the textile sector, however, it is recommended to carry out a new validation with companies that are directly related to the textile sector and thus obtain a more direct validation, it is also recommended to evaluate in other sectors.
Description: 
En la actualidad con el avance de la tecnología y más aún con la llegada de la pandemia el uso de las plataformas digitales se ha incrementado. Un estudio presentado por la Cámara de Comercio Electrónico Ecuatoriana del año 2020 demuestra que el comercio electrónico ha incrementado en al menos 15 veces con respecto al 2019 el uso de plataformas digitales online con la llegada de la pandemia. Debido a esto, las empresas para hacer estudios de mercado deben buscar nuevas fuentes de información. Por lo tanto, el internet se ha convertido en un insumo intangible de toda estrategia comercial. Una parte fundamental de una estrategia comercial es analizar a la competencia, este análisis en años anteriores según la literatura se realizaba generalmente mediante encuestas, pero con la llegada de las plataformas digitales ha cambiado este método y hoy por hoy se puede extraer los datos de la web para luego implementar un proceso de Inteligencia Competitiva (CI), la cual permite hacer un análisis completo para tener una ventaja competitiva. CI comprende de varios pasos, esta investigación aborda todos estos pasos, pero se enfoca principalmente en el paso inicial, la recolección y análisis de datos, que es un paso fundamental para CI, donde actualmente existen problemas como: falta de corpus en español especializado para CI, por lo cual los investigadores no tienen la facilidad de implementar modelos de aprendizaje automático que les ayuden a tener una ventaja competitiva. El presente trabajo de investigación presenta una metodología para la creación de un corpus en el idioma español que permita entrenar algoritmos con el fin de realizar detección de competidores en el contexto del sector textil. Se han generado dos resultados principales: 1) Una metodología utilizando técnicas de minería de textos (minería de opiniones comparativas y reconocimiento de entidades nombradas) para construir corpus enfocado hacia la Inteligencia Competitiva. 2) Un corpus en español, dentro del dominio de comentarios de redes sociales, el cual sirve de base para futuras investigaciones relacionadas con la inteligencia competitiva, específicamente en la detección de competidores en el lenguaje español, donde la CI estaba estrictamente restringida por la falta de un corpus. Por último, se ha evaluado la utilidad del corpus desarrollado mediante un Dashboard creado en base a un caso de estudio llevado a cabo en el contexto del sector textil en redes sociales. Se ha demostrado que efectivamente es de utilidad para el sector textil, sin embargo, se recomienda hacer una nueva validación con empresas que estén directamente relacionadas al sector textil y así obtener una validación más directa, también se recomienda evaluar en otros sectores.
metadata.dc.description.degree: 
Ingeniero de Sistemas
URI: http://dspace.ucuenca.edu.ec/handle/123456789/39576
Appears in Collections:Tesis de Pregrado

Files in This Item:
File Description SizeFormat 
Trabajo-de-Titulación.pdfVersión presentada (texto completo)4.36 MBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00