Logo Repositorio Institucional

Por favor, use este identificador para citar o enlazar este ítem: http://dspace.ucuenca.edu.ec/handle/123456789/35495
Título : Detección de valores atípicos con técnicas de minería de datos y métodos estadísticos
Otros títulos : Outlier detection with data mining techniques and statistical methods
Autor: Orellana Cordero, Marcos Patricio
Cedillo Orellana, Irene Priscila
Correspondencia: Cedillo Orellana, Irene Priscila, priscila.cedillo@ucuenca.edu.ec
Palabras clave : KNN
Chi-square
Financial fraud
Outlier
Data mining
Área de conocimiento FRASCATI amplio: 2. Ingeniería y Tecnología
Área de conocimiento FRASCATI detallado: 2.10.2 Nano-Procesos [Aplicaciones a Nano-Escala]
Área de conocimiento FRASCATI específico: 2.10 NanoTecnología
Área de conocimiento UNESCO amplio: 06 - Información y Comunicación (TIC)
ÁArea de conocimiento UNESCO detallado: 0612 - Base de Datos, Diseno y Administración de Redes
Área de conocimiento UNESCO específico: 061 - Información y Comunicación (TIC)
Fecha de publicación : 2020
Volumen: Volumen 11, número 1
Fuente: Enfoque UTE. Revista de ingeniería científica
metadata.dc.identifier.doi: 10.29019/enfoque.v11n1.584
Tipo: ARTÍCULO
Abstract: 
The detection of outliers in the field of data mining (DM) and the process of knowledge discovery in databases (KDD) is of great interest in areas that require support systems for decision making. A straightforward application can be found in the financial area, where DM can potentially detect financial fraud or find errors produced by the users. Thus, it is essential to evaluate the veracity of the information, through the use of methods for the detection of unusual behaviors in the data. This paper proposes a method to detect values ​​that are considered outliers in a database of nominal type data. The method implements a global algorithm of "k" closest neighbors, a clustering algorithm called k-means and a statistical method called chi-square. These techniques have been implemented on a database of clients who have requested a financial credit. The experiment was performed on a data set with 1180 tuples, where, outliers were deliberately introduced. The results showed that the proposed method is able to detect all the outliers entered.
Resumen : 
La detección de valores atípicos en el campo de la minería de datos (DM) y el descubrimiento de conocimiento a partir de datos (KDD) es de gran interés en áreas que requieren sistemas de soporte a la toma de decisiones, como, por ejemplo, en el área financiera, en donde mediante DM se pueden detectar fraudes financieros o encontrar errores producidos por los usuarios. Entonces, es esencial, evaluar la veracidad de la información, a través de métodos de detección de comportamientos inusuales en los datos. Este artículo propone un método para detectar valores que se consideran valores atípicos en una base de datos de datos de tipo nominal. El método implementa un algoritmo global de “k” vecinos más cercanos, un algoritmo de agrupamiento denominado k-means y un método estadístico denominado chi-cuadrado. La aplicación de estas técnicas ha sido implementada sobre una base de datos de clientes que han solicitado un crédito financiero. El experimento se realizó sobre un conjunto de datos con 1180 tuplas, en donde, deliberadamente se introdujeron valores atípicos. Los resultados demostraron que el método propuesto es capaz de detectar todos los valores atípicos introducidos.
URI : http://dspace.ucuenca.edu.ec/handle/123456789/35495
http://scielo.senescyt.gob.ec/scielo.php?script=sci_arttext&pid=S1390-65422020000100056
URI Fuente: https://ingenieria.ute.edu.ec/enfoqueute/index.php/revista
ISSN : 1390-9363, e 1390-6542
Aparece en las colecciones: Artículos

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
documento.pdfdocument450.67 kBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00