Logo Repositorio Institucional

Please use this identifier to cite or link to this item: http://dspace.ucuenca.edu.ec/handle/123456789/35495
Title: Detección de valores atípicos con técnicas de minería de datos y métodos estadísticos
Other Titles: Outlier detection with data mining techniques and statistical methods
Authors: Orellana Cordero, Marcos Patricio
Cedillo Orellana, Irene Priscila
metadata.dc.ucuenca.correspondencia: Cedillo Orellana, Irene Priscila, priscila.cedillo@ucuenca.edu.ec
Keywords: KNN
Chi-square
Financial fraud
Outlier
Data mining
metadata.dc.ucuenca.areaconocimientofrascatiamplio: 2. Ingeniería y Tecnología
metadata.dc.ucuenca.areaconocimientofrascatidetallado: 2.10.2 Nano-Procesos [Aplicaciones a Nano-Escala]
metadata.dc.ucuenca.areaconocimientofrascatiespecifico: 2.10 NanoTecnología
metadata.dc.ucuenca.areaconocimientounescoamplio: 06 - Información y Comunicación (TIC)
metadata.dc.ucuenca.areaconocimientounescodetallado: 0612 - Base de Datos, Diseno y Administración de Redes
metadata.dc.ucuenca.areaconocimientounescoespecifico: 061 - Información y Comunicación (TIC)
Issue Date: 2020
metadata.dc.ucuenca.volumen: Volumen 11, número 1
metadata.dc.source: Enfoque UTE. Revista de ingeniería científica
metadata.dc.identifier.doi: 10.29019/enfoque.v11n1.584
metadata.dc.type: ARTÍCULO
Abstract: 
The detection of outliers in the field of data mining (DM) and the process of knowledge discovery in databases (KDD) is of great interest in areas that require support systems for decision making. A straightforward application can be found in the financial area, where DM can potentially detect financial fraud or find errors produced by the users. Thus, it is essential to evaluate the veracity of the information, through the use of methods for the detection of unusual behaviors in the data. This paper proposes a method to detect values ​​that are considered outliers in a database of nominal type data. The method implements a global algorithm of "k" closest neighbors, a clustering algorithm called k-means and a statistical method called chi-square. These techniques have been implemented on a database of clients who have requested a financial credit. The experiment was performed on a data set with 1180 tuples, where, outliers were deliberately introduced. The results showed that the proposed method is able to detect all the outliers entered.
Description: 
La detección de valores atípicos en el campo de la minería de datos (DM) y el descubrimiento de conocimiento a partir de datos (KDD) es de gran interés en áreas que requieren sistemas de soporte a la toma de decisiones, como, por ejemplo, en el área financiera, en donde mediante DM se pueden detectar fraudes financieros o encontrar errores producidos por los usuarios. Entonces, es esencial, evaluar la veracidad de la información, a través de métodos de detección de comportamientos inusuales en los datos. Este artículo propone un método para detectar valores que se consideran valores atípicos en una base de datos de datos de tipo nominal. El método implementa un algoritmo global de “k” vecinos más cercanos, un algoritmo de agrupamiento denominado k-means y un método estadístico denominado chi-cuadrado. La aplicación de estas técnicas ha sido implementada sobre una base de datos de clientes que han solicitado un crédito financiero. El experimento se realizó sobre un conjunto de datos con 1180 tuplas, en donde, deliberadamente se introdujeron valores atípicos. Los resultados demostraron que el método propuesto es capaz de detectar todos los valores atípicos introducidos.
URI: http://dspace.ucuenca.edu.ec/handle/123456789/35495
http://scielo.senescyt.gob.ec/scielo.php?script=sci_arttext&pid=S1390-65422020000100056
metadata.dc.ucuenca.urifuente: https://ingenieria.ute.edu.ec/enfoqueute/index.php/revista
ISSN: 1390-9363, e 1390-6542
Appears in Collections:Artículos

Files in This Item:
File Description SizeFormat 
documento.pdfdocument450.67 kBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00