Publication:
Detección de valores atípicos con técnicas de minería de datos y métodos estadísticos

dc.contributor.authorCedillo Orellana, Irene Priscila
dc.contributor.authorOrellana Cordero, Marcos Patricio
dc.date.accessioned2021-01-21T23:05:39Z
dc.date.available2021-01-21T23:05:39Z
dc.date.issued2020
dc.descriptionLa detección de valores atípicos en el campo de la minería de datos (DM) y el descubrimiento de conocimiento a partir de datos (KDD) es de gran interés en áreas que requieren sistemas de soporte a la toma de decisiones, como, por ejemplo, en el área financiera, en donde mediante DM se pueden detectar fraudes financieros o encontrar errores producidos por los usuarios. Entonces, es esencial, evaluar la veracidad de la información, a través de métodos de detección de comportamientos inusuales en los datos. Este artículo propone un método para detectar valores que se consideran valores atípicos en una base de datos de datos de tipo nominal. El método implementa un algoritmo global de “k” vecinos más cercanos, un algoritmo de agrupamiento denominado k-means y un método estadístico denominado chi-cuadrado. La aplicación de estas técnicas ha sido implementada sobre una base de datos de clientes que han solicitado un crédito financiero. El experimento se realizó sobre un conjunto de datos con 1180 tuplas, en donde, deliberadamente se introdujeron valores atípicos. Los resultados demostraron que el método propuesto es capaz de detectar todos los valores atípicos introducidos.
dc.description.abstractThe detection of outliers in the field of data mining (DM) and the process of knowledge discovery in databases (KDD) is of great interest in areas that require support systems for decision making. A straightforward application can be found in the financial area, where DM can potentially detect financial fraud or find errors produced by the users. Thus, it is essential to evaluate the veracity of the information, through the use of methods for the detection of unusual behaviors in the data. This paper proposes a method to detect values ​​that are considered outliers in a database of nominal type data. The method implements a global algorithm of "k" closest neighbors, a clustering algorithm called k-means and a statistical method called chi-square. These techniques have been implemented on a database of clients who have requested a financial credit. The experiment was performed on a data set with 1180 tuples, where, outliers were deliberately introduced. The results showed that the proposed method is able to detect all the outliers entered.
dc.identifier.doi10.29019/enfoque.v11n1.584
dc.identifier.issn1390-9363, e 1390-6542
dc.identifier.urihttp://dspace.ucuenca.edu.ec/handle/123456789/35495
dc.identifier.urihttp://scielo.senescyt.gob.ec/scielo.php?script=sci_arttext&pid=S1390-65422020000100056
dc.language.isoes_ES
dc.sourceEnfoque UTE. Revista de ingeniería científica
dc.subjectChi-square
dc.subjectData mining
dc.subjectOutlier
dc.subjectKNN
dc.subjectFinancial fraud
dc.titleDetección de valores atípicos con técnicas de minería de datos y métodos estadísticos
dc.title.alternativeOutlier detection with data mining techniques and statistical methods
dc.typeARTÍCULO
dc.ucuenca.afiliacionCedillo, I., Universidad de Cuenca, Departamento de Ciencias de la Computación, Cuenca, Ecuador
dc.ucuenca.afiliacionOrellana, M., Universidad del Azuay, Cuenca, Ecuador
dc.ucuenca.areaconocimientofrascatiamplio2. Ingeniería y Tecnología
dc.ucuenca.areaconocimientofrascatidetallado2.10.2 Nano-Procesos [Aplicaciones a Nano-Escala]
dc.ucuenca.areaconocimientofrascatiespecifico2.10 NanoTecnología
dc.ucuenca.areaconocimientounescoamplio06 - Información y Comunicación (TIC)
dc.ucuenca.areaconocimientounescodetallado0612 - Base de Datos, Diseno y Administración de Redes
dc.ucuenca.areaconocimientounescoespecifico061 - Información y Comunicación (TIC)
dc.ucuenca.correspondenciaCedillo Orellana, Irene Priscila, priscila.cedillo@ucuenca.edu.ec
dc.ucuenca.idautor0102668209
dc.ucuenca.idautor0102815842
dc.ucuenca.indicebibliograficoDOAJ
dc.ucuenca.urifuentehttps://ingenieria.ute.edu.ec/enfoqueute/index.php/revista
dc.ucuenca.versionVersión publicada
dc.ucuenca.volumenVolumen 11, número 1
dspace.entity.typePublication
relation.isAuthorOfPublication9ecaad85-5b06-4b92-b05c-0d89c7b10660
relation.isAuthorOfPublication.latestForDiscovery9ecaad85-5b06-4b92-b05c-0d89c7b10660

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
documento.pdf
Size:
450.67 KB
Format:
Adobe Portable Document Format
Description:
document

Collections