Title: | Comparativa de modelos de clasificación para inferir la probabilidad de deserción estudiantil en la Facultad de Ciencias Químicas de la Universidad de Cuenca |
Authors: | Palacios Alvear, Karla Rafaela |
metadata.dc.contributor.advisor: | Sánchez Alvarracin, Carlos Mauricio |
metadata.dc.ucuenca.correspondencia: | karafapalacios@gmail.com |
metadata.dc.subject.other: | Educación superior |
Keywords: | Ingeniería Industrial Deserción estudiantil Universidad de Cuenca Problemática social |
metadata.dc.ucuenca.areaconocimientounescoamplio: | 63 Sociología |
metadata.dc.ucuenca.areaconocimientounescodetallado: | 6310.11 Bienestar Social |
metadata.dc.ucuenca.areaconocimientounescoespecifico: | 6310 Problemas Sociales |
Issue Date: | 5-Mar-2021 |
metadata.dc.format.extent: | 39 páginas |
Publisher: | Universidad de Cuenca |
metadata.dc.description.city: | Cuenca |
Series/Report no.: | TN;504 |
metadata.dc.type: | bachelorThesis |
Abstract: | This degree work shows an application of comparative classification models,
through specific variables, to determine the university dropout of students from the
Faculty of Chemical Sciences of the University of Cuenca. In this context, through data
mining, two classification models were applied: K- nearest neighbors (knn) and logistic
regression to classify first-year students into two populations: dropout or permanence.
The data was obtained from the socio-economic record of the students from 2014 to
2018, in addition, the population groups corresponding to those who dropped out in the
first year and those who continued with their studies were identified. Based on this, it
was possible to interrelate the variables to group them through principal component
analysis (PCA). The data were separated for training and validation of the models. The
systems were modeled in RapidMiner generating a confusion matrix, which allowed
determining that the knn model presents a better current of 73.30% compared to
54.67% of the Logistic Regression model. Additionally, it was concluded that the most
relevant variables are those that make up the main component 1: total income, total
expenses, monthly rent payment, type of high school, cumulative valuation of vehicles.
Through the confusion matrix, the models (knn and rl) were evaluated, selecting the
knn model as the best option. |
Description: | : En el presente trabajo se muestra la aplicación de modelos de clasificación comparativos, a
través de variables específicas, para determinar la deserción universitaria respecto de los estudiantes de
la Facultad de Ciencias Químicas de la Universidad de Cuenca. En este contexto, a través de la minería de
datos se aplicaron dos modelos de clasificación: K- vecinos más próximos (knn) y regresión logística (rl) a
fin de catalogar al alumnado de primer año en dos poblaciones, a saber: deserción o permanencia. Los
datos fueron obtenidos de la ficha socioeconómica, presentada por los referidos estudiantes, desde el
año 2014 hasta el 2018, además se identificaron los grupos poblacionales correspondientes a quienes
abandonaron la carrera en el primer año y a quienes continuaron con sus estudios. Con base a esto, fue
posible interrelacionar las variables para agrupar las mismas mediante el análisis de componentes
principales (ACP). Los datos fueron separados para entrenamiento y validación de los modelos. Los
sistemas fueron modelados en RapidMiner generando una matriz de confusión, lo que permitió
determinar que el modelo knn presenta mejor exactitud de 73,30% frente a un 54,67% del modelo de
Regresión Logística. Finalmente, se concluye que las principales causas de deserción son: el total ingreso,
total egreso, mensual pago de arriendo, avalúo acumulado de vehículos, tipo de colegio. A través de la
matriz de confusión se evaluaron los modelos (knn y rl) seleccionando al modelo knn como mejor opción.
Por últimos se verificó que el modelo knn tiene un error del 20% respecto la realidad. |
metadata.dc.description.degree: | Ingeniero Industrial |
URI: | http://dspace.ucuenca.edu.ec/handle/123456789/35747 |
Appears in Collections: | Tesis de Pregrado
|