Logo Repositorio Institucional

Please use this identifier to cite or link to this item: http://dspace.ucuenca.edu.ec/handle/123456789/35747
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorSánchez Alvarracín, Carlos Mauricio-
dc.contributor.authorPalacios Alvear, Karla Rafaela-
dc.date.accessioned2021-03-05T18:03:19Z-
dc.date.available2021-03-05T18:03:19Z-
dc.date.issued2021-03-05-
dc.identifier.urihttp://dspace.ucuenca.edu.ec/handle/123456789/35747-
dc.description: En el presente trabajo se muestra la aplicación de modelos de clasificación comparativos, a través de variables específicas, para determinar la deserción universitaria respecto de los estudiantes de la Facultad de Ciencias Químicas de la Universidad de Cuenca. En este contexto, a través de la minería de datos se aplicaron dos modelos de clasificación: K- vecinos más próximos (knn) y regresión logística (rl) a fin de catalogar al alumnado de primer año en dos poblaciones, a saber: deserción o permanencia. Los datos fueron obtenidos de la ficha socioeconómica, presentada por los referidos estudiantes, desde el año 2014 hasta el 2018, además se identificaron los grupos poblacionales correspondientes a quienes abandonaron la carrera en el primer año y a quienes continuaron con sus estudios. Con base a esto, fue posible interrelacionar las variables para agrupar las mismas mediante el análisis de componentes principales (ACP). Los datos fueron separados para entrenamiento y validación de los modelos. Los sistemas fueron modelados en RapidMiner generando una matriz de confusión, lo que permitió determinar que el modelo knn presenta mejor exactitud de 73,30% frente a un 54,67% del modelo de Regresión Logística. Finalmente, se concluye que las principales causas de deserción son: el total ingreso, total egreso, mensual pago de arriendo, avalúo acumulado de vehículos, tipo de colegio. A través de la matriz de confusión se evaluaron los modelos (knn y rl) seleccionando al modelo knn como mejor opción. Por últimos se verificó que el modelo knn tiene un error del 20% respecto la realidad.en_US
dc.description.abstractThis degree work shows an application of comparative classification models, through specific variables, to determine the university dropout of students from the Faculty of Chemical Sciences of the University of Cuenca. In this context, through data mining, two classification models were applied: K- nearest neighbors (knn) and logistic regression to classify first-year students into two populations: dropout or permanence. The data was obtained from the socio-economic record of the students from 2014 to 2018, in addition, the population groups corresponding to those who dropped out in the first year and those who continued with their studies were identified. Based on this, it was possible to interrelate the variables to group them through principal component analysis (PCA). The data were separated for training and validation of the models. The systems were modeled in RapidMiner generating a confusion matrix, which allowed determining that the knn model presents a better current of 73.30% compared to 54.67% of the Logistic Regression model. Additionally, it was concluded that the most relevant variables are those that make up the main component 1: total income, total expenses, monthly rent payment, type of high school, cumulative valuation of vehicles. Through the confusion matrix, the models (knn and rl) were evaluated, selecting the knn model as the best option.en_US
dc.formatapplication/pdfen_US
dc.format.extent39 páginasen_US
dc.language.isospaen_US
dc.publisherUniversidad de Cuencaen_US
dc.relation.ispartofseriesTN;504-
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectIngeniería Industrialen_US
dc.subjectDeserción estudiantilen_US
dc.subjectUniversidad de Cuencaen_US
dc.subjectProblemática socialen_US
dc.subject.otherEducación superioren_US
dc.titleComparativa de modelos de clasificación para inferir la probabilidad de deserción estudiantil en la Facultad de Ciencias Químicas de la Universidad de Cuencaen_US
dc.typebachelorThesisen_US
dc.description.degreeIngeniero Industrialen_US
dc.description.cityCuencaen_US
dc.ucuenca.id0102367653en_US
dc.ucuenca.idautor0105503189en_US
dc.ucuenca.versionsubmittedVersionen_US
dc.ucuenca.areaconocimientounescoamplio63 Sociologíaen_US
dc.ucuenca.correspondenciakarafapalacios@gmail.comen_US
dc.ucuenca.areaconocimientounescoespecifico6310 Problemas Socialesen_US
dc.ucuenca.areaconocimientounescodetallado6310.11 Bienestar Socialen_US
dc.rights.accessRightsopenAccessen_US
dc.ucuenca.responsablerecepcionVerdugo Bravo Iván Marceloen_US
Appears in Collections:Tesis de Pregrado

Files in This Item:
File Description SizeFormat 
Trabajo de Titulacion.pdfVersión presentada (texto completo)2.38 MBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00