Modelo de explicabilidad para la deserción universitaria a través de aprendizaje automático
No Thumbnail Available
Date
2026
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Nacional Mayor de San Marcos
Abstract
La deserción estudiantil universitaria constituye una problemática compleja y persistente
que afecta la eficiencia de los sistemas de educación superior, interrumpe las trayectorias
formativas de los estudiantes y genera repercusiones académicas, sociales e
institucionales. En este contexto, desarrolla un modelo de explicabilidad basado en el
aprendizaje automático para predecir e interpretar los factores asociados a la deserción
estudiantil universitaria. La investigación se desarrolló a partir de la información del
sistema institucional de gestión académica. El conjunto de datos consolidado se conformó
por 17 183 registros y, tras la depuración y validación de calidad, se trabajó con 36
variables sociodemográficas, económicas, institucionales, personales y académicas.
Posteriormente, se aplican técnicas de preprocesamiento, tratamiento del desequilibrio de
clases, selección de características, entrenamiento de modelos, optimización de
hiperparámetros y evaluación mediante métricas robustas.
Los resultados evidenciaron que los modelos de aprendizaje automático permiten
identificar con alta capacidad discriminativa a los estudiantes en riesgo de abandono.
Entre los algoritmos evaluados, Extra Trees presentó el mejor desempeño global, con F1-
score de 0.892, recall de 1.000, precision de 0.971, accuracy de 0.998 y ROC-AUC
cercano a 1.000, superando a Random Forest y Logistic Regression en el equilibrio entre
sensibilidad y precisión para la clasificación de la clase minoritaria. Estos hallazgos
confirman que los métodos de ensamble basados en árboles constituyen una alternativa
especialmente robusta para el análisis de la deserción en escenarios con datos
desbalanceados.
El estudio concluye que el uso del aprendizaje automático, articulado con técnicas de
explicabilidad, contribuye significativamente a la comprensión y la predicción de la
deserción estudiantil universitaria, permitiendo identificar patrones y factores de riesgo que no son evidentes a simple vista y resultan fundamentales para orientar acciones de
intervención y de permanencia estudiantil. Este enfoque fue desarrollado en el contexto
de la educación superior, lo que demuestra su utilidad para apoyar la toma de decisiones
institucionales con mayor precisión, transparencia y sustento analítico. Asimismo, su
estructura metodológica puede extenderse a otras facultades, carreras e incluso a distintas
instituciones de educación superior, incorporando nuevas variables significativas que
continúen fortaleciendo y optimizando la capacidad predictiva y explicativa del modelo.
Description
Keywords
Deserción estudiantil, Aprendizaje, Inteligencia artificial
Citation
Quimiz, M. (2026). Modelo de explicabilidad para la deserción universitaria a través de aprendizaje automático. [Tesis de doctorado, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.