Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Nacional Mayor de San Marcos
Abstract
La atención oportuna y eficiente de los reclamos ciudadanos en el sector público representa un desafío persistente, especialmente ante el creciente volumen de registros
en plataformas virtuales. El procesamiento manual de estos reclamos genera demoras, errores y respuestas insatisfactorias que afectan la confianza del ciudadano en la
gestión pública. La presente investigación de carácter aplicado y experimental tiene
como objetivo validar la efectividad de técnicas de clasificación automática de reclamos mediante el uso de Natural Language Processing (NLP) y algoritmos de Machine
Learning (ML). Para ello, se formula una hipótesis principal orientada a determinar si
es posible mejorar la clasificación y gestión de reclamos en un libro de reclamaciones
virtual mediante la aplicación de modelos supervisados entrenados con datos reales del
sector público peruano. Se desarrolló un análisis comparativo de cinco algoritmos de
clasificación: Naive Bayes, Random Forest, Logistic Regression, Linear Support Vector
Classifier (LinearSVC) y el modelo de lenguaje Claude AI. El conjunto de datos constó
de 261,627 registros textuales, categorizados en seis clases: reclamo, queja, denuncia,
consulta, sugerencia y otro. Los textos fueron sometidos a procesos de lematización,
vectorización TF-IDF y balanceo mediante SMOTE, y los modelos fueron evaluados
mediante métricas como precisión, recall y F1-score. Los resultados demuestran que
es factible mejorar significativamente la clasificación. Entre los algoritmos clásicos,
la Logistic Regression mostró un desempeño sólido y equilibrado, alcanzando un F1-
score de 0.8639 en la categoría “Reclamo”. El modelo LinearSVC demostró alta capacidad de generalización con recall de 1.0 en clases minoritarias. El modelo Claude
AI presentó un rendimiento competitivo, aunque inferior a los modelos supervisados
optimizados. Esto confirma que la aplicación de NLP y ML, particularmente con modelos entrenados específicamente para el dominio, constituye una solución escalable
y confiable para optimizar la gestión de reclamos, reduciendo tiempos de atención y
aumentando la eficiencia operativa en entornos institucionales digitales.
Description
Keywords
Automatización, Plataformas virtuales, Atención
Citation
Diaz, T. (2025). Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.