Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural

Diaz Tunjar, Thalia

Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural

Files

Diaz_tt.pdf (2.81 MB)

Diaz_tt_autorizacion.pdf (425.32 KB)

Diaz_tt_reporte de turnitin.pdf (11.43 MB)

Date

2025

Authors

Diaz Tunjar, Thalia

Publisher

Universidad Nacional Mayor de San Marcos

Abstract

La atención oportuna y eficiente de los reclamos ciudadanos en el sector público representa un desafío persistente, especialmente ante el creciente volumen de registros en plataformas virtuales. El procesamiento manual de estos reclamos genera demoras, errores y respuestas insatisfactorias que afectan la confianza del ciudadano en la gestión pública. La presente investigación de carácter aplicado y experimental tiene como objetivo validar la efectividad de técnicas de clasificación automática de reclamos mediante el uso de Natural Language Processing (NLP) y algoritmos de Machine Learning (ML). Para ello, se formula una hipótesis principal orientada a determinar si es posible mejorar la clasificación y gestión de reclamos en un libro de reclamaciones virtual mediante la aplicación de modelos supervisados entrenados con datos reales del sector público peruano. Se desarrolló un análisis comparativo de cinco algoritmos de clasificación: Naive Bayes, Random Forest, Logistic Regression, Linear Support Vector Classifier (LinearSVC) y el modelo de lenguaje Claude AI. El conjunto de datos constó de 261,627 registros textuales, categorizados en seis clases: reclamo, queja, denuncia, consulta, sugerencia y otro. Los textos fueron sometidos a procesos de lematización, vectorización TF-IDF y balanceo mediante SMOTE, y los modelos fueron evaluados mediante métricas como precisión, recall y F1-score. Los resultados demuestran que es factible mejorar significativamente la clasificación. Entre los algoritmos clásicos, la Logistic Regression mostró un desempeño sólido y equilibrado, alcanzando un F1- score de 0.8639 en la categoría “Reclamo”. El modelo LinearSVC demostró alta capacidad de generalización con recall de 1.0 en clases minoritarias. El modelo Claude AI presentó un rendimiento competitivo, aunque inferior a los modelos supervisados optimizados. Esto confirma que la aplicación de NLP y ML, particularmente con modelos entrenados específicamente para el dominio, constituye una solución escalable y confiable para optimizar la gestión de reclamos, reduciendo tiempos de atención y aumentando la eficiencia operativa en entornos institucionales digitales.

Keywords

Automatización, Plataformas virtuales, Atención

Citation

Diaz, T. (2025). Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.

URI

https://hdl.handle.net/20.500.12672/28151

Collections

Maestría Facultad de Ingeniería de Sistemas e Informática

Full item page

Clasificación de reclamos virtuales en el sector público: un análisis comparativo de algoritmos de aprendizaje automático usando procesamiento de lenguaje natural

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections