Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca
Loading...
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Nacional Mayor de San Marcos
Abstract
Determina la efectividad de un modelo propuesto de
machine learning para predecir binariamente la complejidad léxica de palabras en instituciones
secundarias en un distrito de Cajamarca en comparación con el baseline del CWI Shared Task
2018 para el idioma español.
La metodología empleada usó el dataset en español del CWI Shared Task 2018 para el
entrenamiento y un dataset de validación que se recolectó a partir de textos escolares para la
evaluación del modelo en el contexto específico de las instituciones secundarias mencionadas.
Los resultados en el contexto educativo demostraron un desempeño superior a los baselines
establecidos, en cuanto a la precisión, así como en la eficiencia del uso de recursos
computacionales evaluados.
Se determinó la efectividad del modelo de machine learning para la predicción binaria de la
complejidad léxica de palabras en el contexto de las instituciones secundarias de un distrito de
Cajamarca, haciendo frente a la escasa literatura para esta tarea en el idioma español y
representando un primer acercamiento hacia sistemas personalizados en dicho contexto educativo,
lo cual podría contribuir en la mejora de la comprensión lectora y del aprendizaje del alumnado.
Se plantea la sugerencia al MINEDU e instituciones secundarias de implementar el modelo para
ajustar la complejidad léxica del material educativo, crear glosarios y explorar el uso de
inteligencia artificial en la simplificación léxica de forma más eficaz y eficiente.
Description
Keywords
Machine Learning, Identificación, Lexicografía, Inteligencia artificial
Citation
Mera, L. (2025). Modelo de machine learning para predicción de la complejidad léxica de palabras en instituciones secundarias en un distrito de Cajamarca. [Tesis de maestría, Universidad Nacional Mayor de San Marcos, Facultad de Ingeniería de Sistemas e Informática, Unidad de Posgrado]. Repositorio institucional Cybertesis UNMSM.