Tesis EP Estadística
Permanent URI for this collectionhttps://hdl.handle.net/20.500.12672/38
Browse
Browsing Tesis EP Estadística by browse.metadata.advisor "Fiestas Flores, Roberto Carlos"
Now showing 1 - 6 of 6
- Results Per Page
- Sort Options
Item Detección de anemia infantil y sus factores asociados en el Perú, mediante XGBoost interpretado con SHAP: ENDES 2023(Universidad Nacional Mayor de San Marcos, 2025) Alarcon Arone, Jose Armando; Fiestas Flores, Roberto CarlosLa investigación desarrolla un modelo predictivo de anemia infantil en niños peruanos menores de tres años mediante la técnica de Extreme Gradient Boosting (XGBoost), complementado con la interpretación de Shapley Additive Explanations (SHAP), a fin de identificar factores de riesgo asociados a esta condición. Para ello se utilizaron los datos de la Encuesta Demográfica y de Salud Familiar (ENDES) 2023, considerando la alta prevalencia nacional de anemia (≈43,1%). El modelo XGBoost alcanzó un desempeño de predicción moderado (AUC-ROC: 0.687) y, gracias al análisis interpretativo con SHAP, fue posible identificar y cuantificar la influencia de determinantes críticos como la edad del niño, el índice de riqueza y la edad de la madre. Los hallazgos permiten concluir que la combinación XGBoost+SHAP constituye una herramienta eficaz y transparente tanto para la detección temprana de la anemia infantil como para la comprensión de sus factores asociados, aportando evidencia útil para diseñar intervenciones de salud pública más focalizadas.Item Factores determinantes de la reincorporación laboral en el Perú: Un análisis mediante Regresión Logística - 2024(Universidad Nacional Mayor de San Marcos, 2025) Vilca Maslucán, Teresa Mercedes; Fiestas Flores, Roberto CarlosEn la presente investigación se analizaron los factores asociados a la reincorporación laboral de personas desocupadas en el Perú con datos de la Encuesta Permanente de Empleo Nacional (EPEN) 2024. En donde se analizaron 12,327 casos de personas desocupadas que buscaron activamente empleo. Se aplico una regresión logística binaria clásica, que se complementó con técnicas de datos desbalanceados SMOTE y RUS a fin de mejorar la precisión del modelo. Los resultados muestran que los factores sociodemográficos significativos que más aportan al modelo de predicción de obtención de empleo son el género (36.14%), el interés por trabajar (34.23%), y la intensidad en la búsqueda de empleo (23.50%). Estas variables muestran la gran importancia que tienen los factores ocupacionales psicológicos y motivacionales al momento de buscar un empleo. Finalmente, al evaluar la capacidad predictiva del modelo, se observó una mejora importante al aplicar técnicas de remuestreo. Con SMOTE se obtuvo un AUC de 0.75 y con RUS 0.71, ambos por encima del resultado alcanzado con la regresión logística clásica que fue de 0.70. Estas mejoras reflejan un mejor desempeño del modelo al identificar los casos menos frecuentes.Item Factores sociales, demográficos y económicos que inciden en la violencia conyugal hacia la mujer en el Perú. (ENDES 2023)(Universidad Nacional Mayor de San Marcos, 2025) Peralta Palacios, Anderson Moner; Fiestas Flores, Roberto CarlosLa investigación tuvo como objetivo analizar la relación entre factores sociales, demográficos y económicos con la violencia conyugal hacia las mujeres en el contexto peruano, utilizando datos de la Encuesta Demográfica y de Salud Familiar (ENDES) 2023. El estudio adoptó un enfoque descriptivo-correlacional, con un diseño no experimental de tipo transversal, y se centró en mujeres en edad fértil (15 a 49 años), seleccionadas mediante un muestreo probabilístico bietápico, estratificado e independiente a nivel nacional. La violencia conyugal fue evaluada en sus dimensiones psicológica, física y sexual, mientras que las variables independientes se agruparon en tres bloques: factores sociales (tamaño del hogar, consumo de alcohol del esposo, jefatura del hogar), demográficos (nivel educativo, síntomas depresivos, edad) y económicos (situación laboral, nivel de riqueza, brecha de ingresos con la pareja). El análisis bivariado mediante Chi-cuadrado mostró asociaciones significativas entre la violencia y variables como el consumo de alcohol del esposo, la jefatura del hogar, el nivel educativo, la presencia de síntomas depresivos y el índice de riqueza. A través de un modelo de regresión logística binaria se identificaron los factores con mayor incidencia en la probabilidad de ocurrencia de violencia, destacando los síntomas depresivos como el predictor más relevante (Exp(B) = 1.356; p = 0.000), mientras que el nivel educativo de ambos miembros de la pareja, la edad, el índice de riqueza y la paridad de ingresos mostraron un efecto protector. El uso del modelo permitió controlar múltiples variables simultáneamente, fortaleciendo la interpretación de los resultados y proporcionando una visión integral del fenómeno. Los hallazgos evidencian la interacción compleja entre dimensiones sociales, económicas y demográficas, y subrayan la necesidad de diseñar estrategias de intervención articuladas y multisectoriales para prevenir y atender la violencia conyugal.Item Modelado y pronóstico del Índice de Precios al Consumidor de Lima Metropolitana mediante modelos Box-Jenkins, 1991–2025(Universidad Nacional Mayor de San Marcos, 2025) Quispe Chipana, Diego Nicolas; Fiestas Flores, Roberto CarlosLa presente investigación tiene como objetivo principal determinar un modelo ARIMA o SARIMA, mediante la metodología Box-Jenkins, que describa y pronostique con precisión la evolución del Índice de Precios al Consumidor (IPC) mensual de Lima Metropolitana durante el período 1991-2025. Este estudio surge ante la creciente necesidad de realizar proyecciones confiables sobre la inflación en un contexto caracterizado por disrupciones económicas a nivel global y regional, tales como la pandemia, los conflictos geopolíticos y la volatilidad en los mercados internacionales. Para ello, se analizaron las propiedades estadísticas de la serie temporal del IPC, identificando sus componentes de tendencia, estacionalidad y autocorrelación. Posteriormente, se ajustaron diferentes modelos ARIMA y SARIMA, seleccionando el más adecuado en función de criterios de bondad de ajuste como el AIC, el BIC y el análisis de residuos. Finalmente, se evaluó la capacidad predictiva del modelo seleccionado mediante la comparación entre los valores pronosticados y los datos reales más recientes. Los resultados muestran que el modelo SARIMA proporciona un ajuste adecuado a la estructura temporal del IPC y genera predicciones con un margen de error aceptable, demostrando su utilidad para el análisis económico y la planificación de políticas monetarias. Asimismo, la investigación resalta la importancia de aplicar metodologías estadísticas rigurosas, como la de Box-Jenkins, para comprender y anticipar el comportamiento de indicadores económicos clave.Item Modelos ARIMA para pronosticar el número de estudiantes matriculados en una universidad pública de Lima 2025(Universidad Nacional Mayor de San Marcos, 2025) Granados Chavez, Estefanny Grecia; Fiestas Flores, Roberto CarlosEl trabajo de suficiencia profesional se centró en la proyección del número de estudiantes matriculados en una universidad pública, considerando la importancia de una adecuada planificación académica, de infraestructura y de recursos en función de la Ley Universitaria y la programación multianual de presupuesto. Para ello, se recopilaron datos semestrales del periodo 2015-2024 provenientes de la unidad encargada de matrícula, aplicando la metodología Box-Jenkins para la construcción de modelos de series temporales. El análisis permitió identificar al modelo ARIMA (0,1,0) como el más adecuado para realizar el pronóstico de la cantidad de estudiantes matriculados hasta el año 2027, cuyos resultados mostraron una alta concordancia con los valores observados, confirmando la utilidad del enfoque estadístico para la gestión y planificación universitaria.Item Regresión logística: hipertensión arterial asociado con los estilos de vida según la Encuesta Nacional Demográfica y de Salud Familiar 2023, Perú(Universidad Nacional Mayor de San Marcos, 2025) Flores Ganggini, Jesus Alfredo; Fiestas Flores, Roberto CarlosEste estudio tuvo como propósito analizar la relación entre la hipertensión arterial y determinados estilos de vida en personas mayores de 15 años en el Perú, a partir de los datos proporcionados por la Encuesta Demográfica y de Salud Familiar (ENDES) 2023, mediante un modelo de regresión logística. Se examinaron como variables independientes el consumo limitado de frutas y verduras, así como el consumo de tabaco y alcohol, por su potencial asociación con la hipertensión. La muestra utilizada abarcó participantes de diversas regiones del país, representando de manera adecuada a la población nacional. Los hallazgos revelaron una relación estadísticamente significativa entre la presencia de hipertensión arterial y los estilos de vida mencionados. Específicamente, el bajo consumo de frutas y verduras presentó una odds ratio (OR) ajustada de 1.57 (IC 95 %: 1.3631.82), el consumo de tabaco una OR de 1.45 (IC 95 %: 1.2231.72) y el consumo de alcohol una OR de 1.39 (IC 95 %: 1.2031.60), todos con un valor p < 0.001. Estos resultados indican que una dieta deficiente, el tabaquismo y el alcoholismo aumentan considerablemente el riesgo de padecer hipertensión. En vista de ello, se enfatiza la necesidad de fomentar prácticas de vida saludables como parte de las estrategias preventivas. Asimismo, se sugiere desarrollar e implementar políticas de salud pública orientadas a la reducción de factores de riesgo modificables en la población peruana.