EP Estadística
Permanent URI for this communityhttps://hdl.handle.net/20.500.12672/5100
Browse
Browsing EP Estadística by browse.metadata.advisor "Fiestas Flores, Roberto Carlos"
Now showing 1 - 14 of 14
- Results Per Page
- Sort Options
Item Algoritmos de Machine Learning para la priorización de clientes en campañas comerciales en un call center de ventas, MF Asesoría y Consultoría 2024(Universidad Nacional Mayor de San Marcos, 2025) Villacorta Tito, Luis Daniel; Fiestas Flores, Roberto CarlosEl trabajo de suficiencia profesional tuvo como propósito desarrollar e implementar un modelo de machine learning para la priorización de clientes en una campaña comercial de ventas telefónicas de productos financieros en la empresa MF Asesoría y Consultoría S.A.C., especializada en la gestión de fuerzas de venta para entidades del sector financiero. El problema identificado fue la asignación subóptima del esfuerzo comercial por el uso exclusivo del juicio experto. Para abordarlo se aplicó la metodología CRISP-DM, que incluyó exploración, limpieza y transformación de datos, así como la selección y evaluación de algoritmos de clasificación. Tras comparar más de diez modelos y ajustar hiperparámetros mediante RandomGridSearch, se seleccionó Linear Discriminant Analysis (LDA) por su rendimiento y capacidad de generar probabilidades. El modelo se integró en un pipeline y fue desplegado en producción, obteniendo mejoras en la productividad y efectividad comercial, con un AUC de 0.713 y un Gini de 0.426. Se concluye que el enfoque basado en datos permite una asignación más eficiente de recursos y puede ser replicado en otras campañas del sector financiero.Item Análisis de correspondencia: posicionamiento de proveedores de publicidad exterior en los sectores económicos con mayor inversión(Universidad Nacional Mayor de San Marcos, 2025) Aiquipa Miranda, Fredy; Fiestas Flores, Roberto CarlosEn un contexto empresarial altamente competitivo, la investigación analiza la publicidad exterior digital como un medio estratégico para incrementar la visibilidad de las marcas en Lima Metropolitana, mediante la aplicación de la técnica de análisis de correspondencia simple. El objetivo fue identificar asociaciones relevantes entre los principales sectores económicos con mayor inversión en pantallas digitales y las empresas proveedoras de estos servicios, a partir de una matriz de contingencia construida con datos categóricos correspondientes al primer trimestre de 2025. Los resultados, validados mediante la prueba de chi-cuadrado, confirmaron la existencia de una asociación significativa entre sectores económicos y proveedores, lo que permitió rechazar la hipótesis de independencia. El análisis reveló que las dos primeras dimensiones explicaron el 76 % de la inercia total, garantizando una adecuada representación de la información en un espacio bidimensional. Asimismo, se identificó que la empresa objeto de estudio presentó una fuerte asociación con el sector de Vehículos, piezas y accesorios, lo cual evidencia un posicionamiento estratégico en dicho segmento, pero también una limitada representatividad en otros sectores, lo que abre oportunidades para diversificar su presencia en el mercado de pantallas digitales.Item Árboles de regresión para el análisis de rating de avisos publicitarios del sector automotriz(Universidad Nacional Mayor de San Marcos, 2021) Palomino Mezones, Milagros Doris; Fiestas Flores, Roberto CarlosEn la actualidad el mercado del sector automotriz está en crecimiento. La Asociación Automotriz del Perú, resalta el incremento en la venta de vehículos nuevos al cierre del primer semestre del 2021, pese a que este sector fue duramente golpeado con la pandemia hoy en día viene recuperándose y es una buena oportunidad para que la agencia de marketing optimice la compra de espacios publicitarios en el medio de televisión abierta, ya que, según un informe de la Asociación de Agencias de Marketing, Televisión es el medio con mayor inversión publicitaria. Este trabajo de suficiencia profesional tiene como objetivo identificar un modelo estadístico para la toma de decisiones e identificar las variables más importantes a la hora de definir el rating. En la validación de datos se obtuvo que el coeficiente de determinación para la data de testeo fue de 0.77 y el RMSE 0.51. El mejor bloque para trasmitir los avisos publicitarios son el Estelar y Nocturno. En cuanto a variables más importantes encontramos la inversión, bloque horario, canal y genero de programa.Item Detección de anemia infantil y sus factores asociados en el Perú, mediante XGBoost interpretado con SHAP: ENDES 2023(Universidad Nacional Mayor de San Marcos, 2025) Alarcon Arone, Jose Armando; Fiestas Flores, Roberto CarlosLa investigación desarrolla un modelo predictivo de anemia infantil en niños peruanos menores de tres años mediante la técnica de Extreme Gradient Boosting (XGBoost), complementado con la interpretación de Shapley Additive Explanations (SHAP), a fin de identificar factores de riesgo asociados a esta condición. Para ello se utilizaron los datos de la Encuesta Demográfica y de Salud Familiar (ENDES) 2023, considerando la alta prevalencia nacional de anemia (≈43,1%). El modelo XGBoost alcanzó un desempeño de predicción moderado (AUC-ROC: 0.687) y, gracias al análisis interpretativo con SHAP, fue posible identificar y cuantificar la influencia de determinantes críticos como la edad del niño, el índice de riqueza y la edad de la madre. Los hallazgos permiten concluir que la combinación XGBoost+SHAP constituye una herramienta eficaz y transparente tanto para la detección temprana de la anemia infantil como para la comprensión de sus factores asociados, aportando evidencia útil para diseñar intervenciones de salud pública más focalizadas.Item Factores determinantes de la reincorporación laboral en el Perú: Un análisis mediante Regresión Logística - 2024(Universidad Nacional Mayor de San Marcos, 2025) Vilca Maslucán, Teresa Mercedes; Fiestas Flores, Roberto CarlosEn la presente investigación se analizaron los factores asociados a la reincorporación laboral de personas desocupadas en el Perú con datos de la Encuesta Permanente de Empleo Nacional (EPEN) 2024. En donde se analizaron 12,327 casos de personas desocupadas que buscaron activamente empleo. Se aplico una regresión logística binaria clásica, que se complementó con técnicas de datos desbalanceados SMOTE y RUS a fin de mejorar la precisión del modelo. Los resultados muestran que los factores sociodemográficos significativos que más aportan al modelo de predicción de obtención de empleo son el género (36.14%), el interés por trabajar (34.23%), y la intensidad en la búsqueda de empleo (23.50%). Estas variables muestran la gran importancia que tienen los factores ocupacionales psicológicos y motivacionales al momento de buscar un empleo. Finalmente, al evaluar la capacidad predictiva del modelo, se observó una mejora importante al aplicar técnicas de remuestreo. Con SMOTE se obtuvo un AUC de 0.75 y con RUS 0.71, ambos por encima del resultado alcanzado con la regresión logística clásica que fue de 0.70. Estas mejoras reflejan un mejor desempeño del modelo al identificar los casos menos frecuentes.Item Factores psicosociales y estrés en los trabajadores de una empresa de Lima Metropolitana, 2020(Universidad Nacional Mayor de San Marcos, 2021) Gutiérrez Valverde, Alejandro Augusto; Fiestas Flores, Roberto CarlosEstablece un modelo para explicar el estrés en función de los factores de riesgos psicosociales, el modelo se estableció según los modelos teóricos planteados, tales como el desbalance del esfuerzo, recompensas, demandas en el trabajo y control sobre el trabajo, incluidos en los cuestionarios utilizados, así como en los antecedentes de estudios revisados. Se implementó un modelo con ecuaciones estructurales en base a la información de estrés y riesgos psicosociales hecha con 305 trabajadores de una empresa de Lima Metropolitana, se utilizó una adaptación de la Batería de Riesgos Psicosociales de Faulkner, Vargas, Villalobos y Rondón. En función de la bondad de ajuste de los indicadores, se rechazó el modelo inicialmente planteado, pero en el segundo modelo los indicadores mejoraron significativamente (C.F.I.=1,000 T.L.I.= 1,000; RMSEA = 0,078(0.073-0,083)), se afirmó que algunas formas especificadas del estrés son explicadas por los riesgos psicosociales, como son el control sobre el trabajo, relaciones sociales en el trabajo y demandas laborales, la incorporación de estos dominios fue lo esperado en modelo, esto en concordancia con los resultados de los antecedentes, la eliminación del dominio recompensas fue algo inesperado, debido a que en investigaciones antecedentes esta si tuvo asociación con el estrés.Item Factores sociales, demográficos y económicos que inciden en la violencia conyugal hacia la mujer en el Perú. (ENDES 2023)(Universidad Nacional Mayor de San Marcos, 2025) Peralta Palacios, Anderson Moner; Fiestas Flores, Roberto CarlosLa investigación tuvo como objetivo analizar la relación entre factores sociales, demográficos y económicos con la violencia conyugal hacia las mujeres en el contexto peruano, utilizando datos de la Encuesta Demográfica y de Salud Familiar (ENDES) 2023. El estudio adoptó un enfoque descriptivo-correlacional, con un diseño no experimental de tipo transversal, y se centró en mujeres en edad fértil (15 a 49 años), seleccionadas mediante un muestreo probabilístico bietápico, estratificado e independiente a nivel nacional. La violencia conyugal fue evaluada en sus dimensiones psicológica, física y sexual, mientras que las variables independientes se agruparon en tres bloques: factores sociales (tamaño del hogar, consumo de alcohol del esposo, jefatura del hogar), demográficos (nivel educativo, síntomas depresivos, edad) y económicos (situación laboral, nivel de riqueza, brecha de ingresos con la pareja). El análisis bivariado mediante Chi-cuadrado mostró asociaciones significativas entre la violencia y variables como el consumo de alcohol del esposo, la jefatura del hogar, el nivel educativo, la presencia de síntomas depresivos y el índice de riqueza. A través de un modelo de regresión logística binaria se identificaron los factores con mayor incidencia en la probabilidad de ocurrencia de violencia, destacando los síntomas depresivos como el predictor más relevante (Exp(B) = 1.356; p = 0.000), mientras que el nivel educativo de ambos miembros de la pareja, la edad, el índice de riqueza y la paridad de ingresos mostraron un efecto protector. El uso del modelo permitió controlar múltiples variables simultáneamente, fortaleciendo la interpretación de los resultados y proporcionando una visión integral del fenómeno. Los hallazgos evidencian la interacción compleja entre dimensiones sociales, económicas y demográficas, y subrayan la necesidad de diseñar estrategias de intervención articuladas y multisectoriales para prevenir y atender la violencia conyugal.Item Modelado y pronóstico del Índice de Precios al Consumidor de Lima Metropolitana mediante modelos Box-Jenkins, 1991–2025(Universidad Nacional Mayor de San Marcos, 2025) Quispe Chipana, Diego Nicolas; Fiestas Flores, Roberto CarlosLa presente investigación tiene como objetivo principal determinar un modelo ARIMA o SARIMA, mediante la metodología Box-Jenkins, que describa y pronostique con precisión la evolución del Índice de Precios al Consumidor (IPC) mensual de Lima Metropolitana durante el período 1991-2025. Este estudio surge ante la creciente necesidad de realizar proyecciones confiables sobre la inflación en un contexto caracterizado por disrupciones económicas a nivel global y regional, tales como la pandemia, los conflictos geopolíticos y la volatilidad en los mercados internacionales. Para ello, se analizaron las propiedades estadísticas de la serie temporal del IPC, identificando sus componentes de tendencia, estacionalidad y autocorrelación. Posteriormente, se ajustaron diferentes modelos ARIMA y SARIMA, seleccionando el más adecuado en función de criterios de bondad de ajuste como el AIC, el BIC y el análisis de residuos. Finalmente, se evaluó la capacidad predictiva del modelo seleccionado mediante la comparación entre los valores pronosticados y los datos reales más recientes. Los resultados muestran que el modelo SARIMA proporciona un ajuste adecuado a la estructura temporal del IPC y genera predicciones con un margen de error aceptable, demostrando su utilidad para el análisis económico y la planificación de políticas monetarias. Asimismo, la investigación resalta la importancia de aplicar metodologías estadísticas rigurosas, como la de Box-Jenkins, para comprender y anticipar el comportamiento de indicadores económicos clave.Item Modelo predictivo para optimizar la cobranza coactiva en una entidad pública de Lima(Universidad Nacional Mayor de San Marcos, 2025) Cortez Salinas, Carla Jesús; Fiestas Flores, Roberto CarlosEn el contexto actual, marcado por el incremento sostenido de los procedimientos coactivos pendientes de cobro y la limitada disponibilidad de recursos en el área de cobranza coactiva, surge la necesidad de incorporar herramientas analíticas que contribuyan a una gestión más eficiente de la recuperación de deudas. En este marco, se propuso un modelo predictivo orientado a optimizar la gestión de la cobranza coactiva en una entidad pública, mediante el uso de algoritmos de aprendizaje automático. Para ello, se aplicó la técnica de clustering con K-means, segmentando la cartera coactiva del año 2023 a partir de variables clave como los días de mora y el monto de deuda. Posteriormente, se entrenó un modelo Random Forest con el objetivo de estimar la probabilidad de pago de los administrados. Dado el desbalance en la variable objetivo, se empleó la técnica SMOTE, lo cual permitió mejorar la capacidad del modelo para identificar deudores con intención de cumplimiento. Los resultados del análisis evidenciaron diferencias significativas entre los perfiles de los deudores agrupados por cluster, destacando el Cluster 2 por su alto desempeño predictivo (AUC = 0.8390, F1 Score = 0.63). Este enfoque permite priorizar las acciones de cobranza en función del comportamiento estimado del deudor, optimizando así el uso de los recursos institucionales.Item Modelos ARIMA para pronosticar el número de estudiantes matriculados en una universidad pública de Lima 2025(Universidad Nacional Mayor de San Marcos, 2025) Granados Chavez, Estefanny Grecia; Fiestas Flores, Roberto CarlosEl trabajo de suficiencia profesional se centró en la proyección del número de estudiantes matriculados en una universidad pública, considerando la importancia de una adecuada planificación académica, de infraestructura y de recursos en función de la Ley Universitaria y la programación multianual de presupuesto. Para ello, se recopilaron datos semestrales del periodo 2015-2024 provenientes de la unidad encargada de matrícula, aplicando la metodología Box-Jenkins para la construcción de modelos de series temporales. El análisis permitió identificar al modelo ARIMA (0,1,0) como el más adecuado para realizar el pronóstico de la cantidad de estudiantes matriculados hasta el año 2027, cuyos resultados mostraron una alta concordancia con los valores observados, confirmando la utilidad del enfoque estadístico para la gestión y planificación universitaria.Item Modelos de serie de tiempo para estimar el precio de los repuestos en el área de postventa de la empresa automotriz(Universidad Nacional Mayor de San Marcos, 2025) Quevedo Quispe, Edwin Leonidas; Fiestas Flores, Roberto CarlosEste presente trabajo está enfocado a modelar el comportamiento del precio de un repuesto que tienen alta demanda en el área de postventa de la empresa Divemotor. El objetivo es identificar un modelo de pronóstico usando los modelos Arima – Autorregresivo integrado de media móvil. Con la finalidad de tener un precio optimo acorde al consumo histórico de ventas, que ayude mantener el consumo y la vez disminuir el descuento en la venta al público en general, de los resultados se identificó el modelo arima (1,1,0) que explica el comportamiento del precio a nivel mensual con una bondad de ajuste de representación del 50% sobre modelo.Item Proyecciones del ratio de default real en base a ratios de default temprano para originar desembolsos de una entidad financiera debido a la coyuntura covid-19(Universidad Nacional Mayor de San Marcos, 2021) Huamaní Huamán, Gianmarco; Fiestas Flores, Roberto CarlosEl presente trabajo se realizó en una entidad microfinanciera, con la finalidad de proyectar el ratio del default de los desembolsos con un comportamiento a 12 meses en base al ratio de default con comportamiento temprano de 2 meses. La actual coyuntura con respecto al virus COVID-19 ha generado distorsión en los modelos de riesgos que tienen las principales entidades financieras, ya sea para originar u observar el comportamiento de sus clientes, por lo que ocasiona incertidumbre en los niveles de riesgos de estos mismos, la entidad ante este escenario decidió elevar los niveles de aceptación con la finalidad de no arriesgarse, por eso el ·rea de seguimiento de modelos de riesgo en aras de controlar estos niveles ha analizado este comportamiento de forma temprana en unos periodos previos sin afectación a la coyuntura y reflejarlos a periodos actuales para tomar mejores decisiones sobre la aceptación del desembolso en los modelos de originación y no dejar negocio sobre la mesa ante tal situación. El trabajo realizado ha sido útil para que se disminuyan los niveles del riesgo en el modelo de originación de los desembolsos, con una buena sustentación tanto para el riesgo y la probabilidad de default del modelo.Item Regresión logística: hipertensión arterial asociado con los estilos de vida según la Encuesta Nacional Demográfica y de Salud Familiar 2023, Perú(Universidad Nacional Mayor de San Marcos, 2025) Flores Ganggini, Jesus Alfredo; Fiestas Flores, Roberto CarlosEste estudio tuvo como propósito analizar la relación entre la hipertensión arterial y determinados estilos de vida en personas mayores de 15 años en el Perú, a partir de los datos proporcionados por la Encuesta Demográfica y de Salud Familiar (ENDES) 2023, mediante un modelo de regresión logística. Se examinaron como variables independientes el consumo limitado de frutas y verduras, así como el consumo de tabaco y alcohol, por su potencial asociación con la hipertensión. La muestra utilizada abarcó participantes de diversas regiones del país, representando de manera adecuada a la población nacional. Los hallazgos revelaron una relación estadísticamente significativa entre la presencia de hipertensión arterial y los estilos de vida mencionados. Específicamente, el bajo consumo de frutas y verduras presentó una odds ratio (OR) ajustada de 1.57 (IC 95 %: 1.3631.82), el consumo de tabaco una OR de 1.45 (IC 95 %: 1.2231.72) y el consumo de alcohol una OR de 1.39 (IC 95 %: 1.2031.60), todos con un valor p < 0.001. Estos resultados indican que una dieta deficiente, el tabaquismo y el alcoholismo aumentan considerablemente el riesgo de padecer hipertensión. En vista de ello, se enfatiza la necesidad de fomentar prácticas de vida saludables como parte de las estrategias preventivas. Asimismo, se sugiere desarrollar e implementar políticas de salud pública orientadas a la reducción de factores de riesgo modificables en la población peruana.Item Segmentación de clientes en un restaurante, provenientes del canal digital, utilizando el algoritmo k-means(Universidad Nacional Mayor de San Marcos, 2025) Cañari Palante, Josemanuel Rossy; Fiestas Flores, Roberto CarlosEl conocer a los clientes que te consumen representa una oportunidad de mejorar la experiencia de compra y aumentar los ingresos en los negocios. Las ventas, a través de plataformas digitales, han aumentado exponencialmente y conocer a estos clientes es un reto por su comportamiento diferente en comparación al cliente tradicional de a pie. El presente estudio tuvo como objetivo segmentar a los clientes, provenientes del canal digital, de un restaurante, utilizando el algoritmo k-means y el modelo RFM. Además, se aplicaron árboles de decisión para la interpretación de las características en cada segmento hallado. Se obtuvo como resultado cuatro segmentos de clientes: Valiosos, clientes que compran con frecuencia y generan altos ingresos; Oportunidad, clientes con un buen historial de compras, pero inactivos en el tiempo reciente; Regulares, clientes con alta frecuencia pero bajo valor monetario y Fuga, clientes que realizaron compras esporádicas y no han vuelto a consumir. Con esta información, el equipo de marketing puede identificar al público objetivo para aplicar estrategias de fidelización, reactivación y captación de nuevos potenciales clientes.