EP Estadística
Permanent URI for this communityhttps://hdl.handle.net/20.500.12672/5100
Browse
Browsing EP Estadística by Title
Now showing 1 - 20 of 185
- Results Per Page
- Sort Options
Item Análisis comparativo de los modelos de elección discreta, regresión logística y Probit(Universidad Nacional Mayor de San Marcos, 2016) Manrique Pachas, Christian FernandoPresenta la teoría y aplicación de los modelos de regresión logística y los modelos Probit a fin de conocer los factores de riesgo que influyen en la enfermedad angina de pecho. La razón principal de este estudio es identificar los factores más significativos de riesgo y prevención para dicha enfermedad dentro de la población en estudio. El trabajo presenta el desarrollo de ambos métodos y ha finalizado con la aplicación en la cual se compararon las dos metodologías, demostrando que los mejores resultados son obtenidos con el modelo Probit. La aplicación fue desarrollada con los programas SPSS versión 22 y el Minitab 17.Item Análisis comparativo de modelos de pronóstico ARIMA y XGBoost aplicados a las series mensuales de ventas en una empresa certificadora(Universidad Nacional Mayor de San Marcos, 2021) Villafuerte Chacnama, Frank Fernando; Norabuena Figueroa, Roger PedroPara una conocida empresa en certificaciones a nivel nacional e internacional, es importante hacer un seguimiento de las ventas de las diferentes unidades de negocio, además, de contar con estimaciones para poder tomar decisiones en cuanto a la ejecución presupuestal, asimismo, permite tener una forma de medir el performance que va teniendo la empresa en ventas. En este trabajo se realiza una comparación del poder predictivo de modelos de series de tiempo aplicados en las ventas históricas de la empresa, utilizando como base teórica el enfoque de dominio de tiempo (Box y Jenkins) con el modelo ARIMA y el uso del algoritmo XBGoost, utilizando los indicadores de evaluación para seleccionar aquel modelo que permita obtener mejores pronósticos para tener una mejor previsualización de ventas en los próximos meses, y en base a esto, tomar las mejores decisiones en cuanto la asignación presupuestal, conocimiento de performance en ventas, etc.Item Análisis comparativo de series de tiempo para proyectar las ventas en las jerarquías de calzado en una empresa del sector retail(Universidad Nacional Mayor de San Marcos, 2021) Ancco Yaurimucha, Tatiana Diana; Roque Paredes, OfeliaLa empresa es un retail que se ha convertido en un onnicanal de moda que ofrece diferentes productos no solo de marca propia, sino que también se encuentra asociada con la venta de otras marcas, con la creciente ventas que ha tenido la empresa debido a las tiendas que se han aperturado y la venta online surge la necesidad de tener un mayor control del stock mediante una compra de productos más aproximada a la venta de acuerdo con la temporada. Para resolver esta problemática se ajustaron dos modelos de series de tiempo a las ventas histórica, obteniendo como resultado el modelo que se ajusta mejor a los datos es la red neuronal autorregresiva NNAR, ya que presenta menores errores en la data de prueba comparado con el modelo exponencial ETS (MSE: 91816215; RMSE: 9582.08; MAE: 9570.71; WAPE: 0.2095761; SMAPE: 0.0780359). Finalmente, a estas proyecciones se les distribuye a las diferentes jerarquías de venta de acuerdo con las participaciones de venta del año anterior.Item Análisis de árboles de clasificación para la creación de un modelo que permita describir el perfil de los morosos y no morosos en una entidad financiera de Lima Metropolitana en el 2014(Universidad Nacional Mayor de San Marcos, 2016) Tafur Tembladera, Edelina Anyela; Kraenau Espinal, ErwinLas entidades financieras están desarrollando constantemente modelos que les ayuden a predecir el comportamiento de sus clientes, con el fin de mejorar sus ganancias o de reducir las pérdidas, como el riesgo de “no pago” o de “morosidad”. El objetivo es crear un modelo predictivo de Árboles de Decisión por Clasificación con minería de datos para predecir la morosidad financiera en Lima Metropolitana, describiendo y analizando las variables independientes con el algoritmo CHAID (Detector automático de Chi-cuadrado de interacción) siguiendo la metodología CRISP-DM en una base de datos de una entidad financiera. La principal ventaja de esta metodología es que no está sujeta a supuestos estadísticos, este método es muy usado cuando se busca predecir o clasificar comportamientos de riesgo, como la morosidad, y se cuenta con más variables cualitativas que cuantitativas. La metodología persigue la separación óptima en la muestra, de tal modo que los grupos de la variable respuesta ofrecen distintos perfiles de riesgo.Item Análisis de audiencia de avisos publicitarios del sector telecomunicaciones mediante árboles de regresión(Universidad Nacional Mayor de San Marcos, 2022) Farfán Farfán, Mirella Medalith; Roque Paredes, OfeliaDesea captar la mayor cantidad de audiencia mediante la identificación de las variables más importantes y la mejor colocación de avisos. En la parte de revalidación de los datos se consiguió que el error de raíz cuadrada media es de 1.04 y 0.79 para el R cuadrado de la data de testeo. Encontramos que las variables que se ajustan más al modelo son emisora, tarifa, disposición del programa (bloque horario), naturaleza del programa (género del programa), posición de aviso y duración.Item Análisis de correspondencia para determinar los perfiles de las empresas cartoneras en el año 2023(Universidad Nacional Mayor de San Marcos, 2023) Llecllish Zárate, Christian; Roque Paredes, OfeliaDetermina los perfiles de las empresas cartoneras, y señalar los componentes que trascienden en la adquisición de empaques de cartón. Para una organización industrial siendo uno de los primeros en el sector de las cajas es de mucho valor tener ideas innovadoras para el mercado y facilitar las opciones de mejora con respecto a los clientes, especialmente si nos enfocamos en la coyuntura actual donde las cuando nos encontramos en épocas donde las perspectivas de la clientela varían continuamente, es por eso lo valioso de conocer cómo se comporta la base de los clientes. Por ende, se muestra el desarrollo y la ejecución del Análisis de Correspondencia para determinar los perfiles de las empresas en el rubro del cartón en el año 2023, el cual facilitó detallar, examinar, aclarar y determinar el nivel de agrupación entre las distintas cualidades o componentes que asocian los principales consumidores para la adquisición de un empaque de cartón de cada fabricante de caja, a través de diagramas que muestren la percepción de los clientes.Item Análisis de correspondencia simple en los pilares de comunicación de las marcas de venta y el Brand sentiment del usuario en redes sociales (2021-2024 YTD)(Universidad Nacional Mayor de San Marcos, 2024) Geldres Torres, Yhurema del Carmen; Huamán Gutiérrez, Zoraida JudithEl alto protagonismo de las plataformas digitales ha transformado la manera en que las marcas interactúan con sus consumidores, consolidándose como un canal de alto impacto para la comunicación y el marketing. En particular, las redes sociales ofrecen una ventana de exposición directa a las opiniones y sentimientos de los usuarios, esto permite a las compañías monitorear las percepciones en tiempo real y poder tomar decisiones estratégicas que mejoren la experiencia del consumidor. Este monitoreo es crucial, la información sobre la reputación de la marca permite identificar problemas y oportunidades de mejoras continúas fortaleciendo la relación con el consumidor. En un entorno digital dinámico, el monitoreo efectivo de las redes sociales permite mantener niveles de competitividad y relevancia y más aún en el sector de belleza altamente revolucionario. De lo mencionado líneas más arriba, se propone el análisis de correspondencia simple, con el objetivo de evaluar el Brand sentiment de los usuarios de redes sociales y su relación con las marcas de venta directa durante el 2021-2024 YTD. Teniendo como resultados, Ésika ha logrado establecer una percepción positiva sólida en relación con sus pilares de comunicación, especialmente en el ámbito del empoderamiento femenino. Este posicionamiento favorable no solo refuerza la imagen de solo Ésika, sino de todo un anunciante que acarrea a otras marcas como L’bel y Cyzone, promoviendo una ventaja competitiva significativa en el mercado de la belleza. Los usuarios tienen una percepción neutral de Yanbal en los pilares de emprendimiento y calidad, mientras que en el empoderamiento tienen una fuerte asociación. Por último, Natura es la marca con mayores desafíos en los pilares de comunicación que se exponen en el presente trabajo.Item Análisis de la percepción y expectativas del sector industrial manufacturero, empleando análisis de correspondencia múltiple(Universidad Nacional Mayor de San Marcos, 2008) León Lluque, Helem Harim; Nolberto Sifuentes, Violeta AliciaManifiesta que las encuestas de opinión son investigaciones que han alcanzado una sólida posición e importancia en países desarrollados, ya que se les reconoce una gran capacidad predictiva, constituyéndose como un recurso indispensable para orientar las decisiones de las personas involucradas en la economía u otras actividades, sean del sector público o privado. Por ello, con la finalidad de estudiar en forma conjunta los datos, se utilizan diversas técnicas multivariantes según el tipo de escala de medición. La ilustración que se presenta es el Análisis de la Percepción y Expectativas del Sector Industrial Manufacturero, para el cual se utilizó el Análisis de Correspondencia Múltiple, a fin de conocer las expectativas del sector empresarial de la industria manufacturera con relación a la evolución de la actividad económica del país y de su propio sector.Item Análisis de la regresión cuantílica para la distribución del ingreso total mensual de la población económicamente activa ocupada de Lima Metropolitana(Universidad Nacional Mayor de San Marcos, 2016) Huiman Morales, Richard HenryAplica el método de la regresión cuantílica como un método alternativo de estimación de los parámetros en los modelos de regresión lineal para analizar la distribución del ingreso total mensual de la población ocupada de Lima Metropolitana. Estima los parámetros de un modelo de regresión clásica mediante el método de Mínimo Cuadrados Ordinarios (MCO), sin embargo este provee poca información acerca del comportamiento de los extremos (colas) de la distribución del ingreso total mensual. En este caso, no es adecuado utilizar el modelo de regresión lineal estimado por mínimos cuadrados ordinarios, ya que proporciona estimaciones sesgadas. Concluye que existe una influencia positiva del nivel educativo y el sexo masculino en el ingreso total mensual de la población ocupada de Lima Metropolitana.Item Análisis de regresión logística aplicada a la educación(Universidad Nacional Mayor de San Marcos, 2007) Manco Pomacaja, Juan Manuel; Adriazola Cruz, Rosa YsabelProporciona una explicación general y a la vez detallada del análisis de regresión logística, y así como también la construcción de un modelo a través de etapas en la cual se van seleccionando variables y al mismo tiempo eliminando otras. El siguiente trabajo está dirigido al área de educación, en el cual se presenta una aplicación con respecto a los ingresantes de la Facultad de Ciencias Administrativas correspondiente al proceso de admisión 2006-I de la Universidad Nacional Mayor de San Marcos. El objetivo del trabajo monográfico es conocer qué características presentan los ingresantes según el colegio de procedencia estatal o particular. La información de los ingresantes se ha obtenido a través de la Oficina Central de Admisión que nos brindó la base de datos con variedad de variables relevantes, asimismo hacemos presente la absoluta reserva de información del ingresante.Item Análisis de regresión logística para identificar factores asociados a la preferencia de fecundidad de mujeres en edad fértil (ENDES 2023), Perú(Universidad Nacional Mayor de San Marcos, 2024) Del Castillo Gutierrez, Fanny Alexandra; Huamán Gutiérrez, Zoraida JudithEl descenso de la fecundidad es un tema que preocupa, la TGF sigue disminuyendo, si esta cae por debajo de 2.1, traería consigo el aumento de personas mayores y la disminución de los jóvenes, lo que tendría un impacto negativo en la sociedad y en la economía. En el Perú, se han observado cambios en características importantes de las mujeres en edad fértil entre 15 a 49 años; un aumento en el nivel educativo y el cambio en los estados conyugales. El presente trabajo de suficiencia profesional fue de tipo descriptivo y correlacional con un diseño transversal usando como fuente secundaria Encuesta Demográfica y de Salud Familiar 2023, con un total de 31200 mujeres en edad fértil, buscando identificar los factores asociados a la preferencia por tener un/más hijos de las mujeres en edad fértil de 15 a 49 años en el Perú. Para el procesamiento se utilizó el programa estadístico SPSS versión 26. Entre los resultados se obtuvo que el 45.06% de las mujeres en edad fértil prefieren tener un/más hijos; mujeres menores de 35 años, con nivel educativo superior, solteras, no usaban algún método anticonceptivo y que se encontraban trabajando en su mayoría si preferían tener un/más hijos. Mediante un modelo de regresión logística, se identificó que las mujeres en edad fértil residentes del área urbana, sin nivel de educación, con nivel secundario, residentes en Lima Metropolitana y en la región sierra, tienen mayor probabilidad de preferir tener un/más hijos. El uso de algún método anticonceptivo y actualmente trabajando son variables que no contribuyeron en la construcción de este modelo, que obtuvo una precisión global de 76.93%, una sensibilidad de 75.89% y una especificidad de 77.77%.Item Análisis de Series de Tiempo y Machine Learning para proyectar una eficiente gestión de subsidios ante EsSalud(Universidad Nacional Mayor de San Marcos, 2023) Valverde Shuan, Keyla Fiorela; Norabuena Figueroa, Emerson DamianDetermina los factores o variables que generan una buena gestión de subsidios antes Essalud, gestionado por la empresa HumaSer. Para ejecutar dicho objetivo se cuenta con el apoyo de un sistema que nos brinda una supervisión interna y diligencias de gestión, con la finalidad de salvaguardar los recursos contra pérdidas por ineficacias operativas mediante Essalud; se comienza a reconocer los primordiales riesgos en el largo proceso y luego mejoramos la gestión; ejecutando acciones que nos ayude a disminuir y prevenir la posibilidad de los montos no recuperados en cada una de las cuentas adquiridas por los clientes, previniendo retrasos, pérdidas, y obedeciendo las normas interpuestas. La investigación está elaborada con los registros obtenidos por cada uno de los clientes, dicha información fue analizada a fin de conocer el estado en el cual se encuentran los tramites de subsidios por incapacidad y bajo esa perspectiva desarrollar un plan de trabajo. Ante ello se realiza el uso de la técnica de Regresión lineal múltiple (Machine Learning – supervisado) y el modelo de series de tiempo, propuestos por Box – Jenkins con el propósito de encontrar variables que nos indique o nos brinde una administración eficiente en la gestión de subsidios y por otro lado, visualizar el comportamiento de la data a través del tiempo con la finalidad de realizar pronósticos adecuados. Esta técnica ayudará a alcanzar el objetivo, debido a que son utilizadas para identificar outliers, correlaciones y explicar la influencia que genera las variables predictoras en nuestra variable dependiente en una gran cantidad de datos y que permita predecir los resultados para llegar a mejorar la efectividad en la toma de decisionesItem Análisis de supervivencia para proyectar la deuda en default de la cartera de tarjetas de una entidad financiera(Universidad Nacional Mayor de San Marcos, 2021) Canlla Linares, Jashir Alejandro; Fiesta Flores, Roberto carlosLa probabilidad de incumplimiento de los clientes morosos en el sistema financiero es estimada por distintos métodos estadísticos clásicos, dependiendo de la entidad financiera y el tipo de cliente analizado. En este trabajo se desarrolla el análisis de supervivencia para estimar la probabilidad de default de la cartera de tarjetas de una entidad financiera peruana. Además, se realiza un backtest de las probabilidades de default estimadas, para evaluar el modelo con el comportamiento real de la cartera de tarjetas en el año 2020. Se encontró que al mes 6 de maduración de los desembolsos de la cartera de tarjetas se evidencia la máxima expresión de la probabilidad de incumplimiento para luego en meses posteriores descender lentamente. Finalmente se utilizan las probabilidades estimadas por la función de riesgos para proyectar la deuda en default de los desembolsos de la cartera de tarjetas para el presupuesto del año 2021, utilizando un análisis de cosechas y obteniendo el monto total de default proyectado en una ventana de tiempo de 12 meses.Item Análisis de supervivencia: determinantes de la probabilidad de pago de una cartera castigada, en una entidad bancaria del Perú(Universidad Nacional Mayor de San Marcos, 2022) Balbuena Campos, Jhan Piere's Martin; Molina Quiñones, Helfer JoelBusca determinar los factores que influyan en la probabilidad de pago de la deuda de este tipo de clientes. Utilizando las técnicas del análisis de supervivencia, como el modelo de regresión de Cox, definiendo como evento de interés al pago de la deuda en el transcurso de un mes; se obtuvo que, el endeudamiento, el rango etario, la situación laboral y la región de residencia; así también, la morosidad de la deuda del cliente y el número de días que se le llamó al deudor, aportaron significativamente al modelo. La función de supervivencia del modelo estima una probabilidad de sobrevivir al evento de interés del 92.7%.Item Análisis del efecto del modelo panel EPEN 2021-2023 sobre los factores asociados al ingreso total de la población en Lima Metropolitana(Universidad Nacional Mayor de San Marcos, 2023) Peña Vasquez, Matita Nataly Paulette; Roque Paredes, OfeliaLa Encuesta Permanente de Empleo Nacional tiene como principal finalidad brindar información sobre el seguimiento del mercado laboral, esta encuesta es de tipo longitudinal por lo que tiene un diseño de tipo panel. Las muestras panel hacen el seguimiento a los individuos o sujetos de análisis en 4 periodos respectivos. En estas visitas repetitivas se evidencia la falta de respuesta de los informantes. Debido a esta falta de respuesta en las muestras panel, existen variaciones en las variables obtenidas anteriormente. En específico, los ingresos totales de la población se ven afectados; por tal motivo se está analizando los efectos de estas muestras panel en la Encuesta Permanente de Empleo Nacional sobre los factores asociados al ingreso total en la población de Lima Metropolitana, mediante modelos lineales mixtos con efectos fijos. Para el presente trabajo se analizaron diferentes modelos hasta llegar al más adecuado, en el cual se tuvo que utilizar una corrección al modelo de efectos fijos, donde resultaron tres variables significativas para el modelo. Los resultados indican la relación con el ingreso total, las variables significativas fueron nivel educativo y grupo de edad con relación positiva, y sexo con relación negativa.Item Análisis estadístico multivariante de las variables que explican el Clima Organizacional de la Facultad de Ciencias Matemáticas de la Universidad Nacional Mayor de San Marcos(Universidad Nacional Mayor de San Marcos, 2019) Millones Ramos, Carmen Rosemary; Adriazola Cruz, Rosa YsabelPropone realizar un análisis estadístico empleando técnicas multivariantes, de las variables que explican el clima organizacional de la Facultad de Ciencias Matemáticas de la Universidad Nacional Mayor de San Marcos, desde la percepción de sus profesores. Para la realización de la investigación se consideró la muestra probabilística de profesores obtenida en la investigación Análisis estadístico de los factores del clima institucional y el desempeño docente en la Facultad de Ciencias Matemáticas (2016) en la que se aplicó una encuesta para la medición del clima organizacional. Luego del análisis multivariante de los datos se espera identificar los factores que tienen una contribución positiva, así como aquellos que perjudican al desarrollo del clima organizacional de la comunidad académica matemática. El clima organizacional se refiere al ambiente de trabajo propio de la organización, y dicho ambiente influye directamente en la conducta y el comportamiento de quienes en él participan y la hacen posible. El término clima se deriva de la meteorología que, al referirse a las organizaciones traslada analógicamente una serie de rasgos atmosféricos que mantienen unas regularidades determinadas y que denominamos clima de un lugar o región, al clima organizacional, traduciéndolos como un conjunto particular de prácticas y procedimientos organizacionales (Schneider, 1975). El estudio del clima organizacional es de importancia en toda institución educativa de nivel superior debido a la influencia que tiene en la calidad del servicio que brinda.Item Análisis exploratorio de datos espaciales, una aplicación a la distribución de la diabetes en mujeres del Perú - 2019(Universidad Nacional Mayor de San Marcos, 2023) Ramirez Ucañay, Barbarita Paula Janeth; Solano Dávila, Olga LidiaAnaliza la prevalencia y distribución espacial de la diabetes mellitus en mujeres del Perú en el año 2019, para realizar una regionalización de esta enfermedad mediante el uso del análisis exploratorio de datos espaciales, para así poder determinar poblaciones vulnerables y regiones de atención prioritarias. E estudio radica en la aplicación de la técnica del “Análisis Exploratorio de Datos Espaciales”(AEDE) a la problemática de salud publica de la diabetes mellitus en mujeres del Perú con un enfoque actualizado y detallado, tomando en cuenta principalmente el eje espacial para el análisis de los datos. Asimismo, su aplicación en distintas plataformas de los SIG de software libre y código abierto para distintas plataformas (GNU/Linux, Unix, Mac OS, Microsoft Windows y Android) como QGIS, ArcMap, RStudio y GeoDa, que pueden ser de guía para la aplicación de la técnica del AEDE en distintos campos de la investigación.Item Análisis exploratorio espacial de la hipertensión arterial en adultos mayores, Perú 2019(Universidad Nacional Mayor de San Marcos, 2023) Borja Zavaleta, Eduardo Eloin; Solano Dávila, Olga LidiaRealiza el análisis espacial exploratorio de la distribución de la prevalencia de hipertensión arterial en adultos mayores en los departamentos del Perú en el 2019. Según el enfoque el tipo de investigación es cuantitativo, según el alcance es de tipo descriptivo, dado que se analizará la distribución espacial de la prevalencia de la hipertensión arterial en los departamentos del Perú en el 2019. El estudio es de fuente secundaria, los datos se obtuvieron de la ENDES 2019 realizado por el INEI. La ENDES es una encuesta nacional que tiene representación a nivel departamental y es una fuente de información sobre la salud de la población peruana. Las ENDES se vienen ejecutando, primero quinquenalmente desde 1986 (ENDES 1) hasta el 2000 (ENDES IV); y luego anualmente (ENDES continua), desde 2004 hasta la actualidad. Previo al análisis espacial de la hipertensión arterial en adultos mayores en el Perú, 2019, se analizó la muestra obtenida para obtener un conocimiento más profundo, esto incluye a entrevistados cuyas edades sean mayor o igual a 60, obteniendo un total de 5247 casos, pero en 11 entrevistas no se realizó las mediciones de la presión arterial, con lo cual la muestra se redujo a 5236 entrevistados. Utilizando el análisis exploratorio se llegó a identificar que Callao, Arequipa y Tumbes son los departamentos con mayor prevalencia de hipertensión arterial en adultos mayores, mientras que, Junín, Pasco y Puno son los departamentos con menor prevalencia de la enfermedad en adultos mayores.Item Análisis exploratorio espacial de la violencia conyugal hacia la mujer durante la pandemia en el Perú, 2021(Universidad Nacional Mayor de San Marcos, 2024) Flores Heredia, Rosita Exilda; Solano Dávila, Olga LidiaEn esta investigación se empleó el análisis exploratorio de datos espaciales con el propósito de identificar y determinar patrones espaciales con respecto a la violencia conyugal ejercida contra la mujer durante la pandemia en el Perú año 2021.Se identificó tres tipos de violencia. Se utilizó la información recolectada por La Encuesta Demográfica y de Salud Familiar (ENDES,2021) para el análisis. Los resultados mostraron una concentración de violencia conyugal en los departamentos del sur del Perú. Además, se logró identificar con el Índice de Morán y el Mapa de Lisa, que estos departamentos se correlacionan espacialmente y se identificó que los departamentos vecinos poseen alta incidencia de alguno de los tipos de violencia conyugal.Item Análisis factorial confirmatorio del instrumento del estrés académico de los estudiantes universitarios en la educación virtual(Universidad Nacional Mayor de San Marcos, 2025) Lopa Zea, Ruben; Rodríguez Orellana, Hugo MarinoDetermina las propiedades del Análisis Factorial Confirmatorio aplicado al instrumento del estrés académico de los estudiantes universitarios en la educación virtual, para la realización de la valoración de este cuestionario se utilizó la técnica mencionada Análisis Factorial Confirmatorio, mediante la determinación de las cargas factoriales y las medidas de bondad de ajustes se validará la estructura factorial del instrumento, asegurando su aplicabilidad y precisión. En el análisis desarrollado se identificó cuatro factores: Sobrecarga y limitaciones de tiempo, Interacción y participación, Recursos Tecnológicos y Distracciones en el Ambiente de Estudio. Donde el modelo de medida estimado presenta un ajuste general aceptable, cuyas medidas alcanzan umbrales ideales tales como GFI, RMR, IFI, RMSEA, PCFI, AGFI, PRATIO, CFI, PNFI, la cual nos indican una buena representación de los datos observados, lo cual en base a los resultados obtenidos podemos asegurar su aplicabilidad y la precisión que tiene este instrumento.