Trabajos de investigación EP Estadística
Permanent URI for this collectionhttps://hdl.handle.net/20.500.12672/5159
Browse
Browsing Trabajos de investigación EP Estadística by Title
Now showing 1 - 20 of 108
- Results Per Page
- Sort Options
Item Análisis comparativo de los modelos de elección discreta, regresión logística y Probit(Universidad Nacional Mayor de San Marcos, 2016) Manrique Pachas, Christian FernandoPresenta la teoría y aplicación de los modelos de regresión logística y los modelos Probit a fin de conocer los factores de riesgo que influyen en la enfermedad angina de pecho. La razón principal de este estudio es identificar los factores más significativos de riesgo y prevención para dicha enfermedad dentro de la población en estudio. El trabajo presenta el desarrollo de ambos métodos y ha finalizado con la aplicación en la cual se compararon las dos metodologías, demostrando que los mejores resultados son obtenidos con el modelo Probit. La aplicación fue desarrollada con los programas SPSS versión 22 y el Minitab 17.Item Análisis comparativo de series de tiempo para proyectar las ventas en las jerarquías de calzado en una empresa del sector retail(Universidad Nacional Mayor de San Marcos, 2021) Ancco Yaurimucha, Tatiana Diana; Roque Paredes, OfeliaLa empresa es un retail que se ha convertido en un onnicanal de moda que ofrece diferentes productos no solo de marca propia, sino que también se encuentra asociada con la venta de otras marcas, con la creciente ventas que ha tenido la empresa debido a las tiendas que se han aperturado y la venta online surge la necesidad de tener un mayor control del stock mediante una compra de productos más aproximada a la venta de acuerdo con la temporada. Para resolver esta problemática se ajustaron dos modelos de series de tiempo a las ventas histórica, obteniendo como resultado el modelo que se ajusta mejor a los datos es la red neuronal autorregresiva NNAR, ya que presenta menores errores en la data de prueba comparado con el modelo exponencial ETS (MSE: 91816215; RMSE: 9582.08; MAE: 9570.71; WAPE: 0.2095761; SMAPE: 0.0780359). Finalmente, a estas proyecciones se les distribuye a las diferentes jerarquías de venta de acuerdo con las participaciones de venta del año anterior.Item Análisis de árboles de clasificación para la creación de un modelo que permita describir el perfil de los morosos y no morosos en una entidad financiera de Lima Metropolitana en el 2014(Universidad Nacional Mayor de San Marcos, 2016) Tafur Tembladera, Edelina Anyela; Kraenau Espinal, ErwinLas entidades financieras están desarrollando constantemente modelos que les ayuden a predecir el comportamiento de sus clientes, con el fin de mejorar sus ganancias o de reducir las pérdidas, como el riesgo de “no pago” o de “morosidad”. El objetivo es crear un modelo predictivo de Árboles de Decisión por Clasificación con minería de datos para predecir la morosidad financiera en Lima Metropolitana, describiendo y analizando las variables independientes con el algoritmo CHAID (Detector automático de Chi-cuadrado de interacción) siguiendo la metodología CRISP-DM en una base de datos de una entidad financiera. La principal ventaja de esta metodología es que no está sujeta a supuestos estadísticos, este método es muy usado cuando se busca predecir o clasificar comportamientos de riesgo, como la morosidad, y se cuenta con más variables cualitativas que cuantitativas. La metodología persigue la separación óptima en la muestra, de tal modo que los grupos de la variable respuesta ofrecen distintos perfiles de riesgo.Item Análisis de audiencia de avisos publicitarios del sector telecomunicaciones mediante árboles de regresión(Universidad Nacional Mayor de San Marcos, 2022) Farfán Farfán, Mirella Medalith; Roque Paredes, OfeliaDesea captar la mayor cantidad de audiencia mediante la identificación de las variables más importantes y la mejor colocación de avisos. En la parte de revalidación de los datos se consiguió que el error de raíz cuadrada media es de 1.04 y 0.79 para el R cuadrado de la data de testeo. Encontramos que las variables que se ajustan más al modelo son emisora, tarifa, disposición del programa (bloque horario), naturaleza del programa (género del programa), posición de aviso y duración.Item Análisis de correspondencia para determinar los perfiles de las empresas cartoneras en el año 2023(Universidad Nacional Mayor de San Marcos, 2023) Llecllish Zárate, Christian; Roque Paredes, OfeliaDetermina los perfiles de las empresas cartoneras, y señalar los componentes que trascienden en la adquisición de empaques de cartón. Para una organización industrial siendo uno de los primeros en el sector de las cajas es de mucho valor tener ideas innovadoras para el mercado y facilitar las opciones de mejora con respecto a los clientes, especialmente si nos enfocamos en la coyuntura actual donde las cuando nos encontramos en épocas donde las perspectivas de la clientela varían continuamente, es por eso lo valioso de conocer cómo se comporta la base de los clientes. Por ende, se muestra el desarrollo y la ejecución del Análisis de Correspondencia para determinar los perfiles de las empresas en el rubro del cartón en el año 2023, el cual facilitó detallar, examinar, aclarar y determinar el nivel de agrupación entre las distintas cualidades o componentes que asocian los principales consumidores para la adquisición de un empaque de cartón de cada fabricante de caja, a través de diagramas que muestren la percepción de los clientes.Item Análisis de correspondencia simple en los pilares de comunicación de las marcas de venta y el Brand sentiment del usuario en redes sociales (2021-2024 YTD)(Universidad Nacional Mayor de San Marcos, 2024) Geldres Torres, Yhurema del Carmen; Huamán Gutiérrez, Zoraida JudithEl alto protagonismo de las plataformas digitales ha transformado la manera en que las marcas interactúan con sus consumidores, consolidándose como un canal de alto impacto para la comunicación y el marketing. En particular, las redes sociales ofrecen una ventana de exposición directa a las opiniones y sentimientos de los usuarios, esto permite a las compañías monitorear las percepciones en tiempo real y poder tomar decisiones estratégicas que mejoren la experiencia del consumidor. Este monitoreo es crucial, la información sobre la reputación de la marca permite identificar problemas y oportunidades de mejoras continúas fortaleciendo la relación con el consumidor. En un entorno digital dinámico, el monitoreo efectivo de las redes sociales permite mantener niveles de competitividad y relevancia y más aún en el sector de belleza altamente revolucionario. De lo mencionado líneas más arriba, se propone el análisis de correspondencia simple, con el objetivo de evaluar el Brand sentiment de los usuarios de redes sociales y su relación con las marcas de venta directa durante el 2021-2024 YTD. Teniendo como resultados, Ésika ha logrado establecer una percepción positiva sólida en relación con sus pilares de comunicación, especialmente en el ámbito del empoderamiento femenino. Este posicionamiento favorable no solo refuerza la imagen de solo Ésika, sino de todo un anunciante que acarrea a otras marcas como L’bel y Cyzone, promoviendo una ventaja competitiva significativa en el mercado de la belleza. Los usuarios tienen una percepción neutral de Yanbal en los pilares de emprendimiento y calidad, mientras que en el empoderamiento tienen una fuerte asociación. Por último, Natura es la marca con mayores desafíos en los pilares de comunicación que se exponen en el presente trabajo.Item Análisis de la percepción y expectativas del sector industrial manufacturero, empleando análisis de correspondencia múltiple(Universidad Nacional Mayor de San Marcos, 2008) León Lluque, Helem Harim; Nolberto Sifuentes, Violeta AliciaManifiesta que las encuestas de opinión son investigaciones que han alcanzado una sólida posición e importancia en países desarrollados, ya que se les reconoce una gran capacidad predictiva, constituyéndose como un recurso indispensable para orientar las decisiones de las personas involucradas en la economía u otras actividades, sean del sector público o privado. Por ello, con la finalidad de estudiar en forma conjunta los datos, se utilizan diversas técnicas multivariantes según el tipo de escala de medición. La ilustración que se presenta es el Análisis de la Percepción y Expectativas del Sector Industrial Manufacturero, para el cual se utilizó el Análisis de Correspondencia Múltiple, a fin de conocer las expectativas del sector empresarial de la industria manufacturera con relación a la evolución de la actividad económica del país y de su propio sector.Item Análisis de la regresión cuantílica para la distribución del ingreso total mensual de la población económicamente activa ocupada de Lima Metropolitana(Universidad Nacional Mayor de San Marcos, 2016) Huiman Morales, Richard HenryAplica el método de la regresión cuantílica como un método alternativo de estimación de los parámetros en los modelos de regresión lineal para analizar la distribución del ingreso total mensual de la población ocupada de Lima Metropolitana. Estima los parámetros de un modelo de regresión clásica mediante el método de Mínimo Cuadrados Ordinarios (MCO), sin embargo este provee poca información acerca del comportamiento de los extremos (colas) de la distribución del ingreso total mensual. En este caso, no es adecuado utilizar el modelo de regresión lineal estimado por mínimos cuadrados ordinarios, ya que proporciona estimaciones sesgadas. Concluye que existe una influencia positiva del nivel educativo y el sexo masculino en el ingreso total mensual de la población ocupada de Lima Metropolitana.Item Análisis de regresión logística aplicada a la educación(Universidad Nacional Mayor de San Marcos, 2007) Manco Pomacaja, Juan Manuel; Adriazola Cruz, Rosa YsabelProporciona una explicación general y a la vez detallada del análisis de regresión logística, y así como también la construcción de un modelo a través de etapas en la cual se van seleccionando variables y al mismo tiempo eliminando otras. El siguiente trabajo está dirigido al área de educación, en el cual se presenta una aplicación con respecto a los ingresantes de la Facultad de Ciencias Administrativas correspondiente al proceso de admisión 2006-I de la Universidad Nacional Mayor de San Marcos. El objetivo del trabajo monográfico es conocer qué características presentan los ingresantes según el colegio de procedencia estatal o particular. La información de los ingresantes se ha obtenido a través de la Oficina Central de Admisión que nos brindó la base de datos con variedad de variables relevantes, asimismo hacemos presente la absoluta reserva de información del ingresante.Item Análisis de regresión logística para identificar factores asociados a la preferencia de fecundidad de mujeres en edad fértil (ENDES 2023), Perú(Universidad Nacional Mayor de San Marcos, 2024) Del Castillo Gutierrez, Fanny Alexandra; Huamán Gutiérrez, Zoraida JudithEl descenso de la fecundidad es un tema que preocupa, la TGF sigue disminuyendo, si esta cae por debajo de 2.1, traería consigo el aumento de personas mayores y la disminución de los jóvenes, lo que tendría un impacto negativo en la sociedad y en la economía. En el Perú, se han observado cambios en características importantes de las mujeres en edad fértil entre 15 a 49 años; un aumento en el nivel educativo y el cambio en los estados conyugales. El presente trabajo de suficiencia profesional fue de tipo descriptivo y correlacional con un diseño transversal usando como fuente secundaria Encuesta Demográfica y de Salud Familiar 2023, con un total de 31200 mujeres en edad fértil, buscando identificar los factores asociados a la preferencia por tener un/más hijos de las mujeres en edad fértil de 15 a 49 años en el Perú. Para el procesamiento se utilizó el programa estadístico SPSS versión 26. Entre los resultados se obtuvo que el 45.06% de las mujeres en edad fértil prefieren tener un/más hijos; mujeres menores de 35 años, con nivel educativo superior, solteras, no usaban algún método anticonceptivo y que se encontraban trabajando en su mayoría si preferían tener un/más hijos. Mediante un modelo de regresión logística, se identificó que las mujeres en edad fértil residentes del área urbana, sin nivel de educación, con nivel secundario, residentes en Lima Metropolitana y en la región sierra, tienen mayor probabilidad de preferir tener un/más hijos. El uso de algún método anticonceptivo y actualmente trabajando son variables que no contribuyeron en la construcción de este modelo, que obtuvo una precisión global de 76.93%, una sensibilidad de 75.89% y una especificidad de 77.77%.Item Análisis de Series de Tiempo y Machine Learning para proyectar una eficiente gestión de subsidios ante EsSalud(Universidad Nacional Mayor de San Marcos, 2023) Valverde Shuan, Keyla Fiorela; Norabuena Figueroa, Emerson DamianDetermina los factores o variables que generan una buena gestión de subsidios antes Essalud, gestionado por la empresa HumaSer. Para ejecutar dicho objetivo se cuenta con el apoyo de un sistema que nos brinda una supervisión interna y diligencias de gestión, con la finalidad de salvaguardar los recursos contra pérdidas por ineficacias operativas mediante Essalud; se comienza a reconocer los primordiales riesgos en el largo proceso y luego mejoramos la gestión; ejecutando acciones que nos ayude a disminuir y prevenir la posibilidad de los montos no recuperados en cada una de las cuentas adquiridas por los clientes, previniendo retrasos, pérdidas, y obedeciendo las normas interpuestas. La investigación está elaborada con los registros obtenidos por cada uno de los clientes, dicha información fue analizada a fin de conocer el estado en el cual se encuentran los tramites de subsidios por incapacidad y bajo esa perspectiva desarrollar un plan de trabajo. Ante ello se realiza el uso de la técnica de Regresión lineal múltiple (Machine Learning – supervisado) y el modelo de series de tiempo, propuestos por Box – Jenkins con el propósito de encontrar variables que nos indique o nos brinde una administración eficiente en la gestión de subsidios y por otro lado, visualizar el comportamiento de la data a través del tiempo con la finalidad de realizar pronósticos adecuados. Esta técnica ayudará a alcanzar el objetivo, debido a que son utilizadas para identificar outliers, correlaciones y explicar la influencia que genera las variables predictoras en nuestra variable dependiente en una gran cantidad de datos y que permita predecir los resultados para llegar a mejorar la efectividad en la toma de decisionesItem Análisis de supervivencia para proyectar la deuda en default de la cartera de tarjetas de una entidad financiera(Universidad Nacional Mayor de San Marcos, 2021) Canlla Linares, Jashir Alejandro; Fiesta Flores, Roberto carlosLa probabilidad de incumplimiento de los clientes morosos en el sistema financiero es estimada por distintos métodos estadísticos clásicos, dependiendo de la entidad financiera y el tipo de cliente analizado. En este trabajo se desarrolla el análisis de supervivencia para estimar la probabilidad de default de la cartera de tarjetas de una entidad financiera peruana. Además, se realiza un backtest de las probabilidades de default estimadas, para evaluar el modelo con el comportamiento real de la cartera de tarjetas en el año 2020. Se encontró que al mes 6 de maduración de los desembolsos de la cartera de tarjetas se evidencia la máxima expresión de la probabilidad de incumplimiento para luego en meses posteriores descender lentamente. Finalmente se utilizan las probabilidades estimadas por la función de riesgos para proyectar la deuda en default de los desembolsos de la cartera de tarjetas para el presupuesto del año 2021, utilizando un análisis de cosechas y obteniendo el monto total de default proyectado en una ventana de tiempo de 12 meses.Item Análisis de supervivencia: determinantes de la probabilidad de pago de una cartera castigada, en una entidad bancaria del Perú(Universidad Nacional Mayor de San Marcos, 2022) Balbuena Campos, Jhan Piere's Martin; Molina Quiñones, Helfer JoelBusca determinar los factores que influyan en la probabilidad de pago de la deuda de este tipo de clientes. Utilizando las técnicas del análisis de supervivencia, como el modelo de regresión de Cox, definiendo como evento de interés al pago de la deuda en el transcurso de un mes; se obtuvo que, el endeudamiento, el rango etario, la situación laboral y la región de residencia; así también, la morosidad de la deuda del cliente y el número de días que se le llamó al deudor, aportaron significativamente al modelo. La función de supervivencia del modelo estima una probabilidad de sobrevivir al evento de interés del 92.7%.Item Análisis del efecto del modelo panel EPEN 2021-2023 sobre los factores asociados al ingreso total de la población en Lima Metropolitana(Universidad Nacional Mayor de San Marcos, 2023) Peña Vasquez, Matita Nataly Paulette; Roque Paredes, OfeliaLa Encuesta Permanente de Empleo Nacional tiene como principal finalidad brindar información sobre el seguimiento del mercado laboral, esta encuesta es de tipo longitudinal por lo que tiene un diseño de tipo panel. Las muestras panel hacen el seguimiento a los individuos o sujetos de análisis en 4 periodos respectivos. En estas visitas repetitivas se evidencia la falta de respuesta de los informantes. Debido a esta falta de respuesta en las muestras panel, existen variaciones en las variables obtenidas anteriormente. En específico, los ingresos totales de la población se ven afectados; por tal motivo se está analizando los efectos de estas muestras panel en la Encuesta Permanente de Empleo Nacional sobre los factores asociados al ingreso total en la población de Lima Metropolitana, mediante modelos lineales mixtos con efectos fijos. Para el presente trabajo se analizaron diferentes modelos hasta llegar al más adecuado, en el cual se tuvo que utilizar una corrección al modelo de efectos fijos, donde resultaron tres variables significativas para el modelo. Los resultados indican la relación con el ingreso total, las variables significativas fueron nivel educativo y grupo de edad con relación positiva, y sexo con relación negativa.Item Análisis factorial confirmatorio: su utilidad en la validación de la rúbrica de observaciones del desempeño docente(Universidad Nacional Mayor de San Marcos, 2016) Orihuela Refulio, Judith NoemiExplora la validez factorial de la Rúbrica de Observación de Desempeño Docente (RODD) en una muestra de 2,495 docentes de aula del III ciclo (1° y 2° grado) del nivel primaria de las instituciones educativas de gestión pública focalizadas para la estrategia de soporte pedagógico 2016 a nivel nacional. Se analizó la estructura factorial de la Rúbrica de Observación del Desempeño Docente (RODD). La estructura factorial del modelo con dos dimensiones correlacionadas para el desempeño docente, presenta mejor ajuste en comparación de los otros modelos propuestos. Si bien es cierto se trata de variables observables ordinales, el uso del método de estimación por mínimos cuadrados no ponderados confirma mejor resultado que el método de máxima verosimilitud en especial en los índices de RMR, GFI, AGFI, PGFI y PNFI. La consistencia interna de las dimensiones de la RODD fue aceptable. En general, se muestra que la RODD se aproxima a ser una medida valida y fiable. A pesar que la literatura recomienda el uso del C3 en la evaluación del ajuste de los modelos factoriales confirmatorios, para variables ordinales, no se presentan como buenos índices de ajuste a los datos, ya que están basados en el estadístico chi cuadrado, propios del método de máxima verosimilitud. Se pudo corroborar que mediante las pruebas t para los parámetros estimados de las ecuaciones estructurales de la dimensión procesos pedagógicos para el modelo 3, no son significativos (p > 0.05), a pesar de presentar comunalidades que superan el 70% (R2), lo que nos lleva a sugerir un reespecificación del modelo, proponiendo así una estandarización o el enfoque del análisis factorial confirmatorio basado en la teoría de respuesta al ítem (TIR).Item Análisis televisivo del rating publicitario de los principales supermercados utilizando árboles de regresión, Lima 2023(Universidad Nacional Mayor de San Marcos, 2024) Rojas Villanueva, Juana Milagros; Huamán Gutiérrez, Zoraida JudithA través del tiempo la inversión publicitaria se va incrementando con un crecimiento de 2.3% del 2022 al 2023. Siendo los principales medios con mayor presencia Televisión y digital. Por ello Havas desea evaluar un plan de medios televisivo eficaz para sus principales clientes de los diferentes supermercados, se debe evaluar con precisión la importancia de la audiencia publicitaria. Se propone un algoritmo basado en árboles de regresión, con el objetivo de predecir el rating, evaluar las emisoras que generaron mayor rating e identificar el horario de mayor transmisión. Teniendo como resultados, la inversión en la publicidad es un factor determinante para el rating y los canales de televisión de mayor preferencia fueron América y Latina obteniendo 3.25 y 2.02 puntos. Además, los horarios más influyentes fueron: matutino (06:00-11:59), femenino (12:00-15:59), infantil (16:00-18:59) y estelar (19:00-23:59).Item Años de vida potencialmente perdidos por COVID-19 en el Perú, 2020-2021(Universidad Nacional Mayor de San Marcos, 2022) Rodriguez Coaguila, Juan Jesús; Molina Quiñones, Helfer JoelDetermina las tasas de años de vida potencialmente perdidos debido a todas las causas de muerte y por COVID-19 en el Perú, durante los años 2020 y 2021, este último por totales y según sexo. Siguiendo las putas o procedimiento propuesto por la OMS, respecto de elegir un límite de edad superior y un límite de edad inferior, calculando la edad media para cada grupo de edad, los años de vida potencialmente perdidos y sus tasas multiplicadas por 1 000 habitantes. Se tomó como matriz de análisis del Sistema Informático Nacional de Defunciones (SINADEF), de libre acceso, de los años 2017 al 2021 donde registran 801 719 muertes acumuladas dentro el periodo del 2017 al 2021. Asimismo, de la matriz se consideró el periodo 2020 y 2021 dando un acumulado de 10 366 fallecidos a consecuencia de la COVID-19 (casos confirmados al 24 de mayo del 2022, según SINADEF-MINSA). Representando con un 1,5% para el año 2020 y 2,1% de años de vida potencialmente perdidos para el 2021, en comparación con todas las causas de muerte. Atribuyéndole 49 394 años perdidos para el año 2020 y para el año 2021 se le atribuyó 69 038 años perdidos.Item Aplicación de análisis de homogeneidad “Homals”(Universidad Nacional Mayor de San Marcos, 2005) Gómez Camacho, Sandra América; Cambillo Moyano, Emma NormaExpone el desarrollo y aplicación del Análisis de Homogeneidad más conocido como Homals, debido a las soluciones mediante el Método de Mínimos Cuadrados Alternados, el cual tiene como objetivo principal encontrar asociaciones entre variables, entre categorías de las variables, así como también trata de caracterizar a los objetos mediante ciertas características que presentan. Para la aplicación del método se utilizó los indicadores demográficos y de educación de los resultados del Censo de Población y vivienda del año 1993 del INEI, porque es posible identificar a las provincias por niveles de pobreza (extrema pobreza, pobre y no pobre). Se observó que la mayoría de las provincias que se caracterizan por tener bajo desarrollo humano, se ubican en la región de la sierra; entretanto, las provincias caracterizadas como pobres son provincias de la región selva, mientras que las provincias no pobres generalmente se ubican en la costa del Perú.Item Aplicación de la regresión logística ordinal en el estudio de la relación entre la satisfacción personal y algunos trastornos depresivos en mujeres unidas o alguna vez unidas de Lima Metropolitana y Callao, 2002(Universidad Nacional Mayor de San Marcos, 2009) Quispe Quispe, Lizet Nevenka; Agüero Palacios, Ysela DomingaExpone que el modelo de regresión logística ordinal es una técnica estadística de creciente uso en investigaciones de diversas áreas como Ciencias de la Salud y Educación, esta técnica es la más adecuada y práctica para analizar los efectos de un conjunto de variables explicativas sobre una variable respuesta, medida en escala ordinal. El objetivo principal del presente trabajo es estudiar y aplicar el modelo de regresión logística ordinal. Se presenta a continuación una revisión de tres modelos ordinales; categoría adyacente, razón de continuación y odds proporcionales, haciendo énfasis en este último. Se ilustra la aplicación en base a los datos del módulo de la mujer unida y alguna vez unida del Estudio Epidemiológico de Salud Mental de Lima Metropolitana y Callao 2002 buscando determinar la asociación entre la satisfacción con algunos aspectos de su vida y la prevalencia de trastornos depresivos y de ansiedad. Se obtuvo que todos los tipos de satisfacción bajo estudio se encuentran significativamente asociados a la presencia de depresión.Item Aplicación de la técnica multivariante de escalamiento multidimensional en el Programa Internacional de Evaluación de Estudiantes (PISA)(Universidad Nacional Mayor de San Marcos, 2016) Sánchez Acostupa, YuriDetermina los factores que caracterizan a las instituciones educativas y se relacionan con la evaluación del aprendizaje en el Programa Internacional de Evaluación de Estudiantes (PISA) del año 2012, mediante la técnica multivariante de Escalamiento Multidimensional (EM). Es una investigación de tipo aplicada, descriptiva y de diseño no experimental. Encuentra que las instituciones educativas se clasifican en tres grupos: el primero donde se fomenta los proyectos o trabajos de investigación, así como el establecimiento de tareas para la casa, con lo cual se busca una interacción entre estudiantes y docentes; el segundo que se caracteriza por la falta y deficiencia en sus infraestructuras (laboratorios, biblioteca computadoras, etc.); y el tercero caracterizado por presentar falta de plana docente calificada para las materias de ciencias, matemática y comunicación, ausentismo por parte de los estudiantes y docentes.