Diseño e implementación de un Data Lake para la disponibilidad de una fuente confiable de datos en una empresa de microfinanzas

dc.contributor.advisorVásquez Serpa, Luis Javier
dc.contributor.authorHuayllasco Cáceres, Renzo Alfredo
dc.date.accessioned2024-01-23T20:50:13Z
dc.date.available2024-01-23T20:50:13Z
dc.date.issued2023
dc.description.abstractAborda sobre el diseño e implementación de un Data Lake, en una entidad del rubro de microfinanzas, a fin de disponer de una fuente de datos confiable para la obtención de conocimiento de negocio mediante la aplicación de modelos analíticos. La implementación se realiza en la nube pública de Microsoft Azure. Se emplean recursos como Azure Databricks, Data Factory, Data Lake Storage Gen2 para el frente de infraestructura. La lógica de procesamiento se desarrolla en el lenguaje Scala sobre el framework de Apache Spark. Así mismo, el Unity Catalog de Databricks para la gestión de metadatos y control de acceso. Como resultado, se obtiene un Data Lake conformado por cuatro capas: LandingLayer, IngestionLayer, ProcessLayer y FunctionLayer. En cada una de las capas se realiza un tratamiento específico, de manera secuencial, a la data. Cara al usuario final se dispone de un modelo de datos, cuya estructura responde a definiciones de gobierno, al cual pueden acceder mediante los sandbox. En conclusión, se diseña e implementa un Data Lake provisto de funcionalidades que responden a las necesidades del negocio. El tiempo y esfuerzo de construcción de workflows de ingesta y procesamiento de datos son de bajo costo. Realizar la exploración y trazabilidad de los datos es amigable cara al usuario final.es_PE
dc.formatapplication/pdfes_PE
dc.identifier.citationHuayllasco, R. (2023). Diseño e implementación de un Data Lake para la disponibilidad de una fuente confiable de datos en una empresa de microfinanzas. [Trabajo de Suficiencia Profesional de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.es_PE
dc.identifier.urihttps://hdl.handle.net/20.500.12672/21112
dc.language.isospaes_PE
dc.publisherUniversidad Nacional Mayor de San Marcoses_PE
dc.publisher.countryPEes_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/es_PE
dc.sourceUniversidad Nacional Mayor de San Marcoses_PE
dc.sourceRepositorio de Tesis - UNMSMes_PE
dc.subjectMicrofinanzases_PE
dc.subjectDatos masivoses_PE
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.01es_PE
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.02es_PE
dc.titleDiseño e implementación de un Data Lake para la disponibilidad de una fuente confiable de datos en una empresa de microfinanzases_PE
dc.typeinfo:eu-repo/semantics/bachelorThesises_PE
renati.advisor.dni43389380
renati.advisor.orcidhttps://orcid.org/0000-0002-5414-6764es_PE
renati.author.dni70436616
renati.discipline611026es_PE
renati.jurorAlvarez Huertas, Frank Duberlee
renati.jurorZorrilla Masias, Henry
renati.levelhttps://purl.org/pe-repo/renati/level#tituloProfesionales_PE
renati.typehttps://purl.org/pe-repo/renati/type#trabajoDeSuficienciaProfesionales_PE
sisbib.juror.dni45173557
sisbib.juror.dni41190698
thesis.degree.disciplineComputación Científicaes_PE
thesis.degree.grantorUniversidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Escuela Profesional de Computación Científicaes_PE
thesis.degree.nameLicenciado en Computación Científicaes_PE

Files

Original bundle

Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
Huayllasco_cr.pdf
Size:
4.39 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
C0167_2023_Huayllasco_cr_reporte_turnitin.pdf
Size:
12.68 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
C0167_2023_Huayllasco_cr_autorizacion.pdf
Size:
154.93 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: