Diseño e implementación de un Data Lake para la disponibilidad de una fuente confiable de datos en una empresa de microfinanzas
dc.contributor.advisor | Vásquez Serpa, Luis Javier | |
dc.contributor.author | Huayllasco Cáceres, Renzo Alfredo | |
dc.date.accessioned | 2024-01-23T20:50:13Z | |
dc.date.available | 2024-01-23T20:50:13Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Aborda sobre el diseño e implementación de un Data Lake, en una entidad del rubro de microfinanzas, a fin de disponer de una fuente de datos confiable para la obtención de conocimiento de negocio mediante la aplicación de modelos analíticos. La implementación se realiza en la nube pública de Microsoft Azure. Se emplean recursos como Azure Databricks, Data Factory, Data Lake Storage Gen2 para el frente de infraestructura. La lógica de procesamiento se desarrolla en el lenguaje Scala sobre el framework de Apache Spark. Así mismo, el Unity Catalog de Databricks para la gestión de metadatos y control de acceso. Como resultado, se obtiene un Data Lake conformado por cuatro capas: LandingLayer, IngestionLayer, ProcessLayer y FunctionLayer. En cada una de las capas se realiza un tratamiento específico, de manera secuencial, a la data. Cara al usuario final se dispone de un modelo de datos, cuya estructura responde a definiciones de gobierno, al cual pueden acceder mediante los sandbox. En conclusión, se diseña e implementa un Data Lake provisto de funcionalidades que responden a las necesidades del negocio. El tiempo y esfuerzo de construcción de workflows de ingesta y procesamiento de datos son de bajo costo. Realizar la exploración y trazabilidad de los datos es amigable cara al usuario final. | es_PE |
dc.format | application/pdf | es_PE |
dc.identifier.citation | Huayllasco, R. (2023). Diseño e implementación de un Data Lake para la disponibilidad de una fuente confiable de datos en una empresa de microfinanzas. [Trabajo de Suficiencia Profesional de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM. | es_PE |
dc.identifier.uri | https://hdl.handle.net/20.500.12672/21112 | |
dc.language.iso | spa | es_PE |
dc.publisher | Universidad Nacional Mayor de San Marcos | es_PE |
dc.publisher.country | PE | es_PE |
dc.rights | info:eu-repo/semantics/openAccess | es_PE |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/ | es_PE |
dc.source | Universidad Nacional Mayor de San Marcos | es_PE |
dc.source | Repositorio de Tesis - UNMSM | es_PE |
dc.subject | Microfinanzas | es_PE |
dc.subject | Datos masivos | es_PE |
dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#1.02.01 | es_PE |
dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#1.02.02 | es_PE |
dc.title | Diseño e implementación de un Data Lake para la disponibilidad de una fuente confiable de datos en una empresa de microfinanzas | es_PE |
dc.type | info:eu-repo/semantics/bachelorThesis | es_PE |
renati.advisor.dni | 43389380 | |
renati.advisor.orcid | https://orcid.org/0000-0002-5414-6764 | es_PE |
renati.author.dni | 70436616 | |
renati.discipline | 611026 | es_PE |
renati.juror | Alvarez Huertas, Frank Duberlee | |
renati.juror | Zorrilla Masias, Henry | |
renati.level | https://purl.org/pe-repo/renati/level#tituloProfesional | es_PE |
renati.type | https://purl.org/pe-repo/renati/type#trabajoDeSuficienciaProfesional | es_PE |
sisbib.juror.dni | 45173557 | |
sisbib.juror.dni | 41190698 | |
thesis.degree.discipline | Computación Científica | es_PE |
thesis.degree.grantor | Universidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Escuela Profesional de Computación Científica | es_PE |
thesis.degree.name | Licenciado en Computación Científica | es_PE |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- C0167_2023_Huayllasco_cr_reporte_turnitin.pdf
- Size:
- 12.68 MB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- C0167_2023_Huayllasco_cr_autorizacion.pdf
- Size:
- 154.93 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: