Teoría » Tecnologías: Virtualización de Datos » TODOS

Data Lakes de nueva generación. Por Rick F. van der Lans [PDF en inglés 18 págs]

Documento sobre la Fusión de Data Lakes distribuidos

Data Lakes de nueva generación. Por Rick F. van der Lans [PDF en inglés 18 págs]
Por Redacción BI-Spain.com
Actualizado el 3 de abril, 2019 - 13.05hs.

Publicamos informe en inglés del experto en BI Rick F. van der Lans, patrocinado por Tibco, sobre qué son y cómo se están poniendo en marcha los nuevos Data Lakes distribuidos. El documento se publicó en febrero del 2019.

Rick F. van der Lans, reconocido experto en Data Warehouse y Business Intelligence, explica en este whitepaper de 18 páginas en inglés, publicado en febrero de 2019, su idea de los Data Lakes modernos, que esencialmente deben ser una serie de Data Lakes distribuidos por la organización. 

Según Rick las organizaciones se ven obligadas a trabajar no sólo con diferentes Data Lakes sino también con otras fuentes de datos dispersas (como Data Warehouses) por razones técnicas, regulatorias u organizacionales. 

Pero para trabajar con los datos se requiere fusionar las diferentes fuentes para poder presentar una visión "integrada" de los mismos a los usuarios. Para ello, según van der Lans, existen tres soluciones:

a) Integración mediante herramientas de ciencia de datos

b) Integración mediante replicación de datos

c) Integración mediante virtualización de datos

 

El índice del documento es el siguiente:

1 Introduction 

2 A Modern Data Lake is a Distributed Data Platform 

3 Three Alternative Solutions for Developing Fused Data Lakes 

4 Data Virtualization for Fusing Data Lakes

4.1 Hiding the Distributed Nature of the Data Lake to Simplify Data Access

4.2 Hiding Heterogeneous Data Platforms to Simplify Data Access

4.3 Query Pushdown to Exploit the Power of the Data Platforms

4.4 Parallel Query Processing to Accelerate Big Queries

4.5 Distributed Query Optimization to Efficiently Access Multiple Data Lakes

4.6 Data Caching to Temporarily Store Data

5 Comparison of Three Solutions for Developing Fused Data Lakes 

6 Closing Remarks 

9 Summary 

 

Documentos adjuntos

Este artículo incluye uno o más ficheros de descarga. Para acceder este material exclusivo debes estar registrado.

Si ya eres usuario registrado de BI-Spain.com, por favor identifícate aquí.
Si aún no lo eres, puedes registrarte aquí rápidamente.

Recuerda que registrarse en BI-Spain.com es completamente gratis.

Comentarios: Lo más reciente de 0 comentario(s)

BI-Spain.com valora enormemente tu aporte en especial si compartes tus opiniones, puntos de vista y críticas con los demás miembros de nuestra comunidad.
Agrega un comentario
Por favor identifícate aquí para agregar tus comentarios.
Si aún no eres usuario registrado de BI-Spain.com, puedes registrarte aquí gratis.

Publicidad

Ofertas de empleo para profesionales IT en España y América Latina - TIC-Jobs.com

Ofertas de empleo IT, TIC, ERP, Consultor, Administrador, Programador, Desarrollador, Business Intelligence, BI, Business Process Management, BPM, CRM, Dynamics, ECM, RRHH, SAP, Sharepoint, WCM, Sharepoint, Navision, España, México, Argentina, Chile, Brasil,Perú

Lo más leído »

Publicidad

Más Secciones »

Hola Invitado