We hebben het in de Dataloog al eens gehad over het feit dat het goed op orde hebben van dat een vereiste is voor het beginnen aan Data Science. Dat begint bij een goed Data model  en een goed ingericht master data management (zoals bij Vanderlande) . Als je vervolgens aan de standaard gestructureerde dataset uit het DWH diverse andere (ongestructureerde) databronnen toevoegt, praat je over een Data Lake.  Vandaag gaan we het we het hebben de waarde van het Data Warehouse en het Data Lake.

We praten met Bastiaan Sjardin over het inrichten van Data Warehouses. Hoe kom je tot een goed DWH? Hoeveel bedrijven hebben een goed werkend DHW, en wat zijn hier de requirements voor een goed DWH? Kortom, we praten over Data Maturity.

Shownotes

https://www.stat.berkeley.edu/~breiman/randomforest2001.pdf 

https://arxiv.org/abs/1801.10365

Bastiaan Sjardin