Data Warehouse; één centrale en geordende opslagplaats voor alle data in je organisatie

Tijdens een Excel training van de Academies

Blogs over Microsoft Fabric

Blog 3: Data Warehouse; één centrale en geordende opslagplaats voor alle data in je organisatie

Leestijd

5 minuten

Auteur

Robin van Hattum

Stel je voor dat je een grote bibliotheek binnenloopt waar alle boeken door elkaar op de grond liggen. Je weet dat de informatie die je zoekt er ergens tussen zit, maar je hebt geen idee waar je moet beginnen. Precies zo voelt het voor veel organisaties als ze proberen iets te doen met hun data. Een Data Warehouse lost precies dit probleem op. Het is de centrale plek waar alle data van je organisatie samenkomt, geordend en betrouwbaar wordt opgeslagen en altijd klaarstaat om bevraagd te worden. Het Data Warehouse in Microsoft Fabric gaat nog een stap verder, omdat het naadloos samenwerkt met de rest van het platform. Van de data die binnenkomt via Data Factory tot de rapporten die je collega’s bekijken in Power BI. Geen losse systemen meer, geen tegenstrijdige cijfers, maar één betrouwbare basis waarop je hele organisatie kan bouwen.

Een Data Warehouse is een centrale plek waar relevante data uit verschillende systemen samenkomt en wordt klaargezet voor betrouwbare rapportages, analyses en dashboards.

Waarom heb je een Data Warehouse nodig?

Je hebt in de vorige blog gelezen dat je Data Factory gebruikt om data te ontsluiten, op te schonen en te combineren. Maar als dat is gebeurt moet het nog wel op één centrale plek opgeslagen worden. Daar komt een Data Warehouse om de hoek kijken. Het zorgt ervoor dat alle informatie centraal beschikbaar is in een organisatie. Nog even naar dat voorbeeld van een bibliotheek. De boeken liggen niet door elkaar op de grond, maar zijn netjes geordend op alfabet opgeruimd. Vanaf deze plek kunnen medewerkers uit je organisatie de data gaan verkennen, analyseren en gebruiken voor inzichten en voorspellingen.

Hoe werkt een Data Warehouse in Fabric?

Fabric heeft twee manieren om data gestructureerd op te slaan en te bevragen. Ze lijken ergens wel op elkaar maar hebben toch een eigen toepassing. Je kiest wat het beste past bij jouw situatie of je gebruikt ze allebei:

  • Fabric Warehouse (Klassiek Data Warehouse)
    Een Fabric Warehouse is een geordende centrale opslagplaats waar je alle data van je organisatie kunt bewaren en eenvoudig doorzoeken. Je kunt het zien als een goed georganiseerd archief waar alles op de juiste plek staat en je altijd snel het antwoord vindt op je vragen.
    Ideaal voor: Gestructureerde bedrijfsdata zoals financiën, verkoop en HR waarbij de structuur vooraf vastligt en iedereen dezelfde tabellen gebruikt. Denk aan een maandelijkse P&L of een klantenrapportage.
  • Lakehouse (Flexibele dataopslag)
    Een Fabric Lakehouse is een flexibele opslagplaats waar je grote hoeveelheden ruwe data kunt bewaren, ook als die data nog niet netjes geordend is. Het is minder het goed georganiseerde archief, en meer een grote opslagruimte waar je alles kwijt kunt en waar je later pas bepaalt hoe je het wilt ordenen en gebruiken.
    Ideaal voor: ruwe data in de vorm van logbestanden, sensordata of tekst. Je kunt de data direct doorzoeken met Power BI of bijvoorbeeld in opgeschoonde en geordende vorm doorzetten naar het Fabric Warehouse.

Overzicht Microsoft Fabric platform

Een concreet voorbeeld: zorginstelling met vijf systemen

Stel je bent data-analist bij een zorginstelling. De data die je nodig hebt staat verspreid over vijf systemen. Zonder Fabric moet je de data zelf uit de verschillende systemen halen en samenbrengen in bijvoorbeeld Power BI. Maar je collega’s zijn bezig met dezelfde processen uitvoeren en profiteren niet van de intelligentie die jij erin stopt.
Met Fabric zou dat er zo uit kunnen zien:

  • Data uit 5 bronnen
    Patiëntgegevens, medicatiegegevens, personeelsinzet, financiën en kwaliteit staan elk in een eigen systeem. Ieder systeem heeft eigen opmaak en structuur zodat data niet eenvoudig te combineren is.
  • Data ontsluiten en opschonen
    Via Data Factory worden de verschillende systemen ontsloten met Pipelines en met behulp van Dataflows wordt de data opgeschoond. Het eindresultaat zijn losse tabellen zonder samenhang.
  • Lakehouse
    Deze ‘ruwe’ data wordt opgeslagen in het Lakehouse. Hier wordt alle historische data netjes opgeslagen. Nog niet perfect geordend en gecombineerd, maar wel veilig opgeslagen en beschikbaar.
  • Data Warehouse
    Vanuit het Lakehouse wordt data die echt belangrijk is voor rapportages en dashboards doorgestuurd naar het Data Warehouse. Ook deze stap wordt aangestuurd door een Pipeline die bepaalt welke data er wordt opgehaald. Een dataflow zorgt er vervolgens voor dat de data in de juiste vorm en structuur in het Data Warehouse komt.
  • Power BI
    Nu het Data Warehouse is gevuld kan Power BI de informatie ophalen uit het Data Warehouse en kunnen de inzichten worden gepresenteerd in rapportages en dashboards.

De pipeline is de motor die het hele proces aanstuurt en bewaakt. De dataflow is het gereedschap dat de data in de juiste vorm giet. Samen zorgen ze ervoor dat de data elke ochtend automatisch klaarstaat in het Data Warehouse — schoon, geordend en klaar om te gebruiken in Power BI.

Waarom een Data Warehouse in Fabric?

Er zijn bekende alternatieven voor een Data Warehouse zoals bijvoorbeeld Azure Synapse, Snowflake of Google BigQuery. Iedere tool heeft z’n eigen voor en nadelen. Een Data Warehouse in Fabric is dan ook niet persé beter dan andere tooling. De kracht zit hem vooral in de integratie van het hele platform. In het voorbeeld hiervoor zie je dat het hele proces binnen dezelfde omgeving afgehandeld kan worden. Van het ontsluiten van de data tot het rapporteren van de data met Power BI. Dat is vooral de kracht van Fabric!

Is dit iets voor jou?

Een Data Warehouse in Fabric is de moeite waard als je je herkent in één of meer van deze situaties:

  • Je data komt uit meerdere bronsystemen
  • Data ontsluiten en prepareren wordt op gebruikersniveau gedaan zodat er veel tijd verloren gaat.
  • Er is geen centrale plek waar alle data is opgeslagen
  • De kwaliteit van de data is niet stabiel
  • Je werkt al met Power BI en wilt een volgende stap maken

Het goede nieuws: je hoeft niet in één keer alles te migreren. Je kunt beginnen met één domein, bijvoorbeeld finance, en het Data Warehouse stap voor stap uitbreiden. De basis die je legt in Fabric is schaalbaar; klein starten, groot denken!

On The Chart - Fabric

Van data naar inzicht

Met een beetje proberen kun je veel zelf, maar soms kom je nog iets te kort. Kennis, tijd of ervaring. Daarom helpen we je vanuit ons zusterbedrijf On The Chart met consultancy. Heb je behoefte aan advies, uitvoering of implementatie? We helpen je graag verder!

  1. Specialisten in data engineering en MS Fabric
  2. Persoonlijke ondersteuning bij vraagstukken tot complete projecten
  3. BI-consultants die je écht verder helpen