BI Dutch sessie – Data Delivery Platform (Dutch)

Gisterenavond ben ik aanwezig geweest bij een sessie georganiseerd door Johan van der Kooij van BI Dutch bij Sogeti. Johan is in staat geweest om Rick van der Lans van der Lans te strikken, om te komen vertellen over het Data Delivery Platform (DDP). Rick heeft al eerder artikelen geschreven over het Data Delivery Platform.

Rick heeft een prettige manier van presenteren. Al direct in het begin weet hij een ieder te boeien met een aantal interessante stellingen en uitspraken. Wat ik persoonlijk een hele leuke vind om over na te denken;

Een Datawarehouse is een middel en géén doel op zich. Een klant vraagt in eerste instantie alleen maar om (snelle) toegang tot zijn of haar bedrijfsgegevens.

Gartner spreekt over Datawarehouses van Terra- en wellicht wel Zettabytes. Nigel Pendse daarentegen heeft aan een paar Gigabytes al voldoende. Het verschil tussen de Bruto en de Netto dataopslag in een Datawarehouse. De Bruto dataopslag kan vele male hoger uitvallen doordat de data op verschillende plekken gedupliceerd en opgeslagen wordt. Interessant kan zijn om eens uit te rekenen wat het dubbel opslaan van data kost in termen van licenties, ontwikkeling ETL, beheer, etc. Uiteraard zullen er legio redenen te bedenken zijn waarom er gekozen wordt voor de traditionele DWH structuren. Toch kan het géén kwaad om een naar alternatieven te kijken. Zet de traditionele DWH structuur eens af tegen de (nieuwe) mogelijkheden op het gebied van In Memory Analytics en Datawarehouse Appliances. De huidige hardware is er klaar voor.

Terug naar het DDP. Het Data Delivery Platform is een architectuur. Een archictectuur waarbij de applicatie losgekoppeld wordt van de opslagstructuur. Er wordt een ‘Metalaag’ tussen de applicatie en de opslag geplaatst. In deze Metalaag wordt de vertaalslag gemaakt van applicatie naar data, er wordt intelligentie uit de BI Tool vastgelegd en in het ideale geval metadata vastgelegd. Doormiddel van een aantal viewlagen worden diverse fysieke tabellen aan diverse gebruikers(groepen) gepresenteerd. Tools welke dit verzorgen worden Federation Server genoemd. Het verschil tussen DDP en een Federation Server zit hem de Architectuur versus de Tool. Een Federation Server zal veelal deel uitmaken van een DDP.

Een eindgebruiker kan met een willekeurige BI Tool aansluiten op het DDP. Ook hoeft hij/zij zich géén zorgen meer te maken over waar de dat vandaan komt. Dit wordt allemaal afgehandeld binnen het DDP. Intelligentie en specificaties zijn voor meerdere toepassingen en gebruikersgroepen bruikbaar. Het DDP moet uiteindelijk leiden tot een flexibele, uitgeklede omgeving. Uitgekleed in de zin van het beperken van dupliceren van data.

Mijn interesse voor deze sessie werd bij gewekt vanwege de overeenkomsten tussen DDP en de Oracle BI Server. Leander van Dongen heeft hier vorig jaar al een en ander over geschreven. De Oracle BI Server moet worden gezien als een Federation Server. Wanneer we kijken naar Oracle’s Enterprise Performance Management System, dan kunnen we de overeenkomsten zien.

Ook Oracle gaat in haar architectuur van een gelaagde architectuur. Er kunnen diverse bronnen gekoppeld worden en via allerhande tooling ontsloten worden. De Oracle BI Server zorgt via het Common Enterprise Information Model voor de koppeling, integratie en structurering van de informatie uit de fysieke databronnen.

Zowel bij de Federation Servers in een DDP architectuur als in de Oracle BI Server is er sprake van een virtuele ‘kijk’ naar physieke data. Data wordt niet gedupliceerd, maar gemodelleerd.

Aan het slot van de sessie is Rick onder leiding van Johan ingegaan op een aantal zeer kritische vragen. Het aanwezige publiek leek zich niet zomaar zonder meer te willen laten overtuigen. Ogenschijnlijk zonder problemen behandelde Rick de vragen. Een kleine greep:

Een DDP sluit traditionele Datawarehousing met Datamarts niet uit. Er wordt echter wel kritisch gekeken of het dupliceren van data nodig is (bijv. in het geval van Periode sluitingen). Ook Data Vault structuren staan een DDP niet in de weg. Een Data Vault is echter meestal niet ideaal om op te querien. Dit zal echter binnen de views van de Federation Server opgelost kunnen worden. Cleaning kan via profiling logica, on-demand, geïntegreerd worden. Voorstellen voor opgeschoonde daten kunnen dan zelfs ter beoordeling aan de eindgebruiker aangeboden worden.

Ik ben benieuwd hoe het Data Delivery Platform zich in de toekomst gaat ontwikkelen. Wanneer het publiek van gisteren een afspiegeling is van de ‘BI Samenleving’, dan heeft het DDP nog wel een lange weg te gaan. ‘Het lijkt erop dat tools, die ‘In Memory Analytics’ ondersteunen, en Data Warehouse Appliances meer kans van slagen hebben.

Al met al een interessant event, met dank aan Johan van der Kooij en Rick van der Lans. Hier is het laatste woord nog niet over geschreven.

2 thoughts on “BI Dutch sessie – Data Delivery Platform (Dutch)

  1. Los van de technische invalshoek kan je er ook organisatorisch naar kijken.
    Moet je namelijk van ICT verwachten dat ze niet meer dan een DPP rol krijgen, en daarmee garant staan voor het beschikbaar stellen van een platform waarop gebruikers zelf hun data selecties kunnen maken?

    Nu zie ik nog vaak dat ICT zich opwerpt als query ontwikkelaar, en rapportage bouwer. Misschien toch een idee om de ‘Business Intelligence’ aan de ‘Business’ zijde te organiseren en daarvoor tools beschikbaar te stellen?

    Like

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.