Verschillen

Dit geeft de verschillen weer tussen de geselecteerde revisie en de huidige revisie van de pagina.

Link naar deze vergelijking

nl:content:kb:scope_02:data_warehousing [2015/05/28 10:25] (huidige)
Regel 1: Regel 1:
 +/*live*/
 +====== Data Warehousing ======
 +<WRAP left round ms>Een Data Warehouse of Gegevenspakhuis in goed Nederlands is een verzameling van gegevens veelal afkomstig uit één of meerdere transactiesystemen (ook wel registratiesystemen) met als doel deze te combineren tot zinvolle management informatie.\\
 +\\
 +Het opzetten van een gegevenspakhuis wordt aangeduid met de bijzonder Amerikaans klinkende term //data warehousing//​.
 +</​WRAP>​
 +
 +
 +====== Ontstaan ======
 +De term is geïntroduceerd door William H. Inmon in 1990 en hij definieerde deze als:
 +<​blockquote>​
 +A data warehouse is a subject-oriented,​ integrated, nonvolatile,​ time-variant collection of data in support of management'​s decisions.
 +</​blockquote>​
 +
 +Iemand die zich bezig houdt met het opzetten van een data warehouse doet aan //data warehousing//​.
 +
 +Naast Inmon die als pionier kan worden gezien op het gebied van beslissingsondersteuning en data warehousing is het men name Ralph Kimball geweest die een solide theoretische fundering heeft gelegd voor het opzetten van data warehouses waarbij hij ook de vele praktische aspecten duidelijk in zijn boeken naar voren laat komen. Een gerespecteerde Amerikaanse Data Warehousing consultant zei het zo:
 +<​blockquote>​
 +Kimball is an expert when it comes to understanding and documenting star schema design and working with the business users. He has created the concept of slowly changing dimensions of reporting - as is versus as was - and has solved every technical issue that has ever been presented to him and those he has discovered on his own. His strength lies in implementation. ​
 +</​blockquote>​
 +
 +
 +
 +====== Opmerkelijke verschuiving ======
 +In de loop van de afgelopen jaren heeft er een opmerkelijke verschuiving plaatsgevonden. Zaken die voorheen onderdeel waren van een Data Warehouse project, zijn nu onderdeel van Business Intelligence trajecten. Kimball schrijft in [[http://​www.intelligententerprise.com/​showArticle.jhtml?​articleID=217200041|Eight Guidelines for Low-Risk Enterprise Data Warehousing]]
 +
 +<​blockquote>​Sinds enkele jaren heet dat wat vroeger 'data warehousing'​ werd genoemd '​business intelligence'​. Dat dit vakgebied van een ander label werd voorzien is echter meer dan een marketing tactiek, omdat het op de juiste wijze aangeeft dat het initiatief en het eigendom van de gegevens bij de eindgebruikers behoort.</​blockquote>​
 +
 +/*
 +**Origineel**
 +<​blockquote>​A few years ago, data warehousing was relabeled as "​business intelligence."​ This relabeling was far more than a marketing tactic because it correctly signaled the transfer of the initiative and ownership of the data assets to the business users. Everyone knows instinctively that they can do a better job if they can see the right data. Our job in IT is to sort through all the technology in order to give the users what they want.</​blockquote>​
 +*/
 +
 +Met de term //data warehouse// wordt tegenwoordig puur de onderliggende gegevensopslagplaats bedoeld waaruit de vele [[:​nl:​content:​kb:​scope_02:​business_intelligence|Business Intelligence]] rapportagetools de gegevens kunnen putten. Het functionele en technische ontwerp van een //data warehouse// is fundamenteel voor bijvoorbeeld het niveau van detaillering,​ de onderlinge verbanden en de snelheid waarmee informatie kan worden verkregen.
 +
 +====== Data Warehouse modellering ======
 +
 +Naast de hiervoor genoemde goeroes Bill Inmon en Ralph Kimball is er sinds het begin van dit millenium een derde: Dan Linstedt.
 +
 +Datawarehouses werden tot enkele jaren geleden vooral naar de inzichten van Kimball en Inmon gerealiseerd. Maar in de praktijk bleek voor met name grote bedrijven met enorme data warehouses noch de //Hub & Spoke architectuur//​ van Inmon, noch de //Bus architectuur//​ met conforme dimensies van Kimball optimaal te zijn.
 +
 +Volgens de techniek van Kimball wordt in de loop der tijd een groeiend aantal datamarts gebouwd, dat het bewaren van overzicht moeilijk maakt. Inmon vindt dat er lang moet worden vergaderd over een model dat alle mogelijke wensen van de organisatie dient te herbergen met als gevolg dat het data warehouse hierdoor te laat of helemaal nooit af komt. [[:​nl:​content:​kb:​scope_02:​data_vault_modelling|Data Vault]] wordt door Linstedt omschreven als een detail-georiënteerde,​ historie-tracerende en uniek gelinkte verzameling genormaliseerde tabellen die meerdere functionele businessdomeinen kunnen ondersteunen. Het ontwerp is flexibel, schaalbaar, consistent en aanpasbaar aan de behoefte van een onderneming.
 +
 +Op YouTube staat een kort filmpje met een technische uitleg over de verschillende modelleringsvormen [[http://​www.youtube.com/​watch?​v=Cr0NsQwfK4o|3NF (Hub & Spoke), Star Schema (Bus architectuur) en Data Vault]] door de DataVaultAcademy (Engelstalig).
 +
 +/*
 +eQTeam heeft een gedegen kennis van de data warehouse theorie en is in staat om deze in de praktijk succesvol toe te passen zoals zij tijdens enkele projecten heeft laten zien. Wij geloven dat het gebruik van de juiste tools hierbij cruciaal is. Indien eindgebruikers rechtstreeks toegang tot de gegevens in het data warehouse moeten krijgen, is het gebruik van een business intelligence tool zeer aan te raden. ​
 +
 +...
 +
 +Aardig stukje:
 +[[http://​www.intelligententerprise.com/​030513/​608warehouse1_1.jhtml|TCO Starts With the End User]]
 +
 +====== TCO - Totale kosten van het bezit ======
 +
 +TCO Starts With the End User
 +The conventional view of data warehouse total cost of ownership is myopic and wrong 
 +
 +"... the cost and value of which you must judge by its effect on decision-making in the broadest possible sense.
 +
 +So, who are the decision makers in an organization?​ For the most part, they'​re not the IT employees! As Bob Lewis wrote so aptly in a recent column, "IT is an enabler of value, not a provider of value."​ The mainline decision makers of an organization are the end users of the data warehouse, whether they'​re executives, managers, knowledge workers, analysts, shop-floor stewards, customer service representatives,​ secretaries,​ or clerks. All these end users have a powerful, instinctive need to see data."
 +
 +[[:​nl:​tco|Total cost of ownership]]
 +*/
 +
 +====== Aanbevolen sites over dit thema ======
 +
 +[[http://​www.rkimball.com/​html/​articles.html|Artikelen van Ralph Kimball en associates]]
 +
 +====== Vraag of opmerking ======
 +[[nl:​composite:​contact|Ik heb een vraag of opmerking over de informatie op deze pagina.]]