Extractie, Transformatie en Laden (ETL)

ETL staat voor Extractie, Transformatie en Laden. Gegevens worden uit een registratiedatabase geëxtraheerd, daarna getransformeerd en tenslotte geladen in een speciaal voor informatieverschaffing aangelegde database. Om verschillende redenen is dit zeer gewenst of, vaak zelfs, noodzakelijk.

ETL is vaak een onderdeel van een data warehouse traject.

Hoe werkt ETL?

Bij Extractie van brongegevens worden deze veelal in een tijdelijke database geladen om te worden geTransformeerd waarna het resultaat uiteindelijk wordt geLaden in een Data Warehouse. Vaak vindt tijdens het Transformatiegedeelte van een ETL-proces een opschoningslag en een verrijkingslag plaats van de gegevens.

Grafisch kan het proces als volgt voorgesteld worden:

Bron: Deliver an effective and flexible data warehouse solution, Part 3: Design and implement a warehouse ETL process

Een noodzakelijk kwaad

Vaak is het extraheren en transformeren van gegevens uit een bepaald bronsysteem om deze vervolgens te laden in een voor rapportage bedoeld opslagsysteem een noodzakelijk kwaad.

De redenen zijn vaak één of meer van de volgende:

  • Het bronsysteem is vaak een registratiesysteem waarbij het benaderen van de onderliggende database de prestatie van het registratiesysteem ernstig kan ondermijnen.
  • Het bronsysteem bevat erg veel onnodige details.
  • In het bronsysteem zitten veel vervuilde gegevens.
  • Voor de integratie met andere gegevenssets dienen de gegevens uit het bronsysteem eerst geconverteerd en/of getransformeerd worden.

Tools

Twee veelgebruikte ETL tools zijn:

  • Oracle Warehouse builder
  • Microsoft SQL Server - Integration Services

Voor de eeuwwisseling waren volwassen ETL tools nog erg duur. Tegenwoordig zijn er zelfs open-source varianten zoals Talend Open Studio. Talend Open Studio genereert Perl scripts of Java code welke stand-alone op vrijwel elk denkbaar platform is te implementeren.

Voor een ETL-demonstratie bekijk een demo van Talend Open Studio. De manier waarop deze tool werkt is illustratief voor de meeste van dit soort tools.

Vraag of opmerking

Colofon

Algemene informatie

Citaten
Deze site bevat naast eigen materiaal ook tekst- en beeldcitaten.

Cookies
eQTeam maakt gebruik van cookies om u een optimaal gebruiksgemak te bezorgen op onze website en om inzicht te krijgen in de werking en effectiviteit. De daarmee verzamelde gegevens worden door ons niet gebruikt om activiteiten van individuele gebruikers te volgen. Indien u onze pagina's bezoekt, gaan we ervan uit dat u akkoord gaat met de plaatsing van cookies op uw device.

Aanbevolen websites

Onze website
Deze site is gebouwd op basis van een aangepaste en uitgebreide versie van DokuWiki. De layout is responsive, modern vormgegeven, en goed leesbaar op de meeste devices.