Inhoud

Extractie, Transformatie en Laden (ETL)

ETL staat voor Extractie, Transformatie en Laden. Gegevens worden uit een registratiedatabase geëxtraheerd, daarna getransformeerd en tenslotte geladen in een speciaal voor informatieverschaffing aangelegde database. Om verschillende redenen is dit zeer gewenst of, vaak zelfs, noodzakelijk.

ETL is vaak een onderdeel van een data warehouse traject.

Hoe werkt ETL?

Bij Extractie van brongegevens worden deze veelal in een tijdelijke database geladen om te worden geTransformeerd waarna het resultaat uiteindelijk wordt geLaden in een Data Warehouse. Vaak vindt tijdens het Transformatiegedeelte van een ETL-proces een opschoningslag en een verrijkingslag plaats van de gegevens.

Grafisch kan het proces als volgt voorgesteld worden:

Bron: Deliver an effective and flexible data warehouse solution, Part 3: Design and implement a warehouse ETL process

Een noodzakelijk kwaad

Vaak is het extraheren en transformeren van gegevens uit een bepaald bronsysteem om deze vervolgens te laden in een voor rapportage bedoeld opslagsysteem een noodzakelijk kwaad.

De redenen zijn vaak één of meer van de volgende:

Tools

Twee veelgebruikte ETL tools zijn:

Voor de eeuwwisseling waren volwassen ETL tools nog erg duur. Tegenwoordig zijn er zelfs open-source varianten zoals Talend Open Studio. Talend Open Studio genereert Perl scripts of Java code welke stand-alone op vrijwel elk denkbaar platform is te implementeren.

Voor een ETL-demonstratie bekijk een demo van Talend Open Studio. De manier waarop deze tool werkt is illustratief voor de meeste van dit soort tools.

Vraag of opmerking

Ik heb een vraag of opmerking over de informatie op deze pagina.