Proces ETL - centralizacja rozproszonych danych do spójnej i jednolitej struktury
Skontaktuj się z nami
Wraz z postępującą cyfryzacją rośnie liczba systemów informatycznych i danych jakie przechowują. Zdarza się, że różne systemy przechowują podobne lub nawet takie same informacje. Kiedy pojawia się potrzeba połączenia danych z różnych źródeł w całość, mogą pojawić się różne problemy związane z różną strukturą lub formą zapisu.
Proces ETL ma za zadanie wspomóc centralizację danych uspójniająć je np. usuwając duplikaty, wprowadzając jednolity zapis wycofanych produktów, rozdzielając adres z jednego pola na kilka cech.
Czym jest proces ETL?
Proces ETL (z ang. Extract, Transform, Load) - proces przekształcania nieustrukturyzowanych lub rozproszonych danych, w jednolitą strukturę dającą spójne i jednorodne dane. Dzięki temu możliwa jest szybka weryfikacja jakości i kompletności danych, analiza tych danych lub wprowadzenie standardu klasyfikacji. Proces ten jest wskazany kiedy dane z różnich źródeł są łączone w jedną strukturę np. na potrzeby systemu PIM/MDM lub Business Intelligence.
Proces składa się z trzech części: ekstrakcji z różnych źródeł i struktur, transformacji w jeden model danych i załadowania go do miejsca docelowego.
ETL vs. ELT
Proces ELT (z ang. Extract, Load, Transform) - zmodyfikowany proces ETL, w którym etapy ładowania danych i transformacji są zamienione kolejnością. Dane są ładowane od razu do systemu docelowego, tam następują transformacje i zmiana struktury. Eliminuje to przechowywanie i przetwarzanie danych w wielu miejscach.
Wdrożenie procesu ETL / ELT
Kluczowym elementem wdrożenia jest narzędzie do procesu ETL / ELT. Wybór narzędzia i rodzaju procesu ETL / ELT zależy od miejsca docelowego. Dzieje się tak ze względu na koszty, posiadane kompetencje i otoczenie technologiczne.
Jeśli systemem docelowym byłby Tableau, to najlepszym wyborem będzie Tableau Prep. W przypadku technologii Microsoftu będzie to SSIS (SQL Server Integration Services).
Kiedy celem jednolitej struktury danych jest system PIM lub MDM najlepiej jego wykorzystać jako narzędzie do procesu ETL / ELT. Przykładowo platforma Pimcore może być wykorzystana w ten sposób. Korzyścią jest ogromna elastyczność w transofrmacji, bo są możliwe wszystkie opcje jakie daje język programowania. Drugą stroną medalu jest brak graficznego interfejsu, w którym zazwyczaj wybiera się transformacje danych.
Czym jest Pimcore?
Pimcore to platforma open-source, która mocno różni się od innych systemów PIM i platform e-commerce. Zawdzięcza to swoim początkom jako system PIM/MDM służący do zarządzania danymi produktów. Dzięki temu ma bardzo elastyczną architekturę, pozwalającą nadać dowolną strukturę lub skorzystać z już istniejącej w ramach standardu np. systemu klasyfikacji ETIM.
Innym przykładem jest zastosowanie jako narzędzie ETL/ELT, w którym dane przechodzą różne transformacje, zanim trafią do docelowej struktury.
Tak kompleksowa platforma pozwala na zaspokojenie wszystkich potrzeb bez pisania wszystkiego od początku. Nie dziwi więc duże zadowolenie klientów, mające swoje odzwierciedlenie w wyróżnieniach Instytutu badawczego Gartnera dla e-commerce i innych kategoriach. Dowiedz się więcej o platformie Pimcore.