Kaj je ETL?
ETL je okrajšava od Extract, Transform and Load. V tem postopku orodje ETL izvleče podatke iz različnih izvornih sistemov RDBMS, nato podatke pretvori, na primer z uporabo izračunov, združitev itd., In nato podatke naloži v sistem Data Warehouse.
V ETL so podatki tokovi od vira do cilja. V procesu preoblikovanja ETL motor skrbi za kakršne koli spremembe podatkov.
Kaj je ELT?
ELT je drugačna metoda pogleda na orodni pristop k prenosu podatkov. Namesto da pretvori podatke, preden so zapisani, ELT dovoli ciljnemu sistemu, da opravi preoblikovanje. Podatki so bili najprej kopirani na cilj in nato transformirani na svoje mesto.
ELT se običajno uporablja z bazami podatkov brez SQL, kot so grozd Hadoop, podatkovna naprava ali namestitev v oblaku.
KLJUČNA RAZLIKA
- ETL pomeni Extract, Transform in Load, medtem ko ELT pomeni Extract, Load, Transform.
- ETL naloži podatke najprej v uprizoritveni strežnik in nato v ciljni sistem, medtem ko ELT naloži podatke neposredno v ciljni sistem.
- Model ETL se uporablja za krajevne, relacijske in strukturirane podatke, ELT pa za razširljive strukturirane in nestrukturirane vire podatkov v oblaku.
- ETL se večinoma uporablja za majhno količino podatkov, medtem ko se ELT uporablja za velike količine podatkov.
- ETL ne zagotavlja podpore za podatkovno jezero, medtem ko ELT zagotavlja podporo za podatkovno jezero.
- ETL je enostaven za izvajanje, medtem ko ELT zahteva nišne spretnosti za izvajanje in vzdrževanje.
Razlika med ETL in ELT
Postopki ETL in ELT se razlikujejo po naslednjih parametrih:
Parametri | ETL | ELT |
---|---|---|
Proces | Podatki se pretvorijo na uprizoritvenem strežniku in nato prenesejo v Datawarehouse DB. | Podatki ostanejo v DB zbirke podatkov. |
Uporaba kode | Uporablja za
| Uporablja se za velike količine podatkov |
Preobrazba | Transformacije se izvajajo v strežniku / uprizoritvenem območju ETL. | Transformacije se izvajajo v ciljnem sistemu |
Časovna obremenitev | Podatki so se najprej naložili v uprizoritev in pozneje v ciljni sistem. Čas intenzivno. | Podatki so naloženi v ciljni sistem samo enkrat. Hitreje. |
Časovna transformacija | Proces ETL mora počakati, da se preobrazba konča. Ko velikost podatkov narašča, se čas transformacije povečuje. | V postopku ELT hitrost ni nikoli odvisna od velikosti podatkov. |
Vzdrževanje časa | Potrebuje visoko vzdrževanje, saj morate izbrati podatke za nalaganje in preoblikovanje. | Nizko vzdrževanje, saj so podatki vedno na voljo. |
Kompleksnost izvedbe | V zgodnji fazi lažje za izvajanje. | Za izvajanje procesa ELT mora organizacija imeti poglobljeno znanje orodij in strokovne spretnosti. |
Podpora za podatkovno skladišče | Model ETL, ki se uporablja za krajevne, relacijske in strukturirane podatke. | Uporablja se v razširljivi infrastrukturi v oblaku, ki podpira strukturirane, nestrukturirane vire podatkov. |
Podpora za Data Lake | Ne podpira. | Omogoča uporabo Data Lake z nestrukturiranimi podatki. |
Kompleksnost | Proces ETL naloži samo pomembne podatke, kot so bili opredeljeni v času načrtovanja. | Ta postopek vključuje razvoj od rezultata nazaj in nalaganje samo ustreznih podatkov. |
Stroški | Visoki stroški za mala in srednje velika podjetja. | Nizki vstopni stroški uporabe spletne programske opreme kot storitvene platforme. |
Iskanje | V postopku ETL morajo biti na območju uprizoritve na voljo dejstva in dimenzije. | Vsi podatki bodo na voljo, ker se izvleček in nalaganje izvedeta z enim samim dejanjem. |
Združevanja | Kompleksnost se poveča z dodatno količino podatkov v naboru podatkov. | Zmog ciljne platforme lahko hitro obdela veliko količino podatkov. |
Izračuni | Prepiše obstoječi stolpec ali Treba je dodati nabor podatkov in potisniti na ciljno platformo. | Izračunani stolpec enostavno dodajte v obstoječo tabelo. |
Zrelost | Postopek se uporablja več kot dve desetletji. Je dobro dokumentiran in najboljše prakse so lahko dostopne. | Sorazmerno nov koncept in zapleten za izvedbo. |
Strojna oprema | Večina orodij ima edinstvene strojne zahteve, ki so drage. | Biti stroški strojne opreme Saas ni problem. |
Podpora za nestrukturirane podatke | Večinoma podpira relacijske podatke | Takoj na voljo podpora za nestrukturirane podatke. |