ETL vs ELT: mora vedeti razlike

Kazalo:

Anonim

Kaj je ETL?

ETL je okrajšava od Extract, Transform and Load. V tem postopku orodje ETL izvleče podatke iz različnih izvornih sistemov RDBMS, nato podatke pretvori, na primer z uporabo izračunov, združitev itd., In nato podatke naloži v sistem Data Warehouse.

V ETL so podatki tokovi od vira do cilja. V procesu preoblikovanja ETL motor skrbi za kakršne koli spremembe podatkov.

Kaj je ELT?

ELT je drugačna metoda pogleda na orodni pristop k prenosu podatkov. Namesto da pretvori podatke, preden so zapisani, ELT dovoli ciljnemu sistemu, da opravi preoblikovanje. Podatki so bili najprej kopirani na cilj in nato transformirani na svoje mesto.

ELT se običajno uporablja z bazami podatkov brez SQL, kot so grozd Hadoop, podatkovna naprava ali namestitev v oblaku.

KLJUČNA RAZLIKA

  • ETL pomeni Extract, Transform in Load, medtem ko ELT pomeni Extract, Load, Transform.
  • ETL naloži podatke najprej v uprizoritveni strežnik in nato v ciljni sistem, medtem ko ELT naloži podatke neposredno v ciljni sistem.
  • Model ETL se uporablja za krajevne, relacijske in strukturirane podatke, ELT pa za razširljive strukturirane in nestrukturirane vire podatkov v oblaku.
  • ETL se večinoma uporablja za majhno količino podatkov, medtem ko se ELT uporablja za velike količine podatkov.
  • ETL ne zagotavlja podpore za podatkovno jezero, medtem ko ELT zagotavlja podporo za podatkovno jezero.
  • ETL je enostaven za izvajanje, medtem ko ELT zahteva nišne spretnosti za izvajanje in vzdrževanje.

Razlika med ETL in ELT

Postopki ETL in ELT se razlikujejo po naslednjih parametrih:

Parametri ETL ELT
Proces Podatki se pretvorijo na uprizoritvenem strežniku in nato prenesejo v Datawarehouse DB. Podatki ostanejo v DB zbirke podatkov.
Uporaba kode Uporablja za
  • Računalniško intenzivne transformacije
  • Majhna količina podatkov
Uporablja se za velike količine podatkov
Preobrazba Transformacije se izvajajo v strežniku / uprizoritvenem območju ETL. Transformacije se izvajajo v ciljnem sistemu
Časovna obremenitev Podatki so se najprej naložili v uprizoritev in pozneje v ciljni sistem. Čas intenzivno. Podatki so naloženi v ciljni sistem samo enkrat. Hitreje.
Časovna transformacija Proces ETL mora počakati, da se preobrazba konča. Ko velikost podatkov narašča, se čas transformacije povečuje. V postopku ELT hitrost ni nikoli odvisna od velikosti podatkov.
Vzdrževanje časa Potrebuje visoko vzdrževanje, saj morate izbrati podatke za nalaganje in preoblikovanje. Nizko vzdrževanje, saj so podatki vedno na voljo.
Kompleksnost izvedbe V zgodnji fazi lažje za izvajanje. Za izvajanje procesa ELT mora organizacija imeti poglobljeno znanje orodij in strokovne spretnosti.
Podpora za podatkovno skladišče Model ETL, ki se uporablja za krajevne, relacijske in strukturirane podatke. Uporablja se v razširljivi infrastrukturi v oblaku, ki podpira strukturirane, nestrukturirane vire podatkov.
Podpora za Data Lake Ne podpira. Omogoča uporabo Data Lake z nestrukturiranimi podatki.
Kompleksnost Proces ETL naloži samo pomembne podatke, kot so bili opredeljeni v času načrtovanja. Ta postopek vključuje razvoj od rezultata nazaj in nalaganje samo ustreznih podatkov.
Stroški Visoki stroški za mala in srednje velika podjetja. Nizki vstopni stroški uporabe spletne programske opreme kot storitvene platforme.
Iskanje V postopku ETL morajo biti na območju uprizoritve na voljo dejstva in dimenzije. Vsi podatki bodo na voljo, ker se izvleček in nalaganje izvedeta z enim samim dejanjem.
Združevanja Kompleksnost se poveča z dodatno količino podatkov v naboru podatkov. Zmog ciljne platforme lahko hitro obdela veliko količino podatkov.
Izračuni Prepiše obstoječi stolpec ali Treba je dodati nabor podatkov in potisniti na ciljno platformo. Izračunani stolpec enostavno dodajte v obstoječo tabelo.
Zrelost Postopek se uporablja več kot dve desetletji. Je dobro dokumentiran in najboljše prakse so lahko dostopne. Sorazmerno nov koncept in zapleten za izvedbo.
Strojna oprema Večina orodij ima edinstvene strojne zahteve, ki so drage. Biti stroški strojne opreme Saas ni problem.
Podpora za nestrukturirane podatke Večinoma podpira relacijske podatke Takoj na voljo podpora za nestrukturirane podatke.