Shema zvezd in snežink v skladišču podatkov s primeri

Kazalo:

Anonim

Kaj je večdimenzionalna shema?

Večdimenzionalna shema je posebej zasnovana za modeliranje sistemov za shranjevanje podatkov. Sheme so zasnovane tako, da ustrezajo edinstvenim potrebam zelo velikih zbirk podatkov, zasnovanih za analitični namen (OLAP).

Vrste sheme skladišča podatkov:

Sledijo tri glavne vrste večdimenzionalnih shem, od katerih ima vsaka svoje edinstvene prednosti.

  • Shema zvezd
  • Shema snežinke
  • Shema galaksije

V tej vadnici boste izvedeli več o-

  • Kaj je shema zvezd?
  • Kaj je shema snežinke?
  • Shema zvezd proti shemi snežink: ključne razlike
  • Kaj je shema Galaxy?
  • Kaj je shema zvezdnih gruč?

Kaj je shema zvezd?

Shema zvezd v podatkovnem skladišču, v kateri ima lahko središče zvezde eno tabelo dejstev in številne povezane tabele dimenzij. Znana je kot shema zvezd, saj po svoji strukturi spominja na zvezdo. Podatkovni model Star Schema je najpreprostejša vrsta sheme Data Warehouse. Znana je tudi kot shema zvezdnega združevanja in je optimizirana za poizvedovanje po velikih naborih podatkov.

V naslednjem primeru sheme zvezd je v središču tabela z dejstvi, ki vsebuje ključe za vsako tabelo dimenzij, kot so ID trgovca, ID modela, Datum_ID, Product_ID, Branch_ID in drugi atributi, kot so prodane enote in prihodek.

Primer diagrama sheme zvezd

Značilnosti zvezdne sheme:

  • Vsaka dimenzija v shemi zvezd je predstavljena z edino enodimenzionalno tabelo.
  • Tabela dimenzij naj vsebuje nabor atributov.
  • Tabela dimenzij je s tujim ključem združena s tabelo dejstev
  • Tabela dimenzij ni povezana med seboj
  • Tabela z informacijami bi vsebovala ključ in mero
  • Shemo Star je enostavno razumeti in zagotavlja optimalno uporabo diska.
  • Tabele dimenzij niso normalizirane. Na primer, na zgornji sliki Country_ID nima iskalne tabele Country, kot bi jo imela zasnova OLTP.
  • Shemo široko podpirajo orodja BI

Kaj je shema snežinke?

Shema snežinke v podatkovnem skladišču je logična razporeditev tabel v večdimenzionalni bazi podatkov, tako da je diagram ER podoben obliki snežinke. Shema snežinke je razširitev sheme zvezd in dodaja dodatne dimenzije. Tabele dimenzij so normalizirane, kar podatke razdeli v dodatne tabele.

V naslednjem primeru sheme snežinke je država nadalje normalizirana v posamezno tabelo.

Primer sheme snežinke

Značilnosti sheme snežinke:

  • Glavna prednost sheme snežinke je, da uporablja manj prostora na disku.
  • Shemi je dodana enostavnejša izvedba dimenzije
  • Zaradi več tabel se poizvedba zmanjša
  • Primarni izziv, s katerim se boste soočili med uporabo sheme snežinke, je ta, da morate zaradi več iskalnih tabel opraviti več vzdrževalnih del.

Shema zvezd proti shemi snežink: ključne razlike

Sledi ključna razlika med shemo zvezd in shemo snežink:

Shema zvezd Shema snežinke
Hierarhije dimenzij so shranjene v dimenzijski tabeli. Hierarhije so razdeljene v ločene tabele.
Vsebuje tabelo dejstev, obdano z dimenzijskimi tabelami. Ena tabela dejstev, obkrožena z dimenzijsko tabelo, ki so nato obdane z dimenzijsko tabelo
V shemi zvezd samo eno združevanje ustvari razmerje med tabelo dejstev in poljubnimi tabelami dimenzij. Shema snežinke zahteva veliko združitev za pridobivanje podatkov.
Preprosto oblikovanje DB. Zelo kompleksna zasnova DB.
Denormalizirana struktura podatkov in poizvedba se tudi hitreje izvajata. Normalizirana struktura podatkov.
Visoka stopnja redundance podatkov Zelo nizka raven podatkov
Tabela z eno dimenzijo vsebuje združene podatke. Podatki so razdeljeni v različne dimenzijske tabele.
Obdelava kock je hitrejša. Obdelava kocke je lahko počasna zaradi zapletenega spajanja.
Ponuja bolj uspešne poizvedbe z optimizacijo poizvedb Star Join. Tabele so lahko povezane z več dimenzijami. Shemo snežinke predstavlja centralizirana tabela dejstev, ki verjetno ni povezana z več dimenzijami.

Kaj je shema galaksije?

Galaxy Shema vsebuje dva dejstvo mizo, da je delež dimenzijskih tabel med njimi. Imenuje se tudi shema ozvezdja dejstev. Shema je videti kot zbirka zvezd, od tod tudi ime Galaxy Schema.

Primer sheme Galaxy

Kot lahko vidite v zgornjem primeru, obstajata dve tabeli dejstev

  1. Prihodki
  2. Izdelka.

V galaksiji sheme delnic se dimenzije imenujejo skladne dimenzije.

Značilnosti sheme Galaxy:

  • Mere v tej shemi so ločene v ločene dimenzije na podlagi različnih ravni hierarhije.
  • Če ima na primer geografija štiri ravni hierarhije, kot so regija, država, država in mesto, mora imeti shema Galaxy štiri dimenzije.
  • Poleg tega je tovrstno shemo mogoče zgraditi tako, da shemo z eno zvezdico razdelimo na več shem Star.
  • V tej shemi so dimenzije velike, ki jih je treba zgraditi na podlagi ravni hierarhije.
  • Ta shema je koristna za združevanje tabel dejstev za boljše razumevanje.

Kaj je shema zvezdnih gruč?

Shema snežinke vsebuje popolnoma razširjene hierarhije. Vendar pa to shemi lahko zaplete in zahteva dodatna združevanja. Po drugi strani pa shema zvezd vsebuje popolnoma strnjene hierarhije, kar lahko privede do odvečnosti. Torej, najboljša rešitev je lahko ravnovesje med tema dvema shemama, ki je zasnova sheme zvezdnih grozdov.

Primer sheme zvezdnih gruč

Prekrivajoče se dimenzije lahko najdete kot vilice v hierarhijah. Razdeljevanje se zgodi, ko entiteta deluje kot nadrejena oseba v dveh različnih dimenzijskih hierarhijah. Entitete vilic so bile nato opredeljene kot klasifikacija z razmerji ena proti več.

Povzetek:

  • Večdimenzionalna shema je posebej zasnovana za modeliranje sistemov podatkovnih skladišč
  • Shema zvezd je najpreprostejša vrsta sheme skladišča podatkov. Znana je kot shema zvezd, saj po svoji strukturi spominja na zvezdo.
  • Shema snežinke je razširitev sheme zvezd in dodaja dodatne dimenzije. Snežinka se ji reče, ker je njen diagram podoben snežinki.
  • V shemi zvezd samo eno združevanje definira razmerje med tabelo dejstev in morebitnimi tabelami dimenzij.
  • Shema zvezd vsebuje tabelo dejstev, obdano z dimenzijskimi tabelami.
  • Shema snežinke je obdana z dimenzijsko tabelo, ki so nato obdane z dimenzijsko tabelo
  • Shema snežinke zahteva veliko združitev za pridobivanje podatkov.
  • Shema Galaxy vsebuje dve tabeli dejstev, ki si delita tabele dimenzij. Imenuje se tudi shema ozvezdja dejstev.
  • Shema zvezdne kopice vsebuje atribute sheme zvezd in snežink.