Kaj je OLAP? Kocka, Operacije & Vrste v podatkovnem skladišču

Kazalo:

Anonim

Kaj je OLAP?

Spletna analitična obdelava (OLAP) je kategorija programske opreme, ki uporabnikom omogoča analizo informacij iz več sistemov baz podatkov hkrati. To je tehnologija, ki analitikom omogoča pridobivanje in ogled poslovnih podatkov z različnih stališč.

Analitiki morajo pogosto zbirati, združevati in združevati podatke. Te operacije v relacijskih zbirkah podatkov zahtevajo veliko virov. Z OLAP je mogoče podatke predhodno izračunati in vnaprej združiti, kar omogoča hitrejšo analizo.

Zbirke podatkov OLAP so razdeljene na eno ali več kock. Kocke so zasnovane tako, da je ustvarjanje in ogled poročil enostavno. OLAP je kratica za spletno analitično obdelavo.

V tej vadnici boste izvedeli-

  • Kocka OLAP
  • Osnovne analitične operacije OLAP
  • Vrste sistemov OLAP
  • ROLAP
  • MOLAP
  • Hibridni OLAP
  • Prednosti OLAP
  • Slabosti OLAP

Kocka OLAP:

V jedru koncepta OLAP je kocka OLAP. Kocka OLAP je podatkovna struktura, optimizirana za zelo hitro analizo podatkov.

Kocko OLAP sestavljajo številčna dejstva, imenovana merila, ki so razvrščena po dimenzijah. Kocko OLAP imenujemo tudi hiperkocka .

Ponavadi se podatkovne operacije in analize izvajajo s pomočjo preproste preglednice, kjer so vrednosti podatkov razporejene v obliki vrstic in stolpcev. To je idealno za dvodimenzionalne podatke. Vendar OLAP vsebuje večdimenzionalne podatke, pri čemer so podatki običajno pridobljeni iz drugega in nepovezanega vira. Uporaba preglednice ni optimalna možnost. Kocka lahko shranjuje in analizira večdimenzionalne podatke na logičen in urejen način.

Kako deluje?

Podatkovno skladišče bi pridobivalo informacije iz več podatkovnih virov in formatov, kot so besedilne datoteke, excel list, večpredstavnostne datoteke itd.

Izvlečeni podatki se očistijo in spremenijo. Podatki se naložijo na strežnik OLAP (ali kocko OLAP), kjer se informacije predhodno izračunajo za nadaljnjo analizo.

Osnovne analitične operacije OLAP

Štiri vrste analitičnih operacij v OLAP so:

  1. Zavihamo
  2. Zvrtaj dol
  3. Rezine in kocke
  4. Vrtenje (vrtenje)

1) Zbiranje:

Zbiranje je znano tudi kot "konsolidacija" ali "združevanje". Operacija zvijanja se lahko izvede na dva načina

  1. Zmanjševanje dimenzij
  2. Vzpenjanje po hierarhiji konceptov. Hierarhija konceptov je sistem združevanja stvari glede na njihov vrstni red ali raven.

Upoštevajte naslednji diagram

  • V tem primeru mesta New Jersey in Lost Angles in se zgrnejo v državo ZDA
  • Podatki o prodaji New Jerseyja in Los Angelesa znašajo 440 oziroma 1560. Po uvedbi postanejo 2000
  • V tem postopku združevanja podatkov se hierarhija lokacij premika od mesta do države.
  • V postopku navijanja je treba odstraniti vsaj eno ali več dimenzij. V tem primeru je razsežnost Quater odstranjena.

2) Vrtanje navzdol

Pri vrtanju so podatki razdrobljeni na manjše dele. Je nasprotje postopka zbiranja. To je mogoče storiti prek

  • Premikanje po hierarhiji koncepta
  • Povečanje dimenzije

Upoštevajte zgornji diagram

  • Četrtletje Q1 je razdeljeno na mesece januar, februar in marec. Ustrezne prodaje so tudi registri.
  • V tem primeru so dodani dimenzijski meseci.

3) Rezina:

Tu je izbrana ena dimenzija in ustvarjena je nova podkocka.

Naslednji diagram razloži, kako je bila izvedena operacija rezanja:

  • Dimenzijski čas je kot filter narezan na Q1.
  • V celoti je ustvarjena nova kocka.

Kocke:

Ta postopek je podoben rezini. Razlika v kockah je v tem, da izberete dve ali več dimenzij, ki povzročijo ustvarjanje podkocke.

4) Pivot

V Pivotu zasukate osi podatkov, da zagotovite nadomestno predstavitev podatkov.

V naslednjem primeru pivot temelji na vrstah postavk.

Vrste sistemov OLAP

Hierarhična struktura OLAP

Vrsta OLAP Pojasnilo
Relacijski OLAP (ROLAP): ROLAP je razširjeni RDBMS skupaj z večdimenzionalnim preslikavanjem podatkov za izvajanje standardne relacijske operacije.
Večdimenzionalni OLAP (MOLAP) MOLAP izvaja operacijo v večdimenzionalnih podatkih.
Hibridna spletna analitična obdelava (HOLAP) Pri pristopu HOLAP se agregirani vsoti shranijo v večdimenzionalno bazo podatkov, podrobni podatki pa v relacijski bazi podatkov. To ponuja tako podatkovno učinkovitost modela ROLAP kot zmogljivost modela MOLAP.
Namizni OLAP (DOLAP) V namiznem OLAP uporabnik del podatkov prenese iz baze podatkov lokalno ali na svoje namizje in jih analizira. DOLAP je razmeroma cenejši za uporabo, saj ponuja zelo malo funkcij v primerjavi z drugimi sistemi OLAP.
Spletni OLAP (WOLAP) Spletni OLAP, ki je sistem OLAP, dostopen prek spletnega brskalnika. WOLAP je tristopenjska arhitektura. Sestavljen je iz treh komponent: odjemalca, vmesne programske opreme in strežnika baz podatkov.
Mobilni OLAP: Mobilni OLAP pomaga uporabnikom dostopati do podatkov OLAP in jih analizirati s pomočjo svojih mobilnih naprav
Prostorski OLAP: SOLAP je ustvarjen za lažje upravljanje prostorskih in neprostorskih podatkov v geografskem informacijskem sistemu (GIS)

ROLAP

ROLAP deluje s podatki, ki obstajajo v relacijski bazi podatkov. Dejstva in dimenzijske tabele so shranjene kot relacijske tabele. Omogoča tudi večdimenzionalno analizo podatkov in je najhitreje rastoči OLAP.

Prednosti modela ROLAP:

  • Visoka podatkovna učinkovitost. Ponuja visoko podatkovno učinkovitost, saj sta zmogljivost poizvedb in jezik dostopa optimizirana zlasti za večdimenzionalno analizo podatkov.
  • Razširljivost. Ta vrsta sistema OLAP ponuja razširljivost za upravljanje velikih količin podatkov, tudi če se podatki nenehno povečujejo.

Slabosti modela ROLAP:

  • Povpraševanje po višjih virih: ROLAP potrebuje veliko izkoriščenosti delovne sile, programske in strojne opreme.
  • Združene omejitve podatkov. Orodja ROLAP uporabljajo SQL za vse izračune združenih podatkov. Vendar pa ni določenih omejitev za obdelavo izračunov.
  • Počasno izvajanje poizvedb. Uspešnost poizvedb v tem modelu je počasna v primerjavi z MOLAP

MOLAP

MOLAP za prikaz večdimenzionalnih pogledov podatkov uporablja večdimenzionalne pomnilniške mehanizme, ki temeljijo na nizih. V bistvu uporabljajo kocko OLAP.

Več o OLAP lahko preberete tukaj

Hibridni OLAP

Hibridni OLAP je mešanica ROLAP-a in MOLAP-a. Ponuja hiter izračun MOLAP in večjo razširljivost ROLAP. HOLAP uporablja dve bazi podatkov.

  1. Združeni ali izračunani podatki so shranjeni v večdimenzionalni kocki OLAP
  2. Podrobne informacije so shranjene v relacijski bazi podatkov.

Prednosti hibridnega OLAP:

  • Ta vrsta OLAP pomaga prihraniti prostor na disku in je tudi kompaktna, kar pomaga preprečiti težave, povezane s hitrostjo in udobjem dostopa.
  • Hibridni HOLAP uporablja tehnologijo kock, ki omogoča hitrejše delovanje za vse vrste podatkov.
  • ROLAP se takoj posodobi in uporabniki HOLAP-a imajo dostop do teh takojšnje posodobljenih podatkov v realnem času. MOLAP prinaša čiščenje in pretvorbo podatkov ter s tem izboljšuje ustreznost podatkov. To prinaša najboljše iz obeh svetov.

Pomanjkljivosti hibridnega OLAP:

  • Večja stopnja zapletenosti : Glavna pomanjkljivost sistemov HOLAP je ta, da podpira tako orodja kot aplikacije ROLAP in MOLAP. Tako je zelo zapleteno.
  • Potencialna prekrivanja : večje so možnosti za prekrivanje, zlasti v njihovih funkcionalnostih.

Prednosti OLAP

  • OLAP je platforma za vse vrste poslov, vključno z načrtovanjem, pripravo proračuna, poročanjem in analizami.
  • Informacije in izračuni so skladni v kocki OLAP. To je ključna prednost.
  • Hitro ustvarite in analizirajte scenarije "Kaj če"
  • Preprosto poiščite široko ali specifične izraze v bazi podatkov OLAP.
  • OLAP ponuja gradnike za orodja za poslovno modeliranje, orodja za rudarjenje podatkov in orodja za poročanje o uspešnosti.
  • Uporabnikom omogoča, da podatke o kockah narežejo na kocke, vse po različnih dimenzijah, merilih in filtrih.
  • Dober je za analizo časovnih vrst.
  • Z OLAP je enostavno najti nekaj skupin in odstopanj.
  • Gre za zmogljiv vizualizacijski spletni analitični procesni sistem, ki zagotavlja hitrejši odzivni čas

Slabosti OLAP

  • OLAP zahteva organiziranje podatkov v shemo zvezde ali snežinke. Te sheme so zapletene za izvajanje in upravljanje
  • V eni kocki OLAP ne morete imeti velikega števila dimenzij
  • Do podatkov o transakcijah ni mogoče dostopati s sistemom OLAP.
  • Vsaka sprememba v kocki OLAP potrebuje popolno posodobitev kocke. To je dolgotrajen postopek

Povzetek:

  • OLAP je tehnologija, ki analitikom omogoča pridobivanje in ogled poslovnih podatkov z različnih stališč.
  • V jedru koncepta OLAP je kocka OLAP.
  • Za različne poslovne aplikacije in druge podatkovne operacije je potrebna uporaba OLAP Cube.
  • V OLAP obstaja pet glavnih vrst analitičnih operacij: 1) zlaganje 2) vrtanje navzdol 3) rezina 4) kocke in 5) pivot
  • Tri vrste sistemov OLAP, ki se pogosto uporabljajo, so MOLAP, ROLAP in Hybrid OLAP.
  • Namizni OLAP, spletni OLAP in mobilni OLAP so nekatere druge vrste sistemov OLAP.