Prenesite PDF
Sledijo pogosta vprašanja v intervjujih za sveže in izkušene HBase razvijalce.
1) Pojasnite, kaj je Hbase?
Hbase je stolpčno usmerjen sistem za upravljanje baz podatkov, ki deluje na vrhu HDFS (Hadoop Distribute File System). Hbase ni relacijska shramba podatkov in ne podpira jezika strukturiranih poizvedb, kot je SQL.
V Hbase glavno vozlišče uravnava strežnike gruče in regije za shranjevanje delov tabel in upravlja delo s podatki.
2) Pojasnite, zakaj uporabljati Hbase?
- Sistem za shranjevanje velike zmogljivosti
- Porazdeljena zasnova za velike mize
- Trgovine, usmerjene v stolpce
- Horizontalno prilagodljivo
- Visoka zmogljivost in razpoložljivost
- Osnovni cilj Hbase so milijoni stolpcev, tisoči različic in milijarde vrstic
- Za razliko od HDFS (Hadoop Distribute File System) podpira naključne CRUD operacije v realnem času
3) Omenite, katere so ključne komponente Hbase?
- Zookeeper: Opravlja usklajevalno delo med stranko in Hbase Maser
- Hbase Master: Hbase Master nadzira regijski strežnik
- RegionServer: RegionServer nadzira regijo
- Regija: Vsebuje pomnilniško shrambo podatkov (MemStore) in Hfile.
- Kataloške tabele: Kataloške tabele sestavljajo ROOT in META
4) Pojasnite, iz česa je sestavljen Hbase?
- Hbase je sestavljen iz niza tabel
- In vsaka tabela vsebuje vrstice in stolpce kot tradicionalna baza podatkov
- Vsaka tabela mora vsebovati element, definiran kot primarni ključ
- Stolpec Hbase označuje atribut predmeta
5) Omenite, koliko operativnih ukazov v Hbase?
Operativni ukaz v Hbases je približno pet vrst
- Pojdi
- Daj
- Izbriši
- Optično branje
- Povečanje
6) Pojasnite, kaj sta WAL in Hlog v Hbase?
WAL (Write Ahead Log) je podoben dnevniku MySQL BIN; beleži vse spremembe, ki se pojavijo v podatkih. To je standardna zaporedna datoteka podjetja Hadoop in v njej so shranjene datoteke HLogkey. Ti ključi so sestavljeni iz zaporedne številke in dejanskih podatkov in se uporabljajo za predvajanje še neobstoječih podatkov po zrušitvi strežnika. Torej, v denarju zaradi okvare strežnika WAL deluje kot življenjska črta in pridobiva izgubljene podatke.
7) Kdaj morate uporabiti Hbase?
- Velikost podatkov je velika: ko imate na voljo tone in milijone zapisov
- Popolna prenova: ko premikate RDBMS v Hbase, to štejete za popolno prenovo, nato pa zgolj za spremembo vrat.
- Ukazi brez SQL: imate več funkcij, kot so transakcije; notranji spoji, vtipkani stolpci itd.
- Naložbe v infrastrukturo: Hbase mora imeti dovolj grozda, da bo resnično koristen
8) Kaj so v Hbase družine stolpcev?
Družine stolpcev sestavljajo osnovno enoto fizičnega shranjevanja v Hbase, na katero se uporabljajo funkcije, kot so stiskanje.
9) Pojasnite, kaj je ključ vrstice?
Vrstni ključ določa aplikacija. Ker je tipka vrstice vnaprej določila kombinirani ključ, omogoča aplikaciji, da določi želeni vrstni red razvrščanja. Omogoča tudi logično razvrščanje celic v celice in zagotavlja, da so vse celice z isto vrstico vrstic nameščene na istem strežniku.
10) Pojasnite izbris v Hbase? Omenite, katere so tri vrste nagrobnih oznak v Hbase?
Ko izbrišete celico v Hbase, se podatki dejansko ne izbrišejo, temveč se nastavi nagrobni označevalnik, zaradi česar so izbrisane celice nevidne. Izbrisani Hbase se med zbijanjem dejansko odstranijo.
Obstajajo tri vrste nagrobnih oznak:
- Oznaka za brisanje različice: za brisanje označi eno različico stolpca
- Oznaka za brisanje stolpca: za brisanje označuje vse različice stolpca
- Oznaka za družinsko brisanje: za brisanje označi vse stolpce za družino stolpcev
11) Pojasnite, kako Hbase dejansko izbriše vrstico?
V Hbase, karkoli napišete, bo shranjeno iz RAM-a na disk, so ti zapisi na disk nespremenljivo stiskanje prepovedi. Med postopkom brisanja v Hbase glavni postopek zbijanja izbriše oznako, manjši pa ne. Pri običajnih brisanjih se izbriše nagrobnik - ti podatki, ki jih predstavljajo, se med stiskanjem odstranijo.
Če izbrišete podatke in dodate več podatkov, vendar s prejšnjim časovnim žigom kot časovni žig nagrobnega spomenika, bo nadaljnji Gets morda prikrit z oznako delete / tombstone, zato vstavljeno vrednost prejmete šele po večjem stiskanju.
12) Pojasnite, kaj se zgodi, če spremenite velikost bloka družine stolpcev v že zasedeni bazi podatkov?
Ko spremenite velikost bloka družine stolpcev, novi podatki zasedejo novo velikost bloka, medtem ko stari podatki ostanejo znotraj stare velikosti bloka. Med stiskanjem podatkov bodo stari podatki dobili novo velikost bloka. Ko se datoteke izpraznijo, imajo novo velikost bloka, medtem ko se bodo obstoječi podatki še naprej pravilno brali. Po naslednjem večjem zbijanju je treba vse podatke pretvoriti v novo velikost bloka.
13) Omenite razliko med Hbase in relacijsko bazo podatkov?
Hbase | Relacijska zbirka podatkov |
|
|
14) Kaj je razred HBaseFsck?
V HBase je na voljo ime orodja z imenom back, ki ga izvaja razred HBaseFsck. Ponuja več stikal ukazne vrstice, ki vplivajo na njegovo vedenje.
15) Katere so glavne ključne strukture HBase?
Ključ vrstice in ključ stolpca sta dve najpomembnejši ključni strukturi, ki se uporabljata v HBase
16) Pogovorite se o uporabi filtrov v Apache HBase
Filtri v lupini HBase. Predstavljen je bil v Apache HBase 0.92, ki vam pomaga pri filtriranju na strani strežnika za dostop do HBase prek lupine ali varčnosti HBase.
17) Sintaksna struktura podpore HBase, kot je SQL, da ali ne?
Ne, podpora SQL za HBase trenutno ni na voljo. Vendar lahko z uporabo Apache Phoenix pridobimo podatke iz HBase s pomočjo SQL poizvedb.
18) Kaj pomeni zbijanje v HBase?
V času težkih dohodnih zapisov ni mogoče doseči optimalne učinkovitosti, če imate eno datoteko na trgovino. HBase vam pomaga kombinirati vse te datoteke HFi, da zmanjšate število semen diska za vsako branje. Ta postopek je znan tudi kot Zbijanje v HBase.
19) Kako boste izvedli pridružitve v HBase?
HBase, ne podpira združitev neposredno, vendar uporablja poizvedbe za pridružitev opravil MapReduce, je mogoče implementirati s pridobivanjem podatkov s pomočjo različnih tabel HBase.
20) Pojasnite JMX glede HBSE
Java Management Extensions ali JMX je izvozni status aplikacij Java je standard zanje.
21) Kakšna je uporaba MasterServerja?
Master sever vam pomaga dodeliti regijo tudi regijskemu strežniku. Pomaga vam tudi pri izravnavi obremenitve, ki jo uporabljamo MasterServer.
22) Določite izraz varčnost
Apache Thrift je napisan v jeziku C ++. Ponuja prevajalnike shem za različne programske jezike, kot so C ++, Perl, PHP, Python, Ruby in drugi.
23) Zakaj uporabljati razred HColumnDescriptor?
Podrobnosti o družini stolpcev, kot so nastavitve stiskanja, Število različic, se shranijo v. HColumnDescriptor.
24) Kaj je celica v HBase?
Celica v HBase je najmanjša enota tabele Hbase. Pomaga vam, če imate del podatkov v obliki nabora {vrstica, stolpec, različica}
25) Kaj je Bloom filter?
HBase podpira Bloom Filter, ki vam pomaga izboljšati splošno prepustnost grozda. Filter HBase Bloom je vesoljsko učinkovit mehanizem za preizkušanje, ali HFile vključuje določeno vrstico ali vrstico.
26) Povejte mi o vrstah operacij HBase?
Odgovori Dve vrsti operacij HBase sta:
- Preberite Operation
- Napiši operacijo
27) Kakšna je uporaba HBase HMaster?
Glavne naloge mojstra so:
- Usklajevanje regijskih strežnikov
- Skrbniške funkcije
28) Katero tehniko lahko uporabite v HBase za neposreden dostop do datoteke HFile brez pomoči HBase?
Za neposreden dostop do HFile brez uporabe HBase uporabljamo metodo HFile.main ().
29) Ali se lahko regijski strežnik nahaja na vseh DataNodes?
Da, Regijski strežniki se izvajajo na istih strežnikih kot DataNodes
30) Poimenujte filter, ki sprejema velikost strani kot parameter v HBase
Filter z imenom PageFilter kot parameter sprejme velikost strani.
Ta dokument je sestavljen z orodji za takojšnje pretvorbo HTML.
- Naslednji