V tej vadnici lahko opazite operacije tabel, kot so ustvarjanje, spreminjanje in spuščanje tabel v Hive.
Na spodnjem posnetku zaslona ustvarjamo tabelo s stolpci in spreminjamo ime tabele.
1. Ustvarjanje tabele guru_sample z dvema imenoma stolpcev, kot sta "empid" in "empname"
2. Prikaz tabel v bazi podatkov guru99
3. Guru_sample prikaz pod tabelami
4. Spreminjanje tabele "guru_sample" kot "guru_sampleNew"
5. Ko znova izvedete ukaz "show", bo prikazal novo ime Guru_sampleNew
Dropping table guru_sampleNew:
Vrste tabel in njihova uporaba:
Prihod do tabel je podoben načinu, ki ga ustvarjamo v tradicionalnih relacijskih zbirkah podatkov. Funkcije, kot so filtriranje, združevanja, se lahko izvajajo na mizah.
Hive obravnava dve vrsti struktur tabel, kot so notranje in zunanje tabele, odvisno od nalaganja in zasnove sheme v Hive.
Notranje tabele
- Notranja tabela je tesno povezana. V tej vrsti tabel moramo najprej ustvariti tabelo in naložiti podatke.
- Temu lahko rečemo kot podatki na shemi .
- Če spustite to tabelo, bodo odstranjeni tako podatki kot shema.
- Shranjeno mesto te tabele bo na / user / panj / skladišče.
Kdaj izbrati interno tabelo:
- Če so podatki o obdelavi na voljo v lokalnem datotečnem sistemu
- Če želimo, da Hive upravlja celoten življenjski cikel podatkov, vključno z brisanjem
Vzorec delčka kode za interno tabelo
1. Ustvarjanje notranje tabele
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Naložite podatke v notranjo tabelo
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Prikažite vsebino tabele
Hive>select * from guruhive_internaltable;
4. Spustite interno tabelo
Hive>DROP TABLE guruhive_internaltable;
Če ste opustili guruhive_internaltable, vključno z njegovimi metapodatki in podatki bodo izbrisani iz Hive.
Na naslednjem posnetku zaslona lahko opazimo izhod
V zgornji kodi in na posnetku zaslona delamo naslednje stvari,
- Ustvari notranjo tabelo
- Podatke naložite v interno tabelo
- Prikažite vsebino tabele
- Če želite spustiti notranjo tabelo
Zunanje mize
- Zunanja miza je v naravi ohlapno povezana. Podatki bodo na voljo v HDFS. Tabela bo ustvarjena na podatkih HDFS.
- Drugače lahko rečemo, kot da ustvarja shemo podatkov .
- V času, ko spustite tabelo, ta izpusti samo shemo, bodo podatki še vedno na voljo v HDFS kot prej.
- Zunanje tabele ponujajo možnost ustvarjanja več shem za podatke, shranjene v HDFS, namesto da bi jih izbrisali vsakič, ko se shema posodobi
Kdaj izbrati zunanjo tabelo:
- Če so podatki obdelave na voljo v HDFS
- Uporabno, kadar se datoteke uporabljajo zunaj Panja
Vzorec delčka kode za zunanjo tabelo
1. Ustvari zunanjo tabelo
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Če v času ustvarjanja tabele ne določimo lokacije, lahko podatke naložimo ročno
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Prikažite vsebino tabele
Hive>select * from guruhive_external;
4. Spustite interno tabelo
Hive>DROP TABLE guruhive_external;
Iz naslednjega posnetka zaslona lahko opazimo izhod
V zgornji kodi delamo naslednje stvari
- Ustvarite zunanjo tabelo
- Podatke naložite v zunanjo tabelo
- Prikažite vsebino tabele
- Spuščanje zunanje mize
Razlika med notranjimi in zunanjimi tabelami
Značilnost | Notranji | Zunanji |
---|---|---|
Shema | Podatki o shemi | Shema podatkov |
Mesto shranjevanja | / usr / panj / skladišče | Lokacija HDFS |
Razpoložljivost podatkov | Znotraj lokalnega datotečnega sistema | Znotraj HDFS |