Hive Create, Alter & Spustite tabelo

Kazalo:

Anonim

V tej vadnici lahko opazite operacije tabel, kot so ustvarjanje, spreminjanje in spuščanje tabel v Hive.

Na spodnjem posnetku zaslona ustvarjamo tabelo s stolpci in spreminjamo ime tabele.

1. Ustvarjanje tabele guru_sample z dvema imenoma stolpcev, kot sta "empid" in "empname"

2. Prikaz tabel v bazi podatkov guru99

3. Guru_sample prikaz pod tabelami

4. Spreminjanje tabele "guru_sample" kot "guru_sampleNew"

5. Ko znova izvedete ukaz "show", bo prikazal novo ime Guru_sampleNew

Dropping table guru_sampleNew:

Vrste tabel in njihova uporaba:

Prihod do tabel je podoben načinu, ki ga ustvarjamo v tradicionalnih relacijskih zbirkah podatkov. Funkcije, kot so filtriranje, združevanja, se lahko izvajajo na mizah.

Hive obravnava dve vrsti struktur tabel, kot so notranje in zunanje tabele, odvisno od nalaganja in zasnove sheme v Hive.

Notranje tabele

  • Notranja tabela je tesno povezana. V tej vrsti tabel moramo najprej ustvariti tabelo in naložiti podatke.
  • Temu lahko rečemo kot podatki na shemi .
  • Če spustite to tabelo, bodo odstranjeni tako podatki kot shema.
  • Shranjeno mesto te tabele bo na / user / panj / skladišče.

Kdaj izbrati interno tabelo:

  • Če so podatki o obdelavi na voljo v lokalnem datotečnem sistemu
  • Če želimo, da Hive upravlja celoten življenjski cikel podatkov, vključno z brisanjem

Vzorec delčka kode za interno tabelo

1. Ustvarjanje notranje tabele

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';

2. Naložite podatke v notranjo tabelo

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Prikažite vsebino tabele

 Hive>select * from guruhive_internaltable;

4. Spustite interno tabelo

 Hive>DROP TABLE guruhive_internaltable;

Če ste opustili guruhive_internaltable, vključno z njegovimi metapodatki in podatki bodo izbrisani iz Hive.

Na naslednjem posnetku zaslona lahko opazimo izhod

V zgornji kodi in na posnetku zaslona delamo naslednje stvari,

  • Ustvari notranjo tabelo
  • Podatke naložite v interno tabelo
  • Prikažite vsebino tabele
  • Če želite spustiti notranjo tabelo

Zunanje mize

  • Zunanja miza je v naravi ohlapno povezana. Podatki bodo na voljo v HDFS. Tabela bo ustvarjena na podatkih HDFS.
  • Drugače lahko rečemo, kot da ustvarja shemo podatkov .
  • V času, ko spustite tabelo, ta izpusti samo shemo, bodo podatki še vedno na voljo v HDFS kot prej.
  • Zunanje tabele ponujajo možnost ustvarjanja več shem za podatke, shranjene v HDFS, namesto da bi jih izbrisali vsakič, ko se shema posodobi

Kdaj izbrati zunanjo tabelo:

  • Če so podatki obdelave na voljo v HDFS
  • Uporabno, kadar se datoteke uporabljajo zunaj Panja

Vzorec delčka kode za zunanjo tabelo

1. Ustvari zunanjo tabelo

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;

2. Če v času ustvarjanja tabele ne določimo lokacije, lahko podatke naložimo ročno

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Prikažite vsebino tabele

 Hive>select * from guruhive_external;

4. Spustite interno tabelo

 Hive>DROP TABLE guruhive_external;

Iz naslednjega posnetka zaslona lahko opazimo izhod

V zgornji kodi delamo naslednje stvari

  • Ustvarite zunanjo tabelo
  • Podatke naložite v zunanjo tabelo
  • Prikažite vsebino tabele
  • Spuščanje zunanje mize

Razlika med notranjimi in zunanjimi tabelami

Značilnost Notranji Zunanji
Shema Podatki o shemi Shema podatkov
Mesto shranjevanja / usr / panj / skladišče Lokacija HDFS
Razpoložljivost podatkov Znotraj lokalnega datotečnega sistema Znotraj HDFS