V tej vadnici vas bomo vodili skozi postopek za namestitev Apache Hadoop na Linux polje (Ubuntu). To je dvodelni postopek
- 1. del) Prenesite in namestite Hadoop
- 2. del) Konfigurirajte Hadoop
Obstajata 2 predpogoja
- Imeti morate nameščen in zagnan Ubuntu
- Imeti morate nameščeno Javo.
1. del) Prenesite in namestite Hadoop
Korak 1) S pomočjo spodnjega ukaza dodajte uporabnika sistema Hadoop
sudo addgroup hadoop_
sudo adduser --ingroup hadoop_ hduser_
Vnesite geslo, ime in druge podrobnosti.
OPOMBA: V tem postopku namestitve in namestitve obstaja možnost omenjene napake.
"hduser ni v datoteki sudoers. Ta incident bo prijavljen."
To napako lahko reši prijava kot korenski uporabnik
Izvedite ukaz
sudo adduser hduser_ sudo
Re-login as hduser_
2. korak) Konfigurirajte SSH
Za upravljanje vozlišč v gruči Hadoop zahteva dostop SSH
Najprej preklopite uporabnika, vnesite naslednji ukaz
su - hduser_
Ta ukaz bo ustvaril nov ključ.
ssh-keygen -t rsa -P ""
S to tipko omogočite SSH dostop do lokalne naprave.
cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys
Zdaj preizkusite nastavitev SSH, tako da se povežete z localhost kot uporabnik 'hduser'.
ssh localhost
Opomba: Če spodaj vidite napako kot odgovor na 'ssh localhost', potem obstaja možnost, da SSH ni na voljo v tem sistemu-
Da bi to rešili -
Odstrani SSH z
sudo apt-get purge openssh-server
Dobra praksa je čiščenje pred začetkom namestitve
Namestite SSH z ukazom-
sudo apt-get install openssh-server
Korak 3) Naslednji korak je prenos Hadoop
Izberite Stable
Izberite datoteko tar.gz (ne datoteke s src)
Ko je prenos končan, se pomaknite do imenika, ki vsebuje datoteko tar
Enter,
sudo tar xzf hadoop-2.2.0.tar.gz
Zdaj preimenujte hadoop-2.2.0 v hadoop
sudo mv hadoop-2.2.0 hadoop
sudo chown -R hduser_:hadoop_ hadoop
2. del) Konfigurirajte Hadoop
Korak 1) Spremenite datoteko ~ / .bashrc
Na konec datoteke dodajte naslednje vrstice ~ / .bashrc
#Set HADOOP_HOMEexport HADOOP_HOME=#Set JAVA_HOMEexport JAVA_HOME= # Add bin/ directory of Hadoop to PATHexport PATH=$PATH:$HADOOP_HOME/bin
Zdaj poiščite to konfiguracijo okolja z uporabo spodnjega ukaza
. ~/.bashrc
2. korak) Konfiguracije, povezane s HDFS
Nastavite JAVA_HOME znotraj datoteke $ HADOOP_HOME / etc / hadoop / hadoop-env.sh
S
V $ HADOOP_HOME / etc / hadoop / core-site.xml sta dva parametra, ki ju je treba nastaviti
1. 'hadoop.tmp.dir' - Uporablja se za določanje imenika, ki ga bo Hadoop uporabljal za shranjevanje svojih podatkovnih datotek.
2. 'fs.default.name' - Določa privzeti datotečni sistem.
Če želite nastaviti te parametre, odprite core-site.xml
sudo gedit $HADOOP_HOME/etc/hadoop/core-site.xml
Kopirajte spodnjo vrstico med oznake
hadoop.tmp.dir /app/hadoop/tmp Parent directory for other temporary directories. fs.defaultFS hdfs://localhost:54310 The name of the default file system.
Pomaknite se do imenika $ HADOOP_HOME / etc / Hadoop
Zdaj ustvarite imenik, omenjen v core-site.xml
sudo mkdir -p
Odobrite dovoljenja za imenik
sudo chown -R hduser_:Hadoop_
sudo chmod 750
Korak 3) Zmanjšaj konfiguracijo zemljevida
Preden začnete s temi konfiguracijami, nastavimo pot HADOOP_HOME
sudo gedit /etc/profile.d/hadoop.sh
In Enter
export HADOOP_HOME=/home/guru99/Downloads/Hadoop
Naprej vnesite
sudo chmod +x /etc/profile.d/hadoop.sh
Zaprite terminal in znova zaženite
Vnesite echo $ HADOOP_HOME. Za potrditev poti
Zdaj kopirajte datoteke
sudo cp $HADOOP_HOME/etc/hadoop/mapred-site.xml.template $HADOOP_HOME/etc/hadoop/mapred-site.xml
Odprite datoteko mapred-site.xml
sudo gedit $HADOOP_HOME/etc/hadoop/mapred-site.xml
Dodajte spodnje vrstice nastavitve med oznakama
mapreduce.jobtracker.address localhost:54311 MapReduce job tracker runs at this host and port.
Odprite $ HADOOP_HOME / etc / hadoop / hdfs-site.xml, kot je prikazano spodaj,
sudo gedit $HADOOP_HOME/etc/hadoop/hdfs-site.xml
Dodajte spodnje vrstice nastavitve med oznakama
dfs.replication 1 Default block replication. dfs.datanode.data.dir /home/hduser_/hdfs
Ustvarite imenik, določen v zgornji nastavitvi-
sudo mkdir -p
sudo mkdir -p /home/hduser_/hdfs
sudo chown -R hduser_:hadoop_
sudo chown -R hduser_:hadoop_ /home/hduser_/hdfs
sudo chmod 750
sudo chmod 750 /home/hduser_/hdfs
4. korak) Preden prvič zaženemo Hadoop, formatirajte HDFS z uporabo spodnjega ukaza
$HADOOP_HOME/bin/hdfs namenode -format
5. korak: Zaženite gručo Hadoop z enim vozliščem z uporabo spodnjega ukaza
$HADOOP_HOME/sbin/start-dfs.sh
Izhod zgornjega ukaza
$HADOOP_HOME/sbin/start-yarn.sh
Z orodjem / ukazom 'jps' preverite, ali se vsi procesi, povezani s Hadoop, izvajajo ali ne.
Če se je Hadoop uspešno zagnal, mora izhod jps prikazati NameNode, NodeManager, ResourceManager, SecondaryNameNode, DataNode.
Korak 6) Ustavitev Hadoopa
$HADOOP_HOME/sbin/stop-dfs.sh
$HADOOP_HOME/sbin/stop-yarn.sh