**
安裝詳細步驟
**
首先給出安裝程序需要用到的安裝包:云盤連接
提取碼:rfxs
解壓過后里面有四個檔案:

下面給出詳細安裝步驟,博主是在虛擬機(Ubuntn18.04)上安裝的,注意:需要將文中的xxx換成自己的目錄即可,
一、首先需要安裝jdk環境:
1、更新Ubuntu源
sudo apt-get update
2、將JDK壓縮包(jdk-8u251-linux-x64.tar.gz)解壓到Ubuntu系統中 /usr/local/ 中
sudo tar -zxvf jdk-8u251-linux-x64.tar.gz -C /usr/local/
3、將解壓的檔案夾重命名為 jdk8
cd /usr/local/
sudo mv jdk1.8.0_251/ jdk8
4、添加到環境變數
cd /home/xxx/
sudo gedit .bashrc
在檔案末尾添加如下內容:
export JAVA_HOME=/usr/local/jdk8
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
export PATH=.:$JAVA_HOME/bin:$PATH
source .bashrc
驗證是否安裝成功
java -version
出現java的版本則證明安裝并添加到環境變數成功 java version “1.8.0_251”,
二、安裝Hadoop并配置偽分布式
1、安裝SSH
sudo apt-get install ssh
2、配置免登錄認證,避免使用Hadoop時的權限問題
ssh-keygen -t rsa (輸入此條命令后一路回車)
cd ~/.ssh
cat id_rsa.pub >> authorized_keys
ssh localhost (發現并未讓輸入密碼即可連接)
exit (退出遠程連接狀態)
3、找到Hadoop 2.10(hadoop-2.10.0.tar.gz)
4、解壓到 /usr/local 目錄中,并將檔案夾重命名為 hadoop,最后設定權限
sudo tar -zxvf hadoop-2.10.0.tar.gz -C /usr/local/
cd /usr/local
sudo mv hadoop-2.10.0/ hadoop2.10
sudo chown -R xxx hadoop2.10/
5、驗證Hadoop
cd /usr/local/hadoop2.10/bin
./hadoop version (此處出現hadoop的版本)
6、設定JAVE_HOME環境變數
sudo gedit /usr/local/hadoop2.10/etc/hadoop/hadoop-env.sh
把原來的export JAVA_HOME=${JAVA_HOME}改為
export JAVA_HOME=/usr/local/jdk8
7、設定Hadoop環境變數
sudo gedit /home/xxx/.bashrc
在末尾追加
export HADOOP_HOME=/usr/local/hadoop2.10
export CLASSPATH=.:{JAVA_HOME}/lib:${HADOOP_HOME}/sbin:$PATH
export PATH=.:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH
并執行
source /home/xxx/.bashrc
8、偽分布式配置,修改2個組態檔(core-site.xml 和 hdfs-site.xml)
9、修改core-site.xml
sudo gedit /usr/local/hadoop2.10/etc/hadoop/core-site.xml
添加如下內容
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/hadoop2.10/tmp</value>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
10、修改hdfs-site.xml
sudo gedit /usr/local/hadoop2.10/etc/hadoop/hdfs-site.xml
添加如下內容
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop2.10/tmp/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop2.10/tmp/dfs/data</value>
</property>
</configuration>
11、配置YARN - 1
cd /usr/local/hadoop2.10/etc/hadoop
cp mapred-site.xml.template mapred-site.xml
sudo gedit mapred-site.xml
添加如下配置
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
12、配置YARN - 2
sudo gedit yarn-site.xml
添加如下配置:
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
13、執行NameNode格式化
cd /usr/local/hadoop2.10/bin
./hdfs namenode -format
如果出現 Storage directory /usr/local/hadoop2.10/tmp/dfs/name has been successfully formatted 則表示格式化成功
14、啟動Hadoop所有組件
cd /usr/local/hadoop2.10/sbin
./start-all.sh
注:啟動時可能會出現警告,直接忽略即可,不影響正常使用
15、啟動成功后,可訪問Web頁面查看 NameNode 和 Datanode 資訊,還可以在線查看 HDFS 中的檔案
http://localhost:50070
16、查看Hadoop相關組件行程
jps
如果執行成功則會發現如下行程:
NameNode — 50070
DataNode — 50075
SecondaryNameNode — 50090
ResourceManager — 8088
NodeManager
可以測驗以下 : 將本地檔案上傳至hdfs,命令如下:
hadoop fs -put 一個本地的任意檔案 /
hadoop fs -ls /
也可以在瀏覽器中Utilities->Browse the file system查看
三 Hive安裝
1、找到HIVE安裝包(apache-hive-2.3.7-bin.tar.gz)
2、解壓到 /usr/local/ 目錄下
sudo tar -zxvf apache-hive-2.3.7-bin.tar.gz -C /usr/local
3、給檔案夾重命名
sudo mv /usr/local/apache-hive-2.3.7-bin /usr/local/hive2.3.7
4、設定環境變數
sudo gedit /home/xxx/.bashrc
在末尾添加如下內容
export HIVE_HOME=/usr/local/hive2.3.7
export PATH=.:${HIVE_HOME}/bin:$PATH
重繪環境變數
source /home/xxx/.bashrc
6、下載并添加連接MySQL資料庫的jar包
(mysql-connector-java-8.0.19.jar)
解壓后找到 mysql-connector-java-8.0.19.jar
將其拷貝到 /usr/local/hive2.3.7/lib
sudo cp -p mysql-connector-java-8.0.19.jar /usr/local/hive2.3.7/lib/
7、創建hive-site.xml組態檔
sudo touch /usr/local/hive2.3.7/conf/hive-site.xml
sudo gedit /usr/local/hive2.3.7/conf/hive-site.xml
并添加如下內容
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
<description>JDBC connect string for a JDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.cj.jdbc.Driver</value>
<description>Driver class name for a JDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
<description>username to use against metastore database</description>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>123456</value>
<description>password to use against metastore database</description>
</property>
</configuration>
8、在hive組態檔中添加hadoop路徑
cd /usr/local/hive2.3.7/conf
sudo cp -p hive-env.sh.template hive-env.sh
sudo gedit /usr/local/hive2.3.7/conf/hive-env.sh
添加如下內容:
HADOOP_HOME=/usr/local/hadoop2.10
export HIVE_CONF_DIR=/usr/local/hive2.3.7/conf
9、hive元資料初始化
schematool -dbType mysql -initSchema
10、測驗hive
hive
hive>show databases;
如果能夠正常顯示內容,則hive安裝并配置完畢,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/226794.html
標籤:其他
