基于Ubuntu系統下的Hadoop平臺搭建

1.更換阿里源（因為訪問archive.ubuntu太慢，所以換成國內源，訪問更快）
2.鏈接xshell
- 1.安裝SSH服務端
- 2.鏈接xhsell
3.安裝JAVA環境
4.創建Hadoop用戶
- 4.1創建新用戶并設定密碼
- 4.2為hadoop用戶添加管理員權限
5.設定SSH免密登錄
- 5.1登錄localhost
- 5.2設定為無密碼登錄
6.Hadoop安裝
- 6.1解壓到我們的Ubuntu系統中
- 6.2切換到Hadoop用戶
- 6.3解壓Hadoop
- 6.4偽分布式模式配置
- - 6.4.1修改組態檔
  - 6.4.2執行名稱節點格式化
- 6.5啟動hadoop
- 6.6使用瀏覽器查看HDFS資訊
- 6.7運行偽分布式實體
- 6.8關閉Hadoop
- 6.9相關命令

1.更換阿里源（因為訪問archive.ubuntu太慢，所以換成國內源，訪問更快）

輸入命令列

sudo nano /etc/apt/sources.list

在這里插入圖片描述

開始替換
替換完畢

在這里插入圖片描述

進行更新

sudo apt update && sudo apt upgrade

在這里插入圖片描述

2.鏈接xshell

1.安裝SSH服務端

$ sudo apt-get install openssh-server

2.鏈接xhsell

在這里插入圖片描述

3.安裝JAVA環境

安裝jdk

sudo apt install openjdk-8-jdk -y

在這里插入圖片描述

配置環境變數
添加完之后，更新環境變數

1.# 更新環境變數

2.source ~/.bashrc

配置成功

4.創建Hadoop用戶

4.1創建新用戶并設定密碼

用戶名為hadoop，使用/bin/bash作為shell

$ sudo useradd -m hadoop -s /bin/bash

在這里插入圖片描述

4.2為hadoop用戶添加管理員權限

sudo adduser hadoop sudo

在這里插入圖片描述

5.設定SSH免密登錄

Hadoop并沒有提供SSH密碼登錄的形式，所以需要將所有機器配置為無密碼登錄

5.1登錄localhost

在這里插入圖片描述

5.2設定為無密碼登錄

在這里插入圖片描述

此時就可以使用ssh localhost無密碼登錄

6.Hadoop安裝

這里為大家掛上網盤鏈接，也可以去官網下載地址點這里
鏈接：https://pan.baidu.com/s/1HiO6SPp9UmUlQEXHlvzU-A
提取碼：q7rd

6.1解壓到我們的Ubuntu系統中

先安裝lrzsz（可能有的人裝完系統后，這條命令無法使用，可以執行的話請自動略過）
把下載好的Hadoop壓縮包從windows系統中傳到我們的虛擬機系統中

6.2切換到Hadoop用戶

ssh hadoop@localhost

在這里插入圖片描述

6.3解壓Hadoop

因為我們剛剛是把壓縮包傳到了ba這個用戶上，現在我們把它move到hadoop這個用戶上
再解壓
此時就轉移并解壓完成了
查看一下版本
配置環境變數方便打開

在這里插入圖片描述

6.4偽分布式模式配置

在單個節點（一臺機器上）以偽分布式的方式運行

6.4.1修改組態檔

需要修改/usr/local/hadoop/etc/hadoop/檔案夾下的core-site.xml和hdfs-site.xml檔案
在這里插入圖片描述

core-site.xml
將

<configuration>
</configuration>

改為

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

在這里插入圖片描述

hdfs-site.xml
將

<configuration>
</configuration>

修改為

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/hadoop/tmp/dfs/data</value>
    </property>
</configuration>

在這里插入圖片描述

6.4.2執行名稱節點格式化

$ cd /usr/hadoop

$ ./bin/hdfs namenode -format

6.5啟動hadoop

$ cd /usr/hadoop
$ ./sbin/start-dfs.sh

在這里插入圖片描述

用jps命令查看是否啟動成功

6.6使用瀏覽器查看HDFS資訊

ifconfig 命令即可查看自己的IP地址

在這里插入圖片描述

6.7運行偽分布式實體

執行以下命令

cd /usr/hadoop

# 在HDFS中創建用戶目錄
./bin/hdfs dfs -mkdir -p /user/hadoop 

#在HDFS中創建hadoop用戶對應的input目錄
./bin/hdfs dfs -mkdir input  

#把本地檔案復制到HDFS中
./bin/hdfs dfs -put ./etc/hadoop/*.xml input  

#查看檔案串列
./bin/hdfs dfs -ls input 

./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'

#查看運行結果
./bin/hdfs dfs -cat output/*

在這里插入圖片描述

如果要再次運行，需要洗掉output檔案夾

6.8關閉Hadoop

./sbin/stop-dfs.sh

在這里插入圖片描述

6.9相關命令

$ cd /usr/hadoop

#格式化名稱節點 （這個命令只需只需一次）
$ ./bin/hdfs namenode -format 

#啟動Hadoop
$ ./sbin/start-dfs.sh  

#查看Hadoop是否成功啟動
$ jps 

 # 關閉Hadoop
$ ./sbin/stop-dfs.sh  

 # 洗掉 tmp 檔案，注意這會洗掉 HDFS中原有的所有資料
$ rm -r ./tmp    

# 重啟
$ ./sbin/start-dfs.sh

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/280590.html

標籤：其他

上一篇：Linux學習（一）

下一篇：[Linux系統編程]Makefile專案管理

基于Ubuntu系統下的Hadoop平臺搭建詳細步驟

基于Ubuntu系統下的Hadoop平臺搭建

1.更換阿里源（因為訪問archive.ubuntu太慢，所以換成國內源，訪問更快）

2.鏈接xshell

1.安裝SSH服務端

2.鏈接xhsell

3.安裝JAVA環境

4.創建Hadoop用戶

4.1創建新用戶并設定密碼

4.2為hadoop用戶添加管理員權限

5.設定SSH免密登錄

5.1登錄localhost

5.2設定為無密碼登錄

6.Hadoop安裝

6.1解壓到我們的Ubuntu系統中

6.2切換到Hadoop用戶

6.3解壓Hadoop

6.4偽分布式模式配置

6.4.1修改組態檔

6.4.2執行名稱節點格式化

6.5啟動hadoop

6.6使用瀏覽器查看HDFS資訊

6.7運行偽分布式實體

6.8關閉Hadoop

6.9相關命令