Skip to the content.

Hướng dẫn cài đặt cụm master-slave hadoop

Bạn có thể click vào các title để download.

Bước 1: Giải nén hadoop & jdk8

    tar -xvf hadoop-2.7.7.tar.gz
    tar -xvf jdk-8u241-linux-x64.tar.gz

Bước 2: Cấu hình file .bashrc trên cụm master-slave hadoop

    cd ~
    vi .bashrc
--------------------------------
    # Thêm cấu hình vào file .bashrc
    #set hadoop
    
    export HADOOP_HOME=$HOME/hadoop-2.7.7
    export HADOOP_CONF_DIR=$HOME/hadoop-2.7.7/etc/hadoop
    export HADOOP_MAPRED_HOME=$HOME/hadoop-2.7.7
    export HADOOP_COMMON_HOME=$HOME/hadoop-2.7.7
    export HADOOP_HDFS_HOME=$HOME/hadoop-2.7.7
    export YARN_HOME=$HOME/hadoop-2.7.7
    export PATH=$PATH:$HOME/hadoop-2.7.7/bin
                 
    #set java
    
    export JAVA_HOME=$HOME/jdk1.8.0_241
    export PATH=$HOME/jdk1.8.0_241/bin:$PATH
--------------------------------
    source .bashrc
    java -version
    hadoop version

Bước 3: Tạo file master và chỉnh sửa file slave trên máy server master

    cd hadoop-2.7.7/etc/hadoop/
    cp slaves masters
    vi masters
# chỉnh sửa file master, xóa cấu hình cũ và thêm cấu hình mới:
------------------------------
master
------------------------------
    
    vi slaves
# chỉnh sửa file slave, xóa cấu hình cũ và thêm cấu hình mới:
------------------------------
master
slave1
slave2
------------------------------

Bước 4: Chỉnh sửa file slave trên máy server slave1&2

    cd hadoop-2.7.7/etc/hadoop/
    vi slaves

# máy slave 1
------------------------------
slave1
------------------------------

# máy slave 2
------------------------------
slave2
------------------------------    

Bước 5: Cấu hình file core-site.xml trên cụm máy master và slaves

    cd hadoop-2.7.7/etc/hadoop/
    vi core-site.xml
-----------------------------
<configuration>
        <property>
                <name>fs.default.name</name>
                <value>hdfs://master:9000</value>
        </property>
</configuration>
-----------------------------

Bước 6: Cấu hình file hdfs-site.xml trên máy server master

    cd hadoop-2.7.7/etc/hadoop/
    vi hdfs-site.xml
-----------------------------
<configuration>
        <property>
                <name>dfs.replication</name>
                <value>2</value>
        </property> 
        <property>
                <name>dfs.permission</name> 
                <value>false</value>
        </property>
        <property>
                <name>dfs.namenode.name.dir</name> 
                <value>$HOME/hadoop-2.7.7/namenode</value>
        </property> 
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>$HOME/hadoop-2.7.7/datanode</value>
        </property>
</configuration>
-----------------------------

Bước 7: Cấu hình file hdfs-site.xml trên máy server slave1&2

    cd hadoop-2.7.7/etc/hadoop/
    vi hdfs-site.xml
-----------------------------
<configuration>
        <property>
                <name>dfs.replication</name>
                <value>2</value>
        </property>
        <property>
                <name>dfs.permission</name> 
                <value>false</value>
        </property>
        <property>
                <name>dfs.datanode.data.dir</name> 
                <value>$HOME/hadoop-2.7.7/datanode</value>
        </property> 
</configuration>
-----------------------------

Bước 8: Cấu hình file mapred-site.xml trên cụm master-slaves

    cd hadoop-2.7.7/etc/hadoop/
    cp mapred-site.xml.template mapred-site.xml
    vi mapred-site.xml
------------------------------
<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
</configuration>
------------------------------

Bước 9: Cấu hình file yarn-site.xml trên cụm master-slaves

    cd hadoop-2.7.7/etc/hadoop/
    vi yarn-site.xml
------------------------------
<configuration>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <property>
                <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>
                <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
</configuration>
------------------------------

Bước 10: format namenode trên máy server master

    cd hadoop-2.7.7/bin/
    hadoop namenode -format

Bước 11: start hadoop trên máy server master

    cd hadoop-2.7.7/sbin
    hadoop-daemon.sh start namenode
    hadoop-daemon.sh start datanode
    yarn-daemon.sh start resourcemanager
    yarn-daemon.sh start nodemanager
    jps
--------------------------------
7153 NameNode
7603 NodeManager
9096 Jps
7355 ResourceManager
7245 DataNode
--------------------------------

Bước 12: start hadoop trên máy server slave

    cd hadoop-2.7.7/sbin
    hadoop-daemon.sh start datanode
    yarn-daemon.sh start nodemanager
    jps
--------------------------------
7609 NodeManager
7243 DataNode
--------------------------------

Bước 13: Xem kết quả giao diện hadoop

    http://192.168.10.100:50070/

img2

img1