在ubuntu上安装hadoop完分布式

作者：System 时间：2024年08月16日分类：所有,分布式字数：1394

这篇文章距离上次修改已过697天，其中的内容可能已经有所变动。

在Ubuntu上安装Hadoop完全分布式集群的步骤如下：

配置虚拟机：
- 设置静态IP地址。
- 配置主机名（通过/etc/hostname和/etc/hosts）。
- 关闭防火墙和安全策略。
- 配置SSH免密登录（每个节点生成密钥并配置认证）。

安装Java JDK：




sudo apt update
sudo apt install openjdk-8-jdk

下载并解压Hadoop：




wget https://archive.apache.org/dist/hadoop/core/hadoop-3.2.2/hadoop-3.2.2.tar.gz
sudo tar -xzf hadoop-3.2.2.tar.gz -C /usr/local
sudo mv /usr/local/hadoop-3.2.2/ /usr/local/hadoop
sudo chown -R hadoop:hadoop /usr/local/hadoop

配置环境变量：




echo 'export HADOOP_HOME=/usr/local/hadoop' | sudo tee -a /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin' | sudo tee -a /etc/profile
source /etc/profile

配置Hadoop（修改/usr/local/hadoop/etc/hadoop目录下的文件）：
- hadoop-env.sh：设置JAVA_HOME。
- core-site.xml：配置HDFS的NameNode。
- hdfs-site.xml：配置DataNode存储路径和副本数量。
- mapred-site.xml（如果存在，对于MapReduce）。
- yarn-site.xml：配置YARN资源管理器和节点管理器。
- workers：列出所有DataNode主机。
格式化NameNode：
```
hdfs namenode -format
```

启动Hadoop守护进程：




sudo /usr/local/hadoop/sbin/start-all.sh

检查Hadoop服务：
- 使用jps命令在各节点上检查运行的Java进程。
- 浏览器访问NameNode和ResourceManager的Web界面，默认端口是50070和8088。

注意：确保所有节点上的配置一致，并且防火墙和安全策略允许相应的端口通信。

在ubuntu上安装hadoop完分布式

评论已关闭

推荐阅读