Hadoop3.3.4分布式安装
Hadoop 3.3.4 的分布式安装步骤如下:
准备环境
- 确保所有节点的主机名、IP配置正确。
- 关闭防火墙和SELinux。
- 配置免密登录。
- 同步时间。
安装Java
- 确保Java版本至少为1.8。
配置Hadoop
- 解压Hadoop压缩包。
- 设置环境变量
HADOOP_HOME
和更新PATH
。 - 配置
hadoop-env.sh
,设置JAVA_HOME
。 - 编辑
core-site.xml
,配置HDFS的namenode。 - 编辑
hdfs-site.xml
,配置数据节点和副本数量。 - 编辑
mapred-site.xml
,配置MapReduce。 - 编辑
yarn-site.xml
,配置资源管理器和节点管理器。 - 配置
slaves
,添加数据节点主机名。
格式化NameNode
- 使用
hdfs namenode -format
命令格式化。
- 使用
启动Hadoop
- 使用
start-all.sh
启动所有Hadoop服务。
- 使用
检查状态
- 使用
jps
命令检查各节点上的Java进程。 - 通过Web界面检查,例如NameNode (50070),ResourceManager (8088)。
- 使用
以下是一个简化的示例,展示如何配置core-site.xml
:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://mycluster</value>
</property>
</configuration>
确保替换mycluster
为你的HDFS集群名称。其他配置文件也应相应修改。
评论已关闭