在ubuntu上安装hadoop完分布式
    		       		warning:
    		            这篇文章距离上次修改已过445天,其中的内容可能已经有所变动。
    		        
        		                
                在Ubuntu上安装Hadoop完全分布式集群的步骤如下:
配置虚拟机:
- 设置静态IP地址。
 - 配置主机名(通过
/etc/hostname和/etc/hosts)。 - 关闭防火墙和安全策略。
 - 配置SSH免密登录(每个节点生成密钥并配置认证)。
 
安装Java JDK:
sudo apt update sudo apt install openjdk-8-jdk下载并解压Hadoop:
wget https://archive.apache.org/dist/hadoop/core/hadoop-3.2.2/hadoop-3.2.2.tar.gz sudo tar -xzf hadoop-3.2.2.tar.gz -C /usr/local sudo mv /usr/local/hadoop-3.2.2/ /usr/local/hadoop sudo chown -R hadoop:hadoop /usr/local/hadoop配置环境变量:
echo 'export HADOOP_HOME=/usr/local/hadoop' | sudo tee -a /etc/profile echo 'export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin' | sudo tee -a /etc/profile source /etc/profile配置Hadoop(修改
/usr/local/hadoop/etc/hadoop目录下的文件):hadoop-env.sh:设置JAVA_HOME。core-site.xml:配置HDFS的NameNode。hdfs-site.xml:配置DataNode存储路径和副本数量。mapred-site.xml(如果存在,对于MapReduce)。yarn-site.xml:配置YARN资源管理器和节点管理器。workers:列出所有DataNode主机。
格式化NameNode:
hdfs namenode -format启动Hadoop守护进程:
sudo /usr/local/hadoop/sbin/start-all.sh检查Hadoop服务:
- 使用
jps命令在各节点上检查运行的Java进程。 - 浏览器访问NameNode和ResourceManager的Web界面,默认端口是50070和8088。
 
- 使用
 
注意:确保所有节点上的配置一致,并且防火墙和安全策略允许相应的端口通信。
评论已关闭