hadoop3分布式基本部署_hadoop3 双namenode 部署,大数据开发面试八股文
在Hadoop 3中,可以通过配置Active/Standby模式的ResourceManager(RM)或者使用ZooKeeper等服务来实现双NameNode的高可用性部署。但是,Hadoop本身并没有内置支持双活的NameNode。对于NameNode的高可用性,通常推荐使用JournalNode集群来保持状态同步,而不是尝试运行两个独立的NameNode。
以下是一个基本的Hadoop高可用性部署的示例配置,其中包括一个Active NameNode和一个Standby NameNode,以及必要的JournalNode集群。
- 配置
hdfs-site.xml
:
<configuration>
<property>
<name>dfs.nameservices</name>
<value>mycluster</value>
</property>
<property>
<name>dfs.ha.namenodes.mycluster</name>
<value>nn1,nn2</value>
</property>
<property>
<name>dfs.namenode.rpc-address.mycluster.nn1</name>
<value>nn1-host:8020</value>
</property>
<property>
<name>dfs.namenode.rpc-address.mycluster.nn2</name>
<value>nn2-host:8020</value>
</property>
<property>
<name>dfs.namenode.http-address.mycluster.nn1</name>
<value>nn1-host:9870</value>
</property>
<property>
<name>dfs.namenode.http-address.mycluster.nn2</name>
<value>nn2-host:9870</value>
</property>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/path/to/journal/node/data</value>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.client.failover.proxy.provider.mycluster</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<!-- other HDFS-related configurations -->
</configuration>
- 配置
core-site.xml
:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://mycluster</value>
</property>
<!-- other Hadoop-related configurations -->
</configuration>
- 配置
mapred-site.xml
(如果使用MapReduce):
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<!-- other MapReduce-related configurations -->
</configuration>
- 配置
yarn-site.xml
:
<configuration>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>my-yarn-cl
评论已关闭