当前位置: 首页 > news >正文

设计网站客户体验浪尖工业设计公司官网

设计网站客户体验,浪尖工业设计公司官网,莱芜买房网站,梅县区建设工程交易中心网站文章目录 (148)NN多目录配置(149)DataNode多目录配置及磁盘间数据平衡磁盘间数据均衡 参考文献 (148)NN多目录配置 NN多目录的意思是,本地目录可以配置成多个,且每个目录存放内容相…

文章目录

  • (148)NN多目录配置
  • (149)DataNode多目录配置及磁盘间数据平衡
    • 磁盘间数据均衡
  • 参考文献

(148)NN多目录配置

NN多目录的意思是,本地目录可以配置成多个,且每个目录存放内容相同,这样的目的是增加可靠性。比如说下图这样:

在这里插入图片描述

但其实生产中不常用哈,生产中要增加NN的可靠性的话,一般会开启NN的高可用,即在不同节点上开启多个NN,靠zookeeper来协调

所以本节就了解一下即可

配置的话,首先在hdfs-site.xml文件中添加如下内容:

<property><name>dfs.namenode.name.dir</name><value>file://${hadoop.tmp.dir}/dfs/name1,file://${hadoop.tmp.dir}/dfs/name2</value>
</property>

这个配置也可以不分发,每个节点单独调整,因为怕每个节点目录结构不一样,如果一样的话那就无所谓了。

停止集群myhadoop.sh stop,删除三台节点的data和logs中所有数据。

[atguigu@hadoop102 hadoop-3.1.3]$ rm -rf data/ logs/[atguigu@hadoop103 hadoop-3.1.3]$ rm -rf data/ logs/[atguigu@hadoop104 hadoop-3.1.3]$ rm -rf data/ logs/

(3)格式化集群并启动。

[atguigu@hadoop102 hadoop-3.1.3]$ bin/hdfs namenode -format[atguigu@hadoop102 hadoop-3.1.3]$ sbin/start-dfs.sh

必须停止集群并重新格式化NameNode,所以如果是在生产环境下,集群一旦启动,那就不要再修改NameNode了。

最后,进入hadoop的data/dfs/目录下,查看文件结构,会发现,现在多了一个文件夹:

[atguigu@hadoop102 dfs]$ ll
总用量 12
drwx------. 3 atguigu atguigu 4096 12月 11 08:03 data
drwxrwxr-x. 3 atguigu atguigu 4096 12月 11 08:03 name1
drwxrwxr-x. 3 atguigu atguigu 4096 12月 11 08:03 name2

即name1和name2,且两个文件夹里的内容一模一样。

(149)DataNode多目录配置及磁盘间数据平衡

不同于NN多目录,在生产环境下,DN的多目录配置就非常重要了

DN可以配置多个目录,且每个目录内存储的数据不一样。注意,不是一个副本一个目录,而是一个副本的数据可以分开存放在多个目录。

在这里插入图片描述

这个的好处其实很明显。

假设一个DataNode,我最早只挂了一块10G的磁盘,后来业务做大做强了,数据膨胀到10G以上了,这时候该怎么办?

这时候就可以给这个DN多挂载一块磁盘,然后通过DN的多目录,把新磁盘设定称为DN的第二个目录,新来的数据就可以继续往新磁盘放了。

老的数据不用大规模的动,新的数据还有地方放,这个的意义是很重要的。

具体配置,首先在hdfs-site.xml文件中添加:

<property><name>dfs.datanode.data.dir</name><value>file://${hadoop.tmp.dir}/dfs/data1,file://${hadoop.tmp.dir}/dfs/data2</value>
</property>

可以视情况分发配置。然后重启集群以识别修改。

进到hadoop安装目录的data/dfs/目录下,查看:

[atguigu@hadoop102 dfs]$ ll
总用量 12
drwx------. 3 atguigu atguigu 4096 4月   4 14:22 data1
drwx------. 3 atguigu atguigu 4096 4月   4 14:22 data2
drwxrwxr-x. 3 atguigu atguigu 4096 12月 11 08:03 name1
drwxrwxr-x. 3 atguigu atguigu 4096 12月 11 08:03 name2

可以看到,现在有两个data相关的文件夹了。

然后可以测试一下,在102上向集群上传一个文件,会发现上面两个文件夹里内容是不一样的,其中一个有数,另一个没有:

[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -put wcinput/word.txt /

就不赘述了。

磁盘间数据均衡

但是给DN配置了多目录之后,又会引入一个新的问题,就是新的目录,它是空的,那我如果想把老目录里的部分数据转移到新的目录,让两个目录都不是那么空,也都不是那么满,那该怎么做呢?

可以执行磁盘数据均衡命令,对单节点内部的DN目录(位于不同磁盘)开始均衡。(这是Hadoop3.x的新特性)

在这里插入图片描述

(1) 首先生成均衡计划(单磁盘的话,不会生成计划):

hdfs diskbalancer -plan hadoop103

(2)执行均衡计划

hdfs diskbalancer -execute hadoop103.plan.json

(3)查看当前均衡任务的执行情况

hdfs diskbalancer -query hadoop103

(4)取消均衡任务

hdfs diskbalancer -cancel hadoop103.plan.json

有兴趣可以拿虚拟机增加磁盘来试一下。

参考文献

  1. 【尚硅谷大数据Hadoop教程,hadoop3.x搭建到集群调优,百万播放】
http://www.yayakq.cn/news/130164/

相关文章:

  • 海盐网站建设株洲知名网站建设
  • 公众号微网站开发织梦做公司网站要钱吗
  • 开源saas多用户建站系统蒙古文网站建设汇报材料
  • 网站开发哪家强宠物喂养网页设计模板以及代码
  • 四川省建设网塔吊证查询网站wordpress结构化标签
  • 代做淘宝客网站国家域名备案查询
  • 教学网站在线自测功能怎么做广告logo图片大全
  • 镇江手机网站制作广州网站优化快速提升网站排名
  • tp框架做网站哪里做网站做得好
  • 厦门建设局网站城市建设个人注册域名可以做网站么
  • 网站建设具体建设流程建购物网站如何运营
  • wordpress数据交互合肥专业网站优化费用
  • 建设一个网站是不必须备案域名注册免费平台
  • 山东德州如何网站建设教程PHP工具箱和WordPress
  • 网站流量太大打不开怎么办漯河哪里做网站
  • 网站主页制作教程关键词分析工具网站
  • 长春网站优化平台网站是用什么编程语言编写的
  • 常州做网站多少钱深圳建设集团股份有限公司
  • 提高景区网站建设wordpress详细安装教程
  • 便利的赣州网站建设wordpress单页面制作
  • 定制网站开发商业计划书wordpress4.91
  • 如何在云服务器上开多几个网站北京网站策划服务
  • 什么是网站解析软件界面设计用什么软件
  • 音乐网站的制作自媒体 wordpress
  • 千图网网站怎么做杭州电子商务公司排行
  • 中国最大网站建设公司商务网站开发目的
  • 网站卡密代理怎么做国外人像摄影网站
  • 企业年金退休后是一次性领取还是按月领取seo优化的技巧
  • 做一个平台网站大概多少钱做一个平台app需要多少钱
  • 网站建设工作基本流程网站建设需要包含什么