当前位置: 首页 > news >正文

西安专业网站制作网站关键词多少个好

西安专业网站制作,网站关键词多少个好,网站建设的ci设计指的是什么,wordpress有游客注册帐号功能目录 一、事件复盘: 二、解决方案: 三、讨论 一、事件复盘: hdfs无法创建新的文件,xceivercount超过最大设置,平时每个datanode只有100个左右的连接,突然达到8000以上。 事故原因,跨多天的…

目录

一、事件复盘:

二、解决方案:

三、讨论


一、事件复盘:

hdfs无法创建新的文件,xceivercount超过最大设置,平时每个datanode只有100个左右的连接,突然达到8000以上。

事故原因,跨多天的动态分区导致: sql如下

set hive.exec.reducers.max=1000;
INSERT INTO TABLE table1 PARTITION (dt)  
selectuid,times,memo,idfa,dtfrom table2 where dt>=20230101 and dt<=20231231 distribute by rand()

使用动态分区虽然非常方便,但会带来很多小文件,像上面这个sql,动态分区是365天,reduce是1000个,如果计算比较复杂,资源充足,就会同时创建365*1000个文件。 因为是动态分区,每个reduce都要写365个文件到各自的分区中,因为数据by rand()把数据打散了。

二、解决方案:

1、降低同时正在运行的reduce数

配置如下:

mapreduce.job.running.reduce.limit=200;

这样同时运行的reduce只能到200,就是有一年的分区,也最多创建 365*200个文件。

2、如果想限制动态分区的跨天范围,也可以做如下限制

hive.exec.max.dynamic.partitions=100;

也就是动态分区只能一次创建100个,超过会报错。

3、其实动态分区不适合跨天的情况,跨天数据重跑完全可以按天一天一天的补,通过提高重跑天的次数来完成并发。

三、讨论

有人会觉得我可以增大xceivercount的数目,来避免这个问题,但是这个首先要重启datanode,另外,这个方案始终(目前已经达到了8000个连接一台机器)还是会导致大量的连接数存在,对整个集群不是很友好,还是尽量减少小文件的生成为最佳

http://www.yayakq.cn/news/686529/

相关文章:

  • 不同网站相似的页面百度不收录吗百度推广做网站
  • 交互式网站定义wordpress订阅者投稿
  • 黄山网站建设有哪些商标在线设计logo图案
  • 奇胜网络 邯郸网站建设做网站业务员应该了解什么
  • 灵山网站建设无忧建站
  • 建湖做网站多少钱什么是sem和seo
  • 网站广告模板代码做网站云服务期
  • 北京做环评备案的网站wordpress小图标大全
  • 网站设计师发展前景网站建设方面的书籍推荐
  • 网站推广与搜索引擎优化seo中文意思
  • 绍兴网站专业制作wordpress 新手教程
  • 网站设计的时间计划博客网站登录入口
  • 纯html5网站修改wordpress主体字体
  • 做网站平面一套多少钱asp网站架设教程
  • 做论坛网站的应用深圳专门网站建设
  • 深圳坂田做网站小程序开发流程
  • 专业网站建设分类标准如何安装网站模版
  • 做网站导航栏目怎么做浙江凌宇环境建设公司网站
  • 网站制作方案有哪些六安网络推广
  • 惠阳开发网站建设民权县住房和城乡建设局网站
  • 天津武清做网站安徽建设工程信息网官网查询
  • 技校网站建设与维护课程教学总结无锡网红餐厅
  • 如何自己做网站推广淘宝客wordpress 中文网
  • wordpress图片站大沥做网站
  • 网站维护报价表品牌展柜设计制作
  • 做网站可以不做后端吗怎么制作网站在线人数
  • 定制家具网站建设福建示范校建设专题网站
  • 永远网站建设网站优化说明
  • dw网站引导页怎么做wordpress 手机 主题
  • excel网站做链接wordpress 页面文章