当前位置: 首页 > news >正文

重庆南岸营销型网站建设公司哪家好北京建站免费模板

重庆南岸营销型网站建设公司哪家好,北京建站免费模板,网站如何做促销活动,qq网页版 登陆目录 一、事件复盘: 二、解决方案: 三、讨论 一、事件复盘: hdfs无法创建新的文件,xceivercount超过最大设置,平时每个datanode只有100个左右的连接,突然达到8000以上。 事故原因,跨多天的…

目录

一、事件复盘:

二、解决方案:

三、讨论


一、事件复盘:

hdfs无法创建新的文件,xceivercount超过最大设置,平时每个datanode只有100个左右的连接,突然达到8000以上。

事故原因,跨多天的动态分区导致: sql如下

set hive.exec.reducers.max=1000;
INSERT INTO TABLE table1 PARTITION (dt)  
selectuid,times,memo,idfa,dtfrom table2 where dt>=20230101 and dt<=20231231 distribute by rand()

使用动态分区虽然非常方便,但会带来很多小文件,像上面这个sql,动态分区是365天,reduce是1000个,如果计算比较复杂,资源充足,就会同时创建365*1000个文件。 因为是动态分区,每个reduce都要写365个文件到各自的分区中,因为数据by rand()把数据打散了。

二、解决方案:

1、降低同时正在运行的reduce数

配置如下:

mapreduce.job.running.reduce.limit=200;

这样同时运行的reduce只能到200,就是有一年的分区,也最多创建 365*200个文件。

2、如果想限制动态分区的跨天范围,也可以做如下限制

hive.exec.max.dynamic.partitions=100;

也就是动态分区只能一次创建100个,超过会报错。

3、其实动态分区不适合跨天的情况,跨天数据重跑完全可以按天一天一天的补,通过提高重跑天的次数来完成并发。

三、讨论

有人会觉得我可以增大xceivercount的数目,来避免这个问题,但是这个首先要重启datanode,另外,这个方案始终(目前已经达到了8000个连接一台机器)还是会导致大量的连接数存在,对整个集群不是很友好,还是尽量减少小文件的生成为最佳

http://www.yayakq.cn/news/613465/

相关文章:

  • 聊城高端网站建设做虾苗网站有哪些流程
  • 网站icp备案手续设计网站特点
  • 网站开发与设计课程设计代理做网站合适吗
  • 网站建设项目总结宁波科技网站建设
  • 网站开发需求分析编写目的wordpress 4.8 语言
  • 做的比较漂亮的网站东莞网络营销推广软件
  • 北京建设局网站首页如何开网店不用自己发货
  • 微信个人商城网站模板如何做自己个人网站
  • 通栏式网站用凡科可以做视频网站吗
  • 花都定制型网站建设怎么样制作自己的网站
  • 如何给自己的网站做优化购物建设网站
  • 怎样做化妆品网站网站解析密码
  • 古装衣服店网站建设页面福建省建设干部培训中心网站
  • 如何做搜索引擎网站wordpress 附件目录
  • 建设网站的必要性福田做商城网站建设哪家服务周到
  • 淘宝这种网站怎么做的免费cms
  • 海诚网站建设新莱芜网
  • 中型网站流量宁波网络推广团队
  • 广州外贸网站推广wordpress 根目录函数
  • 做网站至少要花多少钱wordpress免费汉化
  • 未做301重定向的网站免费的个人网站注册
  • 江苏交通建设监理协会网站网页设计期末考试作品
  • 天津网站建设案例展示个人备案的网站可以做什么
  • 网站弹出式链接后台怎么做编制网站建设策划书
  • 简述营销网站建设包含哪些内容成都科技网站建设咨
  • 广州建设局网站seo网站优化推广怎么做
  • 网站seo软件网站建设公司有哪些
  • 南昌做网站的公司哪个比较好的海洋网络做网站不负责
  • 网站开发是什么费用松原网站推广
  • 中卫网站定制开发设计康体设备网站建设