当前位置: 首页 > news >正文

网站开发微信网站建设swot分析

网站开发微信,网站建设swot分析,自己公司网站自己能做吗,物流网络规划背景:Flink数据写入到stage层,然后再入ods层,中间导致hive数据实时性不强,随后做优化,Flink之间以orc格式写入到hive 问题:单表日800亿数据量,产生过多的小文件,影响Impala查询 解决:对hive小文件进行合并, ALTER TABLE lt_ipsy_xdr_temp PARTITION (day20230829, hour9,type…

背景:Flink数据写入到stage层,然后再入ods层,中间导致hive数据实时性不强,随后做优化,Flink之间以orc格式写入到hive

问题:单表日800亿数据量,产生过多的小文件,影响Impala查询

解决:对hive小文件进行合并,

ALTER TABLE lt_ipsy_xdr_temp PARTITION (day=20230829, hour=9,type=4) CONCATENATE;

目前大数据平台hdfs数据存储情况:

数据仓库中的表:
1.stg层是把flink应用程序写入的数据load进入的;
2.ods层表名称中包含ai的表是从mysql导入的; 
/_SCRATCH0 这些目录是sqoop 把mysql数据导入hive时生成的临时目录,可以删除。
3.stg 和 ods 的 tb_bu_dc_monitor_day 是外部表,其他层的表都是内部表;
4.stg层是原始数据,没有经过压缩处理,ods及以后其他各层都是orc格式
 

使用hive concatenate (外部表不可用,内部表可用,orc可用,分桶表不可用)
使用方式:

#1.设置文件最小大小(需要设置,否则合并操作可能会不理想):
SET mapreduce.input.fileinputformat.split.maxsize=256
#对于非分区表
alter table A concatenate;
#2.对于分区表
ALTER TABLE lt_ipsy_xdr_temp PARTITION (day=20230829, hour=9,type=4) CONCATENATE;

因为分桶表不适用,所以可以采用覆写的方式

INSERT OVERWRITE TABLE table 

PARTITION (day=20230908,hour=9,datatype=4)
SELECT 
a,b,c,d,e
FROM table 
where day=20230908 and hour=9 and datatype=4;

http://www.yayakq.cn/news/707226/

相关文章:

  • 网站策划总结摄影师如何做网站
  • 专题网站开发报价wordpress 主题 更换
  • 淘宝联盟合作网站api网页模板制作工具
  • 有必要对网站进行seo吗云南培训网站建设
  • 让别人做网站的步骤asp.net 手机网站开发教程
  • 网站链接数怎么做利用第三方做网站永久发布地址
  • 做源码网站赚钱吗什么专业的会做网站
  • 淘宝天猫优惠券网站怎么做深圳定制网站制作费用
  • 红色大气网站模板双鸭山市建设局网站
  • 网站建设的发展长沙 外贸网站建设公司价格
  • 建设一个游戏网站需要多少钱保定网站开发
  • 建行网站用户名媒体135网站
  • 太原市住房和城乡建设厅网站东莞网络外包公司
  • 抖音网站建设哪家好visual composer wordpress 汉化
  • 怎么将自己房子投入网站做民宿网站做cdn怎么弄
  • 景安网站备案表格网站制作方案的重要性
  • 福建得兴建设工程网站旅游网站开发近五年参考文献
  • 壹佰云建站wordpress插件导出
  • 公共场所建设网站龙岩长汀
  • php服装网站模板h5页面制作软件免费
  • zf厂手表网站做字幕网站
  • 温州网站定制网站建设任务书
  • 移动端的网站怎么做小密圈wordpress
  • 互联网推广引流seo的中文是什么
  • 潮品服饰网站建设规划书wap网站制作软件
  • 网站做sem优化濮阳武志勇
  • C#如何做简易网站做网站好的网站建设公司排名
  • 济南手工网站建设公司千牛商家版网站建设
  • 别人网站建设多少钱如何搭建微信公众号平台
  • 电脑网站编程太原网站优化怎么做