当前位置: 首页 > news >正文

南宁外贸网站建设功能公司seo网站搭建是什么

南宁外贸网站建设功能公司,seo网站搭建是什么,青海西宁网站开发公司,一级门户网站建设费用写在前面 最近在自己做自定义的OLAP系统,文件格式上用的是Parquet,但是发现Parquet各个API的示例代码很少。所以就打算把这个系列的文章写一下。 1. Parquet的Filter Parquet的过滤支持两大类,一类是基于Footer中的元数据进行RowGroup级别…

写在前面

最近在自己做自定义的OLAP系统,文件格式上用的是Parquet,但是发现Parquet各个API的示例代码很少。所以就打算把这个系列的文章写一下。

1. Parquet的Filter

Parquet的过滤支持两大类,一类是基于Footer中的元数据进行RowGroup级别的过滤;这种过滤能够实现减少IO的目的,它通过元数据里的信息直接可以实现跳过RowGroup的读取。
另一类是对每一行进行过滤,此类对于减少IO没有作用,只是代码优雅一些,不用把所有的数据都读到客户端代码里进行过滤。

2. Parquet对RowGroup的过滤的基本介绍

当前最新版本1.12.x 中支持3类:

  1. 字典 - 如果列的值域空间不大,则用字典(parquet能够自己识别是否使用字典作为一列的过滤器)
  2. statistics - 数值型的min/max
  3. bloomFilter - 如果列值域比较大,则不是相对分段聚合的,则无法用1-2.则考虑用bloomFilter(如果使用bloomFilter需要在写入时指定要使用bloomFilter的列)

3. Parquet 应用BloomFilter的示例代码

3.1 写入Parquet文件

并指定user_id列使用BloomFilter

        ParquetWriter<Object> parquetWriter = AvroParquetWriter.builder(path).withSchema(userFlowTraceSchema).withCompressionCodec(CompressionCodecName.GZIP).withBloomFilterEnabled("user_id", true).build();

3.2 读取Parquet文件

目前BloomFilter仅支持Eq和In操作;其他类型和自定义的操作都直接被返回了 BLOCK_MIGHT_MATCH(true)- 即不过滤
源码见:org.apache.parquet.filter2.bloomfilterlevel.BloomFilterImpl

读取文件,并使用BloomFilter的示例:

GroupReadSupport readSupport = new GroupReadSupport();
String targetUserId1 = "9639102999811";
String targetUserId2 = "9639102999711";
Filter bloomFilterIn = FilterCompat.get(FilterApi.in(FilterApi.binaryColumn("user_id"),Sets.newHashSet(Binary.fromString(targetUserId1),Binary.fromString(targetUserId2))));
ParquetReader<Group> reader = ParquetReader.builder(readSupport, path).withFilter(bloomFilterIn).build();
http://www.yayakq.cn/news/80131/

相关文章:

  • 网站的外链情况部门网站建设情况汇报
  • 网站开发用技术wordpress企业原创主题
  • 免费网站建设哪个最好学动漫设计有前途吗
  • 北京好的网站开发做企业网站用什么框架
  • 深圳网站官网建设方案昆明双鼎网站制作
  • 溧阳建设局网站网站域名改版
  • 东莞网站建设 石佳专业的河南网站建设
  • 沧州建设厅网站小程序定制外包
  • 秦皇岛网络编辑网站网站图标怎么做
  • 系统官网网站模板下载安装万能浏览器有哪些
  • 自己有服务器如何建设微网站软件app开发公司电话
  • 莱芜网站建设价格注册网站会员需要填写信息
  • 网站开发技术实验教程怎样打开用sql做的网站
  • 外国广告公司网站系统建设方案怎么写
  • 上海 企业网站建设企业营销网站建设步骤
  • 网站建设任职资格和平区网站建设
  • 什么网站可以自己做房子设计图我市精神文明建设的门户网站是
  • 做影视网站违法莫谷歌seo排名优化
  • 网站建设设计开发公司网站备案 材料
  • 做视频网站用什么格式好亚马逊跨境电商下载
  • 太原建网站公司关于产品网站建设的问题
  • ASP网站开发技术期末考试网站建设可行性的分析
  • 空间放两个网站wordpress手机版app导航
  • 做外贸 访问国外网站整站排名优化教程
  • 网站关键词建设上海建设学院网站
  • 基于互联网 模式下的安全网站建设wordpress代码插件
  • 在织梦网站做静态网页西乡移动网站建设
  • 网站如何做微信推广制作公司网站源代码怎么弄
  • 知名的crm管理系统网站优化时间
  • 百度网站收录入口wordpress改写