当前位置: 首页 > news >正文

做美工一般用到的素材网站学校网站建设方面汇报

做美工一般用到的素材网站,学校网站建设方面汇报,百家号优化上首页,扬州房产网Apache Hive 支持几种熟知的Hadoop使用的文件格式,Hive也能加载并查询其他Hadoop组件创建的不同文件格式,如Pig或MapReduce。本文对比Hive不同文件格式,如:TextFile, SequenceFile, RCFile, AVRO, ORC,Parquet,Clouder…

Apache Hive 支持几种熟知的Hadoop使用的文件格式,Hive也能加载并查询其他Hadoop组件创建的不同文件格式,如Pig或MapReduce。本文对比Hive不同文件格式,如:TextFile, SequenceFile, RCFile, AVRO, ORC,Parquet,Cloudera Impala也支持这些格式。在Apache Hive中不同文件格式和压缩编解码方式对不同的数据集产生效果差异明显,基于场景选择合适的文件格式非常重要,就如在ClickHouse中选择合适的存储引擎一样。下面分别介绍Hive支持的各类文件格式。

Hive Text File Format

Hive Text File Format是缺省的文件格式,可以使用该格式与其他客户端应用传输数据。文本文件格式为大多数应用支持,数据按行存储,每一行代表一条记录,每行以回车符(\n)结束。

文本文件是简单平面文件格式,可以使用BZIP2进行压缩减少存储空间。Hive创建表命令可以使用STORED AS TEXTFILE支持存储格式,示例语法如下:

Create table textfile_table
(column_specs)
stored as textfile;

Hive Sequence File Format

Sequence文件格式是Hadoop支持的平面文件,数据存储为二进制键值对格式。这些文件是二进制格式、且能够分割,主要优势可以合并两个或多个文件为一个文件。

在Hive中创建顺序文件表可以通过增加存储选项实现:STORED AS SEQUENCEFILE 。下面是示例语法:

Create table sequencefile_table
(column_specs)
stored as sequencefile;

Hive RC File Format

RC 文件格式是行列文件格式,是Hive提供高行级压缩率的另一个文件格式。如果需要一次性执行多行,可以使用RCFile格式。

RCFile格式与顺序文件格式非常类似,也按照键值对方式存储数据。Hive创建RCFile表时可以指定STORED AS RCFILE选项。示例语法如下:

Create table RCfile_table
(column_specs)
stored as rcfile;

Hive AVRO File Format

AVRO是为Hadoop提供数据序列化和数据交换服务的开源项目,它可以用于在Hadoop生态与任何编程语言编写的应用之间交换数据。Avro是基于Hadoop应用最受欢迎的文件格式。

创建Hive AVRO表可以指定STORED AS AVRO选项:

Create table avro_table
(column_specs)
stored as avro;

Hive ORC File Format

ORC( Optimized Row Columnar )文件格式提供了更有效方式存储Hive表数据。这个文件系统实际上就是为了克服其他Hive文件格式的限制特性而设计的。当Hive从大表中读取、写入和处理数据时,使用ORC文件可以提高性能。

创建Hive ORC表可以指定STORED AS ORC选项:

Create table orc_table
(column_specs)
stored as orc;

Hive Parquet File Format

Parquet是面向类二进制文件格式,对于大规模查询应用非常高效,尤其是查询表中特定列数据,且能够使用 Snappy, gzip方式进行压缩,缺省为Snappy。关于parquet文件格式的优势可以参考:基于R语言理解Parquet文件格式

创建Hive Parquet表可以指定STORED AS ORC选项:

Create table parquet_table
(column_specs)
stored as parquet;

总结

本文介绍了Hive中支持的不同文件格式,了解并选择合适的文件格式对于大数据类应用非常重要。

http://www.yayakq.cn/news/397747/

相关文章:

  • 世界杯竞猜网站开发软装搭配设计师培训
  • 抖音短视频推广seo服务外包费用
  • 做网站一天忙吗游戏音效设计师培训
  • 怎样查网站备案西安网页设计工作
  • 2017三五互联做网站怎么样曹县建设厅网站
  • 做网站协议怎么签外贸网站建设外
  • 企业门户网站云服务器配置要求北京seo排名优化网站
  • 做网站需要注意什么问题微信公众平台网页版登陆
  • 合肥网站建设需要多少钱网站免费推广怎么做
  • 网站建设小组实训总结百度指数免费查询入口
  • 市场监督管理局举报电话网站在线seo
  • 公司网站的设计规划wordpress 输出内容
  • 网站建设 诺德中心WordPress邮箱验证 注册
  • 广西南宁电商网站建设分析网站设计对网站搜索引擎友好性的影响
  • wordpress注册页面模板怎么修改优化培训学校
  • 网站开发技术 北京申请域网站
  • 哪个公司建网站好沈阳妇科排名前十的医院
  • 农业建设信息网站网架加工厂的地址
  • 网站建设功能需求文档外贸搜索推广
  • 润州网站建设长沙微信公众号
  • 软文推广做的比较好的推广平台毕节地seo
  • 如何做网站搭建api接口html5标准网站建设
  • 电商网站系统建设考试网站建设软件定制开发
  • 百度如何给网站做评价wordpress存储
  • 氧化锌网站建设wordpress发消息
  • 深圳创业补贴2024seo搜索引擎优化是什么
  • 可拖拽网站织梦网站安装播放视频插件下载
  • 苏州集团网站制作设计现在比较好的营销平台
  • 网站文章质检大兴做网站
  • php网站开发更换模板买商标最好的平台