当前位置: 首页 > news >正文

微信怎么建设自己网站专做充电器的网站

微信怎么建设自己网站,专做充电器的网站,中国十大餐饮品牌策划公司,做网站的软件叫什么软件Hive Sampling 抽样函数 文章目录Hive Sampling 抽样函数Random随机抽样Block 基于数据块抽样Bucket table 基于分桶表抽样语法在HQL中,可以通过三种方式采样数据:随机采样,存储桶表采样和块采样。Random随机抽样 随机抽样使用rand()函数确保…

Hive Sampling 抽样函数

文章目录

  • Hive Sampling 抽样函数
    • Random随机抽样
    • Block 基于数据块抽样
    • Bucket table 基于分桶表抽样
      • 语法

在HQL中,可以通过三种方式采样数据:随机采样,存储桶表采样和块采样。

Random随机抽样

  • 随机抽样使用rand()函数确保随机获取数据,LIMIT来限制抽取的数据个数。
  • 表数据多时抽样速度不快,但随机。
  • 有两种用法:
    方法一:(效率较高)
SELECT * FROM student
DISTRIBUTE BY RAND() SORT BY RAND() LIMIT 2;

方法二:

SELECT * FROM student
ORDER BY RAND() LIMIT 2;

Block 基于数据块抽样

  • 允许随机获取n行数据、百分比数据、指定大小的数据
  • 采样粒度是HDFS块大小
  • 优点是速度快,但不随机
  • 例:
  1. 获取1行数据:
SELECT * FROM student
TABLESAMPLE(1 ROWS);
  1. 百分比数据:
SELECT * FROM student
TABLESAMPLE(50 PERCENT);
  1. 指定大小的数据:
SELECT * FROM student
TABLESAMPLE(1k);

Bucket table 基于分桶表抽样

  • 一种特殊的采样方法,针对分桶表进行了优化
  • 抽样既随机,速度也很快。

语法

  • y必须是table总桶数的倍数或因子。hive根据y的大小,决定抽样的比例。(当y=2,有4个桶时,抽取4/2个桶的数据)
  • x表示从哪个桶开始抽取。
  • x的值必须小于y的值。
  • ON colname表示基于什么抽
    1. ON RAND():表示随机抽
    2. ON 分桶字段:表示基于分桶字段抽样,效率更高
TABLESAMPLE (BUCKET x OUT OF y [ON colname])
  • 例:
SELECT * FROM t_usa_covid19_bucket TABLESAMPLE(BUCKET 1 OUT OF 5 ON RAND());
http://www.yayakq.cn/news/615785/

相关文章:

  • 做网站一般工资如何制作图片文字
  • 福州网站建站公司自己做网站网页剧中
  • 有没有哪个做美食的网站电子商务网站建设与管理实训
  • 商务网站开发心得嵌入式开发难学吗
  • 开题报告旅游网站建设邢台seo
  • 五年级信息做网站的软件wordpress 缓存腾讯cos
  • 怎么增加网站的反链wordpress题目
  • 素马网站建设服务收费标准中小企业网站多大空间
  • 哪些网站做商标注册成都做微信小程序的公司
  • 曹县做网站建设垂直 社交网站 建设
  • 做网站的代码南充房产信息网官网
  • 伍佰亿网站怎么做无货源电商
  • 成都建站网站模板深圳个性化建网站公司
  • 手机网站建设方法阿里万网站建设
  • 网站的作用和意义单页网站的域名
  • 如何选网站建设公司wordpress Escort
  • 包头网站建设设计中国备案查询网站
  • 产权交易网站建设方案一家只做外卖的网站
  • 网站建设新报价图片欣赏q网站建设
  • wordpress批量扫描弱口令工具引擎优化seo
  • 网站结构物理重庆市建设工程造价管理总站
  • 自架服务器建设网站网站建设的宿主选择
  • 河南省建设厅门户网站惠州seo整站优化
  • 深圳网站建设 公司基于php的网上购物系统
  • 电子商务网站搜索引擎设计紫光华宇拼音输入法官方下载
  • 潍坊网站企业网站制作前期需要什么资料
  • 合肥网站建设卫来科技官网网站备案
  • 江苏中淮建设集团有限公司网站嘉兴做美食图片的网站
  • 网站前后端分离怎么做网站开发包括哪些
  • 做推广什么网站好网站建设需要的条件