当前位置: 首页 > news >正文

推广网站广告wordpress模板极简

推广网站广告,wordpress模板极简,高清图片素材网站免费,公司做网站注意什么进入正文前,感谢宝子们订阅专题、点赞、评论、收藏!关注IT贫道,获取高质量博客内容! 🏡个人主页:含各种IT体系技术,IT贫道_Apache Doris,大数据OLAP体系技术栈,Kerberos安全认证-CSDN博客 &…

 进入正文前,感谢宝子们订阅专题、点赞、评论、收藏!关注IT贫道,获取高质量博客内容!

🏡个人主页:含各种IT体系技术,IT贫道_Apache Doris,大数据OLAP体系技术栈,Kerberos安全认证-CSDN博客

📌订阅:拥抱独家专题,你的订阅将点燃我的创作热情!

👍点赞:赞同优秀创作,你的点赞是对我创作最大的认可!

⭐️ 收藏:收藏原创博文,让我们一起打造IT界的荣耀与辉煌!

✏️评论:留下心声墨迹,你的评论将是我努力改进的方向!


目录

1. ReplaceingMergeTree建表语句

2. 示例

2. 1测试去重按照Order by 字段进行去重,而不是按照primary 主键字段进行去重。

2.2 测试不指定[ver]列时,插入相同排序字段的数据,保留最新一条数据。

2.3 测试不同分区中有相同的Order by 字段时,不去重。


以上MergeTree不能对相同主键的数据进行去重,ClickHouse提供了ReplacingMergeTree引擎,可以针对同分区内相同主键的数据进行去重,它能够在合并分区时删除重复的数据。值得注意的是,ReplacingMergeTree只是在一定程度上解决了数据重复问题,由于自动分区合并机制在后台定时执行,所以并不能完全保障数据不重复。ReplacingMergeTree 适用于在后台清除重复的数据以节省空间。

1. ReplaceingMergeTree建表语句

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster](name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],...) ENGINE = ReplacingMergeTree([ver])[PARTITION BY expr][ORDER BY expr][SAMPLE BY expr][SETTINGS name=value, ...]
  • 以上建表语句的解释如下:
  • [ver] :可选参数,指定列的版本,可以是UInt*、Date或者DateTime类型的字段作为版本号。该参数决定了数据去重的方式。当没有指定[ver]时,保留最后插入的数据,也就是最新的数据;如果指定了具体的[ver]列,则保留最大版本数据。

使用ReplacingMergeTree是需要注意以下几点:

  • 如何判断数据重复

ReplacingMergeTree在去除重复数据时,是以ORDERBY排序键为基准的,而不是PRIMARY KEY。

  • 何时删除重复数据

在执行分区合并时,会触发删除重复数据。optimize的合并操作是在后台执行的,无法预测具体执行时间点,除非是手动执行。

  • 不同分区的重复数据不会被去重

ReplacingMergeTree是以分区为单位删除重复数据的。只有在相同的数据分区内重复的数据才可以被删除,而不同数据分区之间的重复数据依然不能被剔除。

  • 数据去重的策略是什么

如果没有设置[ver]版本号,则保留同一组重复数据中的最新插入的数据;如果设置了[ver]版本号,则保留同一组重复数据中ver字段取值最大的那一行。

  • optimize命令使用

一般在数据量比较大的情况,尽量不要使用该命令。因为在海量数据场景下,执行optimize要消耗大量时间。

2. 示例

2. 1测试去重按照Order by 字段进行去重,而不是按照primary 主键字段进行去重。

#创建表 t_replacing_mt ,使用ReplacingMergeTree引擎node1 :) create table t_replacing_mt(:-] id UInt8,:-] name String,:-] age UInt8,:-] gender String:-] ) engine = ReplacingMergeTree():-] order by (id,age):-] primary key id:-] partition by gender;#向表 t_replacing_mt 中插入以下数据:node1 :) insert into t_replacing_mt values (1,'张三',18,'男'),:-] (2,'李四',19,'女'),:-] (3,'王五',20,'男');#查询表 t_replacing_mt 中的数据:node1 :) select * from t_replacing_mt;┌─id─┬─name─┬─age─┬─gender─┐│  2   │ 李四    │  19   │ 女        │└───┴────┴────┴──────┘┌─id─┬─name─┬─age─┬─gender─┐│  1   │ 张三    │  18    │ 男       ││  3   │ 王五    │  20    │ 男       │└───┴────┴────┴──────┘#向表 t_replacing_mt  中插入id 为1的一行数据node1 :) insert into t_replacing_mt values (1,'张三',10,'男');#查询表 t_replacing_mt  数据:node1 :) select * from t_replacing_mt;┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  10 │ 男       │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  18 │ 男       ││  3  │ 王五  │  20 │ 男       │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  2 │ 李四  │  19  │ 女       │└────┴──────┴─────┴────────┘#执行 optimize命令手动合并分区数据node1 :) optimize table t_replacing_mt;#查询表 t_replacing_mt  数据,发现没有按照primary key 去重。node1 :) select * from t_replacing_mt;┌─id─┬─name─┬─age─┬─gender─┐│  2  │ 李四  │  19 │ 女       │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  10 │ 男       ││  1  │ 张三  │  18 │ 男       ││  3  │ 王五  │  20 │ 男       │└────┴──────┴─────┴────────┘#再次向表  t_replacing_mt  插入数据:node1 :) insert into t_replacing_mt values (1,'张三三',18,'男');#查询表 t_replacing_mt  数据node1 :) select * from t_replacing_mt;┌─id─┬─name───┬─age─┬─gender─┐│  1    │ 张三三     │  18   │ 男        │└───┴──────┴────┴──────┘┌─id─┬─name─┬─age─┬─gender─┐│  2   │ 李四    │  19    │ 女       │└───┴────┴────┴──────┘┌─id─┬─name─┬─age─┬─gender─┐│  1    │ 张三   │  10   │  男       ││  1    │ 张三   │  18   │ 男        ││  3    │ 王五   │  20   │ 男        │└───┴─────┴───┴──────┘#再次执行 optimize命令手动合并分区数据node1 :) optimize table t_replacing_mt;#查询表 t_replacing_mt  数据node1 :) select * from t_replacing_mt;┌─id─┬─name─┬─age─┬─gender─┐│  2   │ 李四    │  19   │ 女        │└───┴────┴────┴──────┘┌─id─┬─name───┬─age─┬─gender─┐│  1   │ 张三        │  10   │ 男        ││  1   │ 张三三      │  18   │ 男        ││  3   │ 王五        │  20   │ 男        │└───┴──────┴────┴─────┘注意:通过以上测试发现ClickHouse ReplacingMergeTree中去除重复数据时,是以ORDERBY排序键为基准的,而不是PRIMARY KEY。

2.2 测试不指定[ver]列时,插入相同排序字段的数据,保留最新一条数据。

#删除表 t_replacing_mt 重建,使用ReplacingMergeTree引擎node1 :) create table t_replacing_mt(:-] id UInt8,:-] name String,:-] age UInt8,:-] gender String:-] ) engine = ReplacingMergeTree():-] order by id:-] primary key id:-] partition by gender;#向表 t_replacing_mt 中插入以下数据node1 :) insert into t_replacing_mt values (1,'张三',18,'男'),:-] (2,'李四',19,'女'),:-] (3,'王五',20,'男');#查询表 t_replacing_mt 中的数据node1 :) select * from t_replacing_mt ;┌─id─┬─name─┬─age─┬─gender─┐│  2  │ 李四  │  19  │ 女      │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  18  │ 男      ││  3  │ 王五  │  20  │ 男      │└────┴──────┴─────┴────────┘#向表 t_replacing_mt 中插入排序字段相同的一行数据node1 :) insert into t_replacing_mt values (1,'张三',10,'男');#查询表 t_replacing_mt 中的数据node1 :) select * from t_replacing_mt;┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  10  │ 男      │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  2  │ 李四  │  19  │ 女      │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  18  │ 男      ││  3  │ 王五  │   20 │ 男      │ └────┴──────┴─────┴────────┘#执行 optimize命令手动合并分区数据node1 :) optimize table t_replacing_mt;#查询表 t_replacing_mt 中的数据node1 :) select * from t_replacing_mt;┌─id─┬─name─┬─age─┬─gender─┐│  2  │ 李四  │  19  │ 女      │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  10  │ 男      ││  3  │ 王五  │  20  │ 男      │└────┴──────┴─────┴────────┘注意:通过以上测试可以发现,ClickHouse ReplacingMergeTree中不指定[ver]列时,当插入排序字段相同的数据时,保留最新一条数据。测试指定[ver]列时,插入相同排序字段的数据,保留当前[ver]列最大值。
#删除表 t_replacing_mt 重新创建,使用ReplacingMergeTree引擎,指定[ver]node1 :) create table t_replacing_mt(:-] id UInt8,:-] name String,:-] age UInt8,:-] gender String:-] ) engine = ReplacingMergeTree(age):-] order by id:-] primary key id:-] partition by gender;#向表 t_replacing_mt 中插入数据:node1 :) insert into t_replacing_mt values (1,'张三',18,'男'),:-] (2,'李四',19,'女'),:-] (3,'王五',20,'男');#查询表 t_replacing_mt中数据:node1 :) select * from t_replacing_mt ;┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  18  │ 男      ││  3  │ 王五  │  20  │ 男      │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  2  │ 李四  │  19  │ 女      │└────┴──────┴─────┴────────┘#向表 t_replacing_mt 中插入排序字段相同的一行数据node1 :) insert into t_replacing_mt values (1,'张三',10,'男');#查看表 t_replacing_mt中的数据node1 :) select * from t_replacing_mt;┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  10  │ 男      │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  1 │ 张三  │  18  │ 男       ││  3 │ 王五  │  20  │ 男       │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  2  │ 李四  │  19  │ 女      │└────┴──────┴─────┴────────┘#对表 t_replacing_mt中的数据执行手动分区合并node1 :) optimize table t_replacing_mt;#查看表 t_replacing_mt中的数据node1 :) select * from t_replacing_mt;┌─id─┬─name─┬─age─┬─gender─┐│  2 │ 李四  │  19  │ 女       │└────┴──────┴─────┴────────┘┌─id─┬─name─┬─age─┬─gender─┐│  1  │ 张三  │  18 │ 男       ││  3 │ 王五   │  20 │ 男       │└────┴──────┴─────┴────────┘注意:通过以上测试可以发现,在ClickHouse中创建ReplacingMergeTree时,如果指定了[ver]列,当存在Order by字段重复时,会保留ver列最大值对应的行。

2.3 测试不同分区中有相同的Order by 字段时,不去重。

#删除表 t_replacing_mt ,重新创建node1 :) create table t_replacing_mt(:-] id UInt8,:-] name String,:-] age UInt8,:-] gender String:-] ) engine = ReplacingMergeTree():-] order by id:-] primary key id:-] partition by gender;#向表 t_replacing_mt 中插入以下数据:node1 :) insert into t_replacing_mt values (1,'张三',18,'男'),:-] (2,'李四',19,'女'),:-] (3,'王五',20,'男');#再次向表 t_replacing_mt 中插入以下数据:node1 :) insert into t_replacing_mt values (1,'张三三',10,'女');#对表 t_replacing_mt中的数据执行手动分区合并node1 :) optimize table t_replacing_mt;#查看表中的数据node1 :) select * from t_replacing_mt;┌─id─┬─name───┬─age─┬─gender─┐│  1   │ 张三三      │  10   │ 女        ││  2   │ 李四        │  19   │ 女        │└───┴──────┴────┴─────┘┌─id─┬─name─┬─age─┬─gender─┐│  1   │ 张三    │  18   │ 男        ││  3   │ 王五    │  20   │ 男        │└───┴────┴────┴─────┘注意:通过以上测试可以发现,在ClickHouse中创建ReplacingMergeTree时,不同分区中相同的Order by 字段不会去重。

👨‍💻如需博文中的资料请私信博主。


http://www.yayakq.cn/news/595795/

相关文章:

  • 网站外链作用vi企业形象设计是什么
  • 太仓网站建设找哪家公司的seo是什么意思
  • 企业级网站开发如何撤销网站备案
  • 北滘禅城网站建设最好的ui设计培训
  • 介绍产品网站制作宁波seo推广优化哪家强
  • 云计算 网站建设wordpress案例制作
  • 无锡专业做网站的公司哪家好无锡seo网站排名优化
  • 汕头企业建站系统模板保定seo推广外包
  • 青岛企业做网站网线制作顺序图解
  • 江西恒通建设工程有限公司网站给企业做网站的平台
  • 设置网站解析永久免费建站程序
  • 游戏网站建设系统介绍公司网站公司新闻
  • seo 排名南宁百度seo网站优化
  • 怎么建网站赚钱网上服务旗舰店
  • 网站建设net接口互联网营销策划
  • 山东省建设工程质量安全协会网站智慧团建登录入口官方网站
  • 什么二手车网站做最好佳木斯市网站建设
  • 做宠物的网站主题思想网商之窗登录
  • 江西中耀建设集团有限公司网站网站建设咨询哪些方面
  • 外国炫酷网站设计网站图片优化器
  • 网站中文章内图片做超链接网站开发kxhtml
  • 外国网站快速申请qq公益 建网站
  • 衡水网站制作报价ps做网站要多大
  • 做ppt介绍网站吗wordpress 时光轴插件
  • 上海网站建设 缔客一般网站的字体是什么
  • 好看的wordpress文章模板合肥seo推广外包
  • liferay 做网站全国人防工程建设管理培训班举行
  • 福州模板建站哪家好重庆网站平台建设
  • 如何查询网站接入信息大型论坛网站建设
  • 大型网站开发案例湖南营销型网站建设 在线磐石网络