当前位置: 首页 > news >正文

网站备案半身照哪家能建设网站

网站备案半身照,哪家能建设网站,wordpress depth,烟台网站建设 烟台网亿网络查找满足指定条件的app_id查询条件: 表名、时间、节点名时间限定: 最好适当放大, 不知道什么原因有点不准eventLog的存放路径: spark.history.fs.logDirectory 1. spark-sql 先限定时间段;数据是逐行读入的, 但 app_id要按整个文件过滤, 按每个条件打标;按app_id粒度聚合, 查…
  1. 查找满足指定条件的app_id
  2. 查询条件: 表名、时间、节点名
  3. 时间限定: 最好适当放大, 不知道什么原因有点不准
  4. eventLog的存放路径: spark.history.fs.logDirectory

1. spark-sql 

  • 先限定时间段;
  • 数据是逐行读入的, 但 app_id要按整个文件过滤, 按每个条件打标;
  • 按app_id粒度聚合, 查找符合条件的数据;
-- 设定时区
set spark.sql.session.timeZone=GMT+8;-- 创建数据源视图
create temporary view view_name using text options ('path'='hdfs://hdfs-cluster/spark-history/*', 'modifiedAfter'='2023-08-21T08:00:00', 'modifiedBefore'='2023-08-21T14:00:00' );with tmp as ( -- 打标数据selectinput_file_name() as file_name,if( value like '%tbl_name%', 1, 0) as table_name,if( value like '%core-1-7%', 1, 0) as host_01,if( value like '%core-1-10%', 1, 0) as host_02fromview_name
),
tmp2 as ( -- 汇总到app_id粒度selectfile_name,sum(table_name) as table_name,sum(host_01) as host_01,sum(host_02) as host_02fromtmpgroup byfile_name
)
select*
fromtmp2
wheretable_name > 0
order byfile_name
;

2. 整文件读取

  • 先初步过滤app_id;
  • 整个文件读取成一行;
  • 按条件进行过滤;
import spark.implicits._// 寻找可能的APP_ID
val sql_create_view ="""|create temporary view view_name using text options ('path'='hdfs://hdfs-cluster/spark-history/*', 'modifiedAfter'='2023-08-21T00:00:00', 'modifiedBefore'='2023-08-21T23:00:00' )|""".stripMargin
val sql_filter_app_id ="""|select|   split( input_file_name(), 'history/')[1]  as file_name|from|    view_name|where|    value like '%trandw.dwd_log_app_open_di%'|group by|    split( input_file_name(), 'history/')[1]|""".stripMargin
spark.sql(sql_create_view)
val df_app_ids = spark.sql(sql_filter_app_id)
val app_ids = df_app_ids.collect().map(_.getString(0)).mkString(",")// 整个文件读取成一行
val rdd = spark.sparkContext.wholeTextFiles(s"hdfs://hdfs-cluster/spark-history/{${app_ids}}",20).repartition(12)
val df = rdd.toDF("file_name", "value")
df.createOrReplaceTempView("tmp")// 过滤数据
val sql_str ="""|select|   file_name|from|    tmp|where|    value like '%tbl_name%'|    and value like '%core-1-7%'|    and  value like '%core-1-10%'|""".stripMarginspark.sql(sql_str).show(1)

http://www.yayakq.cn/news/275870/

相关文章:

  • 汉阳区建设局网站安卓手机应用商店
  • 徐州建站网站模板站长网网站模板下载
  • 教育培训学校网站建设方案地方门户网站取名
  • 网站注册凡科wordpress社区型主题
  • 网站制作设及的技术如何网站建设全包
  • 建购物网站多少钱美好乡村建设网站
  • 江门市住房建设管理局网站微信推广平台哪个好
  • 深圳专业做网站服务苏州it外包服务
  • 呼市赛罕区信息网站做一顿饭工作html5 手机网站导航条
  • 宁乡电商网站建设价格搞好姓氏源流网站建设
  • 门户网站开发是什么网站可以做多少个关键词
  • 如何看网站关键词专业团队电影
  • 上海建设工程交易中心网站怎样去权重高的网站做外链
  • 福州专业做网站公司郑州seo软件
  • 创建网站基本流程什么是网络营销环境
  • 小网站模板下载地址上海申请注册公司
  • 品牌网站建设市场天猫的网站导航怎么做的
  • 那些提卡网站是怎么做的东莞市电池网站建设
  • 服饰类行业_如果要建设网站_说明其建站流程.南昌网站建设价格
  • 房地产网站设计方案project 网站开发计划
  • 建设部特种作业证网站查询展示型网站制作服务
  • 网站建设论文选题网站开发 流程图
  • 安徽做网站哪家好wordpress 安全性设置
  • 做网站推广员需要wordpress 类别 排序
  • 招聘网站免费平台微信的网站开发
  • 龙华附近网站建设公司前端需要会wordpress
  • 万州网站推广wordpress有广告插件下载
  • 建设网站需要营业执照微信公众平台开发模式
  • 建设在线购物网站简单的企业小网站
  • 服装页面设计的网站最好看免费观看高清大全一影视下载