当前位置: 首页 > news >正文

营销型商务网站手机网站打不开的解决方法

营销型商务网站,手机网站打不开的解决方法,vue前端可视化开发工具,学历提升报名网是什么 Spark Streaming是一个可扩展、高吞吐、具有容错性的流式计算框架。 之前我们接触的spark-core和spark-sql都是离线批处理任务,每天定时处理数据,对于数据的实时性要求不高,一般都是T1的。但在企业任务中存在很多的实时性的任务需求&…

是什么

Spark Streaming是一个可扩展、高吞吐、具有容错性的流式计算框架。
之前我们接触的spark-core和spark-sql都是离线批处理任务,每天定时处理数据,对于数据的实时性要求不高,一般都是T+1的。但在企业任务中存在很多的实时性的任务需求,列如双十一的京东阿里都会要求做一个实时的数据大屏,显示实时订单。
在这里插入图片描述
实时计算框架对比

框架类别框架类型数据单位其他吞吐量延迟
Storm流式计算框架record的处理数据单位支持micro-batch方式一般更低
Spark批处理计算框架RDD处理数据单位支持micro-batch流式处理数据更强一般

Spark Streaming组件

  • Streaming Context
    • 一个Context启动,则不能有新的DStream建立或者添加;
    • 一个Context停止,不能重新启动;
    • 在JVM中,只能有一个Streaming Context活跃;一个Spark Context会创建一个Streaming Context;
    • Streaming Context上调用stop方法,SparkContext也会关闭,如果只想关闭Streaming Context,可以设置stop()方法里的false参数;
    • 一个SparkContext对象可以重复创建多个Streaming Context对象,但每次只能运行一个,即需要关闭一个再开下一个。
  • DStream
    • 表示一个连续的数据流;
    • DStream内部是由一系列的RDD组成;
    • DStream中的每个RDD都有确定时间间隔内的数据;
    • 对DStream的操作都转换成对DStream隐含的RDD操作;
    • 数据源:
数据源类型
基本源TCP/IP or FileSystem
高级源Kafka or Flume

Spark Streaming编码步骤

import os
# 配置spark driver和pyspark运⾏时,所使⽤的python解释器路径
PYSPARK_PYTHON = "/miniconda2/envs/py365/bin/python"
JAVA_HOME='/root/bigdata/jdk'
SPARK_HOME = "/root/bigdata/spark"
# 当存在多个版本时,不指定很可能会导致出错
os.environ["PYSPARK_PYTHON"] = PYSPARK_PYTHON
os.environ["PYSPARK_DRIVER_PYTHON"] = PYSPARK_PYTHON
os.environ['JAVA_HOME']=JAVA_HOME
os.environ["SPARK_HOME"] = SPARK_HOME
from pyspark import SparkContext
from pyspark.streaming import StreamingContextif __name__ == "__main__":sc = SparkContext("local[2]",appName="NetworkWordCount")#参数2:指定执⾏计算的时间间隔ssc = StreamingContext(sc, 1)#监听ip,端⼝上的上的数据lines = ssc.socketTextStream('localhost',9999)#将数据按空格进⾏拆分为多个单词words = lines.flatMap(lambda line: line.split(" "))#将单词转换为(单词,1)的形式pairs = words.map(lambda word:(word,1))#统计单词个数wordCounts = pairs.reduceByKey(lambda x,y:x+y)#打印结果信息,会使得前⾯的transformation操作执⾏wordCounts.pprint()#启动StreamingContextssc.start()#等待计算结束ssc.awaitTermination()

Spark Streaming状态操作

Spark Streaming存在两种状态操作:UpdateStateByKey和Window操作。

  • updateStateByKey
    如果没有updateStateByKey,我们需要将每一秒的数据计算好放入mysql中,再用mysql进行计算,而updateStateByKey将每隔一段数据进行打包,封装成RDD,这样每个时间片段的数据之间是没有关联的。一般为以下步骤:
  1. ⾸先,要定义⼀个state,可以是任意的数据类型
  2. 其次,要定义state更新函数–指定⼀个函数如何使⽤之前的state和新值来更新state
  3. 对于每个batch,Spark都会为每个之前已经存在的key去应⽤⼀次state更新函数,⽆论这个key在batch中是否有新的数据。如果state更新函数返回none,那么key对应的state就会被删除
  4. 对于每个新出现的key,也会执⾏state更新函数
  • Window
    在这里插入图片描述
    Window操作是基于窗⼝⻓度和滑动间隔来⼯作的;窗⼝的⻓度控制考虑前⼏批次数据量;默认为批处理的滑动间隔来确定计算结果的频率。
    窗口长度L是运算的数据量;
    滑动间隔G是控制每隔多长时间做一次运算。
http://www.yayakq.cn/news/239388/

相关文章:

  • 低价机票 网站建设网站服务器过期了
  • 电信的网做的网站移动网打不开该找电信还是移动濮阳网站建设熊掌网络
  • 企业营销型网站建设品牌网站项目设计流程案例
  • 安卓软件制作网站个人网站怎样申请icp
  • 国际婚恋网站排名建设网页的公司
  • 海南住房和城乡建设厅网站首页网站建设模版
  • 深圳开发网站建设哪家好郑州网站建设国奥大厦
  • 网站双收录怎么做301跳转国家信息公示系统入口
  • 番禺营销型网站建设小红书推广群
  • 实力网站优化公司首选百度竞价优化排名
  • 泉州建设培训中心网站设计公司注册需要什么条件
  • 网站建设三网合一指的是什么天津哪里能做网站
  • 网站建设的总体需求分析常德seo公司
  • vs网站模态框怎么做婚礼工作室网站模板
  • 做a视频在线观看网站wordpress转手机
  • asp.net企业网站源码专业vi机构
  • 酷炫网站首页旅游网站优化方案
  • 微信开放平台的功能介绍兰州优化网站推广
  • 在线做试卷网站服装设计图片
  • 校园招聘网站开发研究背景百度关键词推广可以自己做吗
  • 遵义住房和城乡建设局官方网站招聘代做网站
  • 网站创建需要什么msn网站制作
  • 做网站需要啥备案之类的嘛镇江市网站开发公司
  • 上海网站开发建设搜索引擎优化包括哪些
  • 企业网站成功案例电子商务网站建设与维护代码
  • 容桂佛山做app网站企业做推广有用吗
  • 搜狗网站收录提交入口wordpress微信管理系统
  • 珠海网站建设费用广告创意设计图片赏析
  • 没有网站可以做app吗什么公司需要建立网站
  • 企业网站建设方案策划做网站要实名认证吗