当前位置: 首页 > news >正文

备案博客域名做视频网站会怎么样个人微信小程序怎么开通

备案博客域名做视频网站会怎么样,个人微信小程序怎么开通,北京做网站的人,制作一个网站怎么架构这是仿真过程某图: 仿真实战kafka kafka消费sink端和StructuredStreaming集成通信成功 , 数据接收全部接收 数据落地情况: 全部接收到并all存入mysql 下面就简单分享一下StructuredStreaming代码吧 import org.apache.spark.sql.function…

          这是仿真过程某图:

仿真场景kafkaStream
仿真实战kafka
 

 kafka消费sink端和StructuredStreaming集成通信成功 , 数据接收全部接收

数据落地情况: 

全部接收到并all存入mysql

下面就简单分享一下StructuredStreaming代码吧

import org.apache.spark.sql.functions.{col, from_json}
import org.apache.spark.sql.streaming.{ OutputMode, Trigger}
import org.apache.spark.sql.types.{IntegerType, StringType,  StructType}
import org.apache.spark.sql.{DataFrame, Dataset, Row, SparkSession}val spark: SparkSession = SparkSession.builder().appName("kafkaConsumer").master("local[3]").getOrCreate()import spark.implicits._// 定义json字段类型格式val Jsonschmea: StructType = new StructType().add("id", dataType = IntegerType).add("name", dataType = StringType).add("sorce", dataType = IntegerType)val message: DataFrame = spark.readStream // message为从kafka读到的原数据.format("kafka").option("kafka.bootstrap.servers", "xxxxx:9092,xxxx:9092,xxxx:9092").option("subscribe", "xxxx").option("startingOffsets", "latest").load()// 将json字符串转化为结构化数据val streamData: DataFrame = message.selectExpr("cast(value as String) as message") .select(from_json($"message", Jsonschmea).alias("data"))// 将json结构化为新的df// 预加载mysql驱动// 实时写入 第二个参数预占位,want给每一批次加入唯一表示, but本次仅占位没有传参数def writeToMysql(batchDF: DataFrame, epochId: Long): Unit = {val sqlurl = "jdbc:mysql://localhost:xxxx/xxxx"val sqluser = "xxxx"val sqlpass = "xxxxx"Class.forName("com.mysql.cj.jdbc.Driver")  // mysql 8.0后得驱动,旧版本去掉cjbatchDF.foreachPartition {partitionOfRecords =>val connection = DriverManager.getConnection(sqlurl, sqluser, sqlpass)// 关闭自动提交以支持增量写入connection.setAutoCommit(false)// 创建预编译的插入语句val insertsql = "insert into jsonstream(id,name,sorce) values(?,?,?)"val preparedStatement = connection.prepareStatement(insertsql)partitionOfRecords.foreach {row =>
//              val id = row.getAs[Int]("data.id")
//              val name = row.getAs[String]("data.name")
//              val score = row.getAs[Int]("data.sorce")val id = row.getAs[Row]("data").getAs[Int]("id")val name = row.getAs[Row]("data").getAs[String]("name")val sorce = row.getAs[Row]("data").getAs[Int]("sorce")// 设置参数到预处理sql函数中preparedStatement.setInt(1, id)preparedStatement.setString(2, name)preparedStatement.setInt(3, sorce)// 执行添加到批次操作preparedStatement.addBatch()}preparedStatement.executeBatch()connection.commit() // 执行批处理后手动提交事务preparedStatement.close()  // 手动GCconnection.close()}}// 数据落地到数据库streamData.writeStream.outputMode(OutputMode.Append()).foreachBatch(writeToMysql _).trigger(Trigger.ProcessingTime("1 millisecond")) // 1 毫秒每个batch.start().awaitTermination()

存储按照一定批次量做存储   

友情提示 : 上述程序是经过脱敏处理的哦

----彩蛋----

如果你看到者你会知道scala在11更新之后也就是12版本如下:

batchDF.foreachPartition {partitionOfRecords => ... 这个位置

 Dataset的foreachPartition 里面不能处理 Row的Iterator, 所以需要转为rdd在做处理

所以更改后为

batchDF.rdd.foreachPartition { partitionOfRecords => ...

而且这里不能用foreach , 否则无法序列化就能存储到mysql, 不能被序列化的数据是不能在网络中进行传输的,通过二进制流的形式传出,在被反序列化回来转化为对象的形式存储

ok -----

http://www.yayakq.cn/news/47539/

相关文章:

  • dede古风类网站源码建设电子商务网站需要什么
  • 做婚纱摄影网站多少钱宁阳网站建设
  • 建网站做seo做饲料的专业网站
  • 东莞凤岗网站建设制作wordpress 登录验证码
  • 中文手机网站设计案例wordpress 教程 知乎
  • 平陆网站建设如何加快网站收录
  • 三明做网站微信分享按钮wordpress高级版
  • 邢台建一个网站多少钱淘宝客如何做自己的网站
  • wordpress如何把网站语言改成英文小型建筑公司名字大全
  • 荥阳做网站江门外贸网站建设
  • 网页制作网站设计稿网站开发整套资料
  • 建网站手机wordpress知更鸟主题
  • 网站开发培训培训班南昌微网站建设
  • 关于网站建设征求意见wordpress 防止恶意注册
  • 合肥做网站多少钱排版设计是什么
  • 运城做网站哪家公司好网页设计代码td
  • 网站建设服务属于是什么费用深圳知名企业
  • 大理网站设计中企动力 网站建设 眼镜
  • 做网站建设网站制作网站的容量
  • 电脑访问手机网站跳转众创空间网站建设方案
  • 网站活跃度怎么做网页设计企业网站素材库
  • 网站制作软件dw天津建设银行公积金缴费官方网站
  • 哈尔滨网站设计快速建站莘县网站定制
  • 网站开发项目中的rdapp企业签名
  • 可信网站 quot 验证能防范哪些安全.搭建wordpress面板
  • 做国外网站赚钱盐步网站制作
  • 厦门网站建设如何推销网站建设
  • 常州微信网站建设服务济南高新区 网站建设公司
  • 精湛的赣州网站建设开平市城乡建设局网站
  • 网站排名5118黄骅港招聘