ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

structure streaming

2020-03-04 22:44:58  阅读:280  来源: 互联网

标签:批处理 处理 模式 streaming spark structure


structure steaming在spark streaming上进行了全新架构,持续处理模式支持很快很快,微批处理模式支持毫秒响应,select where groupBy map filter flatMap操作都支持
支持sparkSQL,数据抽象是dataframe 和DataSet SparkSQL只能处理静态数据
spark streaming是dstream
structure streaming关键是将实时数据流看作一张正在不断添加的无界表,spark不断添加数据进行批量计算和增量计算
在无界表上对输入的查询生成结果表,系统每隔一段时间会触发对无界表的计算并更新结果表
默认是微批处理模式,定期检查流数据源,对上一批结束后到达的新处理进行批量查询,有一点延迟因为在微批处理之前要先把处理数据的偏移量写于预写日志,这是害怕处理时发生宕机之类的,保证数据只被处理一次
持续处理模式,满足更高响应速度,需求场景比如银行卡欺诈盗刷,spark2.3.0版本以后支持这个模式,不会根据触发器来周期性处理,而是启动一系列的连续读取处理和写入写过的长时间运行任务,,它在输入流里面加一系列标记,每个时期的数据偏移量异步写入预写日志,不需要等待写入,代价就是只能实现至少一次的一致性,就是只能保证数据至少被处理一次,不能保证仅处理一次

标签:批处理,处理,模式,streaming,spark,structure
来源: https://blog.csdn.net/qq_45371603/article/details/104663104

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有