汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Home
❯
大数据
❯
Spark
❯
Spark Structured Streaming流处理深度解析
Folder: 大数据/Spark/Spark-Structured-Streaming流处理深度解析
13 items under this folder.
Feb 28, 2026
Spark Structured Streaming 流处理深度解析:专栏导览
Spark
Structured-Streaming
流处理
实时计算
Watermark
有状态算子
Feb 28, 2026
微批执行模型:MicroBatch 与 Continuous Processing 的本质差异
Spark
Structured-Streaming
MicroBatch
Continuous-Processing
流处理
执行模型
触发器
Feb 28, 2026
Source 与 Sink:DataSource V2 的流式读写接口
Spark
Structured-Streaming
Source
Sink
Kafka
DataSource-V2
Exactly-once
Offset管理
Feb 28, 2026
输出模式深度解析:Append、Update 与 Complete 的适用边界
Spark
Structured-Streaming
输出模式
Append
Update
Complete
聚合
Watermark
Feb 28, 2026
Watermark 全解:事件时间语义与延迟数据处理
Spark
Structured-Streaming
Watermark
事件时间
乱序数据
延迟数据
水位线
窗口
State清理
Feb 28, 2026
触发器 Trigger:ProcessingTime、Once、AvailableNow 与 Continuous
Spark
Structured-Streaming
Trigger
ProcessingTime
AvailableNow
Once
Continuous
微批
延迟
Feb 28, 2026
窗口聚合:滚动窗口、滑动窗口与会话窗口的实现机制
Spark
Structured-Streaming
窗口聚合
滚动窗口
滑动窗口
会话窗口
Tumbling-Window
Sliding-Window
Session-Window
State-Store
Feb 28, 2026
flatMapGroupsWithState:任意有状态逻辑的终极武器
Spark
Structured-Streaming
flatMapGroupsWithState
mapGroupsWithState
GroupState
有状态算子
状态机
超时机制
欺诈检测
Feb 28, 2026
流-流 Join:两条流如何在时间维度上对齐
Spark
Structured-Streaming
流-流Join
Stream-Stream-Join
Watermark
Join-Buffer
State-Store
时间对齐
Feb 28, 2026
dropDuplicates 与精确去重:Exactly-once 的应用层保障
Spark
Structured-Streaming
dropDuplicates
去重
Exactly-once
Watermark
State-Store
幂等
Feb 28, 2026
流批一体查询:Static DataFrame 与 Streaming DataFrame 的混合使用
Spark
Structured-Streaming
流批一体
流批Join
Static-DataFrame
Streaming-DataFrame
维表关联
广播Join
Feb 28, 2026
监控与可观测性:StreamingQueryListener 与生产指标体系
Spark
Structured-Streaming
监控
可观测性
StreamingQueryListener
Metrics
Spark-UI
Watermark
告警
Prometheus
Feb 28, 2026
生产调优手册:吞吐量、延迟、背压与资源配置全攻略
Spark
Structured-Streaming
调优
吞吐量
延迟
背压
资源配置
State-Store
RocksDB
生产实践