汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Tag: Structured-Streaming
21 items with this tag.
Feb 28, 2026
Spark Structured Streaming 流处理深度解析:专栏导览
Spark
Structured-Streaming
流处理
实时计算
Watermark
有状态算子
Feb 28, 2026
微批执行模型:MicroBatch 与 Continuous Processing 的本质差异
Spark
Structured-Streaming
MicroBatch
Continuous-Processing
流处理
执行模型
触发器
Feb 28, 2026
Source 与 Sink:DataSource V2 的流式读写接口
Spark
Structured-Streaming
Source
Sink
Kafka
DataSource-V2
Exactly-once
Offset管理
Feb 28, 2026
输出模式深度解析:Append、Update 与 Complete 的适用边界
Spark
Structured-Streaming
输出模式
Append
Update
Complete
聚合
Watermark
Feb 28, 2026
Watermark 全解:事件时间语义与延迟数据处理
Spark
Structured-Streaming
Watermark
事件时间
乱序数据
延迟数据
水位线
窗口
State清理
Feb 28, 2026
触发器 Trigger:ProcessingTime、Once、AvailableNow 与 Continuous
Spark
Structured-Streaming
Trigger
ProcessingTime
AvailableNow
Once
Continuous
微批
延迟
Feb 28, 2026
窗口聚合:滚动窗口、滑动窗口与会话窗口的实现机制
Spark
Structured-Streaming
窗口聚合
滚动窗口
滑动窗口
会话窗口
Tumbling-Window
Sliding-Window
Session-Window
State-Store
Feb 28, 2026
flatMapGroupsWithState:任意有状态逻辑的终极武器
Spark
Structured-Streaming
flatMapGroupsWithState
mapGroupsWithState
GroupState
有状态算子
状态机
超时机制
欺诈检测
Feb 28, 2026
流-流 Join:两条流如何在时间维度上对齐
Spark
Structured-Streaming
流-流Join
Stream-Stream-Join
Watermark
Join-Buffer
State-Store
时间对齐
Feb 28, 2026
dropDuplicates 与精确去重:Exactly-once 的应用层保障
Spark
Structured-Streaming
dropDuplicates
去重
Exactly-once
Watermark
State-Store
幂等
Feb 28, 2026
流批一体查询:Static DataFrame 与 Streaming DataFrame 的混合使用
Spark
Structured-Streaming
流批一体
流批Join
Static-DataFrame
Streaming-DataFrame
维表关联
广播Join
Feb 28, 2026
监控与可观测性:StreamingQueryListener 与生产指标体系
Spark
Structured-Streaming
监控
可观测性
StreamingQueryListener
Metrics
Spark-UI
Watermark
告警
Prometheus
Feb 28, 2026
生产调优手册:吞吐量、延迟、背压与资源配置全攻略
Spark
Structured-Streaming
调优
吞吐量
延迟
背压
资源配置
State-Store
RocksDB
生产实践
Feb 28, 2026
Spark 容错与状态管理深度解析 —— 专栏导览
Spark
容错
状态管理
Checkpoint
Lineage
Structured-Streaming
State-Store
Feb 28, 2026
Structured Streaming 容错模型:Offset 与 Checkpoint
Spark
Structured-Streaming
容错
Checkpoint
Offset
Epoch
Exactly-once
StreamExecution
Feb 28, 2026
WAL 与幂等写出:Exactly-once 的两道保险
Spark
Structured-Streaming
WAL
幂等
Exactly-once
Kafka-Sink
Delta-Lake
ForeachBatch
事务
Feb 28, 2026
State Store 内幕:HDFSBackedStateStore 的读写路径
Spark
Structured-Streaming
State-Store
HDFSBackedStateStore
有状态计算
状态快照
增量文件
StateStoreProvider
Feb 28, 2026
RocksDB State Store:为超大状态而生
Spark
Structured-Streaming
RocksDB
State-Store
LSM-Tree
堆外内存
大状态
Spark-3.2
Feb 28, 2026
状态过期与 TTL:让 State Store 不再无限膨胀
Spark
Structured-Streaming
Watermark
TTL
状态过期
GroupState
dropDuplicates
事件时间
Feb 28, 2026
故障恢复全流程拆解:从宕机到续跑
Spark
容错
故障恢复
Executor崩溃
Driver重启
Structured-Streaming
YARN
全流程
Feb 28, 2026
流批一体:Structured Streaming 写入与读取 Delta Lake
Delta-Lake
Structured-Streaming
流批一体
Exactly-once
Delta-Source
Change-Data-Feed
增量读取
流式写入