汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Tag: Shuffle
12 items with this tag.
Feb 28, 2026
Join 深度解析:五种 Join 策略的实现机制
Hive
Join
MapJoin
CommonJoin
BucketMapJoin
SMBJoin
SkewJoin
Shuffle
数据倾斜
执行机制
Feb 28, 2026
全参数速查手册:Spark SQL 核心配置一览
Spark
SparkSQL
配置参数
调优参数
速查手册
AQE
CBO
Join
Shuffle
内存
IO
Feb 28, 2026
存储与 Shuffle:PVC、HostPath 与 Remote Shuffle Service
Spark
Kubernetes
Shuffle
PVC
HostPath
Remote-Shuffle-Service
Uniffle
RSS
存储
动态资源分配
Feb 27, 2026
04 依赖关系的本质:宽依赖与窄依赖的结构定义与性能边界
Spark
RDD
依赖关系
Shuffle
DAGScheduler
Feb 27, 2026
07 分区器(Partitioner):分布式数据布局的数学逻辑与数据倾斜攻坚
Spark
RDD
Partitioner
数据倾斜
Shuffle
Feb 27, 2026
Spark Shuffle 与内存管理机制深度解析 · 专栏导览
Spark
Shuffle
内存管理
UnifiedMemoryManager
RSS
Feb 27, 2026
为什么 Shuffle 是分布式计算的命门
Spark
Shuffle
分布式计算
MapReduce
性能优化
Feb 27, 2026
Hash Shuffle 的设计与致命缺陷
Spark
Shuffle
HashShuffle
File-Consolidation
性能优化
Feb 27, 2026
Sort Shuffle 的崛起:统一写出模型
Spark
Shuffle
SortShuffleManager
BypassMergeSortShuffleWriter
UnsafeShuffleWriter
SortShuffleWriter
Feb 27, 2026
Shuffle Write 深度解剖:排序、合并与索引文件
Spark
Shuffle
ExternalSorter
PartitionedAppendOnlyMap
Spill
索引文件
Feb 27, 2026
Shuffle Read 深度解剖:拉取、聚合与排序
Spark
Shuffle
BlockStoreShuffleReader
MapOutputTracker
ExternalAppendOnlyMap
网络拉取
Feb 27, 2026
生产调优手册:从症状到根因的系统性诊断
Spark
调优
生产实践
数据倾斜
Spill
OOM
Shuffle
内存配置