汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Home
❯
大数据
❯
Spark
❯
Spark Shuffle与内存管理机制深度解析
Folder: 大数据/Spark/Spark-Shuffle与内存管理机制深度解析
12 items under this folder.
Feb 28, 2026
Remote Shuffle Service:解耦计算与 Shuffle 存储
Spark
RSS
Remote-Shuffle-Service
Apache-Celeborn
Uber-RSS
Linkedin-Magnet
云原生
Push-based-Shuffle
Feb 27, 2026
Spark Shuffle 与内存管理机制深度解析 · 专栏导览
Spark
Shuffle
内存管理
UnifiedMemoryManager
RSS
Feb 27, 2026
为什么 Shuffle 是分布式计算的命门
Spark
Shuffle
分布式计算
MapReduce
性能优化
Feb 27, 2026
Hash Shuffle 的设计与致命缺陷
Spark
Shuffle
HashShuffle
File-Consolidation
性能优化
Feb 27, 2026
Sort Shuffle 的崛起:统一写出模型
Spark
Shuffle
SortShuffleManager
BypassMergeSortShuffleWriter
UnsafeShuffleWriter
SortShuffleWriter
Feb 27, 2026
Shuffle Write 深度解剖:排序、合并与索引文件
Spark
Shuffle
ExternalSorter
PartitionedAppendOnlyMap
Spill
索引文件
Feb 27, 2026
Shuffle Read 深度解剖:拉取、聚合与排序
Spark
Shuffle
BlockStoreShuffleReader
MapOutputTracker
ExternalAppendOnlyMap
网络拉取
Feb 27, 2026
Spark 统一内存管理模型
Spark
内存管理
UnifiedMemoryManager
StaticMemoryManager
Execution-Memory
Storage-Memory
Feb 27, 2026
Execution 与 Storage 的动态边界
Spark
内存管理
UnifiedMemoryManager
Execution-Memory
Storage-Memory
RDD-Cache
动态借用
Feb 27, 2026
Spill 机制:从内存到磁盘的安全阀
Spark
Spill
内存管理
ExternalSorter
磁盘IO
性能调优
MemoryConsumer
Feb 27, 2026
堆外内存与 Tungsten Unsafe 内存世界
Spark
Tungsten
UnsafeRow
堆外内存
MemoryBlock
sun.misc.Unsafe
GC优化
二进制格式
Feb 27, 2026
生产调优手册:从症状到根因的系统性诊断
Spark
调优
生产实践
数据倾斜
Spill
OOM
Shuffle
内存配置