汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Tag: SparkSQL
13 items with this tag.
Feb 28, 2026
Spark SQL 深度解析与性能调优——专栏导览
Spark
SparkSQL
Catalyst
AQE
CodeGen
向量化
性能调优
专栏
Feb 28, 2026
Spark SQL 全局架构:从 SQL 文本到 RDD 执行的完整旅程
Spark
SparkSQL
Catalyst
DataFrame
Dataset
LogicalPlan
PhysicalPlan
RDD
架构
Feb 28, 2026
Catalyst 解析与分析:从 AST 到 Analyzed LogicalPlan
Spark
SparkSQL
Catalyst
Parser
Analyzer
AST
LogicalPlan
Catalog
Antlr4
Resolution
Feb 28, 2026
Catalyst 逻辑优化:Rule-Based Optimizer 的核心规则
Spark
SparkSQL
Catalyst
Optimizer
RBO
谓词下推
列裁剪
常量折叠
子查询优化
LogicalPlan
Feb 28, 2026
CBO 代价模型:统计信息驱动的执行计划选择
Spark
SparkSQL
CBO
代价模型
统计信息
Join-Reordering
直方图
ANALYZE-TABLE
基数估算
Feb 28, 2026
Physical Planning:从逻辑计划到物理算子的策略选择
Spark
SparkSQL
Physical-Planning
Join策略
BroadcastHashJoin
SortMergeJoin
ShuffleHashJoin
BucketJoin
SparkPlan
Exchange
Feb 28, 2026
AQE:运行时自适应查询优化
Spark
SparkSQL
AQE
AdaptiveQueryExecution
动态分区合并
Skew-Join
动态Join策略
QueryStage
Spark3.0
Feb 28, 2026
Whole-Stage CodeGen:JVM 字节码级别的性能飞跃
Spark
SparkSQL
CodeGen
Whole-Stage-CodeGen
Volcano模型
JVM
字节码
Tungsten
性能优化
Feb 28, 2026
向量化执行引擎:列式处理与 SIMD 的力量
Spark
SparkSQL
向量化执行
Vectorized-Execution
ColumnarBatch
Arrow
SIMD
Parquet向量化读取
列式存储
Feb 28, 2026
数据源与 IO 优化:让数据少读、快读、不重读
Spark
SparkSQL
IO优化
Parquet
分区裁剪
谓词下推
布隆过滤器
列裁剪
文件合并
DataSource-V2
缓存
Feb 28, 2026
数据倾斜:诊断、根因与系统性解决方案
Spark
SparkSQL
数据倾斜
Skew
Salting
AQE
两阶段聚合
Broadcast
Join倾斜
长尾Task
Feb 28, 2026
Spark SQL 调优实战:从慢查询到根因的诊断方法论
Spark
SparkSQL
调优
性能诊断
慢查询
SparkUI
EXPLAIN
Join调优
OOM
调优方法论
Feb 28, 2026
全参数速查手册:Spark SQL 核心配置一览
Spark
SparkSQL
配置参数
调优参数
速查手册
AQE
CBO
Join
Shuffle
内存
IO