汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Home
❯
大数据
❯
Hive
Folder: 大数据/Hive
13 items under this folder.
Feb 28, 2026
Hive 深度解析专栏导览
Hive
HiveServer2
HMS
Tez
MapReduce
元数据
查询优化
生产运维
Feb 28, 2026
HiveServer2 架构深度解析:从 Thrift 到 Session 生命周期
Hive
HiveServer2
Thrift
Session
Operation
HA
ZooKeeper
并发
生产运维
Feb 28, 2026
Hive Metastore 深度解析:元数据体系与 HMS 高可用
Hive
HiveMetastore
HMS
元数据
MySQL
Thrift
高可用
ZooKeeper
元数据模型
Feb 28, 2026
SQL 编译全链路:从 HQL 到 Operator Tree
Hive
SQL编译
ANTLR
AST
SemanticAnalyzer
QueryBlock
OperatorTree
逻辑优化
执行计划
Feb 28, 2026
执行引擎对比:MapReduce vs Tez 的本质差异
Hive
MapReduce
Tez
DAG
Container复用
执行引擎
YARN
ApplicationMaster
性能对比
Feb 28, 2026
查询优化器:RBO 规则集与 CBO 代价模型
Hive
查询优化器
RBO
CBO
Calcite
统计信息
ANALYZE
Join策略
谓词下推
代价模型
Feb 28, 2026
Join 深度解析:五种 Join 策略的实现机制
Hive
Join
MapJoin
CommonJoin
BucketMapJoin
SMBJoin
SkewJoin
Shuffle
数据倾斜
执行机制
Feb 28, 2026
分区与分桶:物理数据组织的核心机制
Hive
分区
分桶
动态分区
分区裁剪
Bucketing
元数据膨胀
数据组织
表设计
Feb 28, 2026
ORC 与 Parquet:列式存储格式的内部结构与选型
Hive
ORC
Parquet
列式存储
压缩
谓词下推
Row-Group
Stripe
文件格式
编码
Feb 28, 2026
UDF 开发体系:GenericUDF、UDAF 与 UDTF 全解
Hive
UDF
GenericUDF
UDAF
UDTF
类加载
文件描述符泄漏
函数注册
自定义函数
JAR
Feb 28, 2026
Tez 调优实战:DAG 诊断、内存配置与数据倾斜治理
Hive
Tez
性能调优
DAG诊断
内存配置
数据倾斜
向量化执行
TezUI
慢Vertex
Container
Feb 28, 2026
生产运维:Kerberos 认证、连接池与监控体系
Hive
Kerberos
JDBC连接池
JVM调优
监控
Prometheus
G1GC
HS2运维
生产实践
Feb 28, 2026
故障排查手册:从 HS2 无响应到 Tez 作业失败的系统诊断
Hive
故障排查
HS2
Tez
OOM
Kerberos
数据倾斜
诊断方法论
生产运维
全链路诊断