汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Tag: Hive
16 items with this tag.
Mar 05, 2026
Connector 体系——Hive、Iceberg 与联邦查询
中间件
Trino
Connector
Hive
Iceberg
联邦查询
SPI
谓词下推
数据湖
Mar 03, 2026
08 分布式事务在大数据场景下的实践
分布式事务
大数据
Hive
Spark
Flink
Delta-Lake
Iceberg
数据湖
幂等写入
Feb 28, 2026
Hive 深度解析专栏导览
Hive
HiveServer2
HMS
Tez
MapReduce
元数据
查询优化
生产运维
Feb 28, 2026
HiveServer2 架构深度解析:从 Thrift 到 Session 生命周期
Hive
HiveServer2
Thrift
Session
Operation
HA
ZooKeeper
并发
生产运维
Feb 28, 2026
Hive Metastore 深度解析:元数据体系与 HMS 高可用
Hive
HiveMetastore
HMS
元数据
MySQL
Thrift
高可用
ZooKeeper
元数据模型
Feb 28, 2026
SQL 编译全链路:从 HQL 到 Operator Tree
Hive
SQL编译
ANTLR
AST
SemanticAnalyzer
QueryBlock
OperatorTree
逻辑优化
执行计划
Feb 28, 2026
执行引擎对比:MapReduce vs Tez 的本质差异
Hive
MapReduce
Tez
DAG
Container复用
执行引擎
YARN
ApplicationMaster
性能对比
Feb 28, 2026
查询优化器:RBO 规则集与 CBO 代价模型
Hive
查询优化器
RBO
CBO
Calcite
统计信息
ANALYZE
Join策略
谓词下推
代价模型
Feb 28, 2026
Join 深度解析:五种 Join 策略的实现机制
Hive
Join
MapJoin
CommonJoin
BucketMapJoin
SMBJoin
SkewJoin
Shuffle
数据倾斜
执行机制
Feb 28, 2026
分区与分桶:物理数据组织的核心机制
Hive
分区
分桶
动态分区
分区裁剪
Bucketing
元数据膨胀
数据组织
表设计
Feb 28, 2026
ORC 与 Parquet:列式存储格式的内部结构与选型
Hive
ORC
Parquet
列式存储
压缩
谓词下推
Row-Group
Stripe
文件格式
编码
Feb 28, 2026
UDF 开发体系:GenericUDF、UDAF 与 UDTF 全解
Hive
UDF
GenericUDF
UDAF
UDTF
类加载
文件描述符泄漏
函数注册
自定义函数
JAR
Feb 28, 2026
Tez 调优实战:DAG 诊断、内存配置与数据倾斜治理
Hive
Tez
性能调优
DAG诊断
内存配置
数据倾斜
向量化执行
TezUI
慢Vertex
Container
Feb 28, 2026
生产运维:Kerberos 认证、连接池与监控体系
Hive
Kerberos
JDBC连接池
JVM调优
监控
Prometheus
G1GC
HS2运维
生产实践
Feb 28, 2026
故障排查手册:从 HS2 无响应到 Tez 作业失败的系统诊断
Hive
故障排查
HS2
Tez
OOM
Kerberos
数据倾斜
诊断方法论
生产运维
全链路诊断
Feb 28, 2026
多引擎生态:Spark、Presto、Flink 与 Hive 的互操作
Delta-Lake
多引擎
Presto
Flink
Hive
UniForm
Iceberg
Delta协议
互操作
开放格式