汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Tag: Hudi
9 items with this tag.
Mar 02, 2026
Apache Hudi:增量数据湖架构深度解析 · 专栏导览
Hudi
数据湖
Lakehouse
CDC
增量处理
专栏导览
Mar 02, 2026
为什么需要 Hudi——Uber 的 CDC 增量数仓困境与 Timeline 解法
Hudi
数据湖
CDC
增量处理
Lakehouse
Delta-Lake对比
Timeline
数据摄入
Mar 02, 2026
存储类型深度解析——CoW vs MoR 的设计权衡与适用场景
Hudi
CoW
MoR
Copy-on-Write
Merge-on-Read
存储类型
性能权衡
Compaction
Mar 02, 2026
Timeline 机制——Hudi 事务与增量语义的核心
Hudi
Timeline
事务
ACID
增量语义
Commit
Compaction
Rollback
状态机
Mar 02, 2026
Upsert 写入路径——Index 机制、HoodieKey 与 Bucket Index
Hudi
Upsert
Index
HoodieKey
Bloom-Filter
Bucket-Index
写入路径
Record-Level-Index
Mar 02, 2026
增量查询与 Incremental Pull——流批一体的数据消费
Hudi
增量查询
Incremental-Query
Incremental-Pull
CDC消费
流批一体
Checkpoint
增量ETL
Mar 02, 2026
Hudi vs Delta Lake vs Iceberg——架构设计的本质差异与选型
Hudi
Delta-Lake
Iceberg
数据湖对比
Lakehouse
选型
架构对比
CDC
流批一体
Mar 02, 2026
Iceberg vs Delta Lake vs Hudi——格式开放性与生态广度对比
Iceberg
Delta-Lake
Hudi
数据湖对比
开放表格式
生态广度
云原生
选型
REST-Catalog
Mar 02, 2026
Paimon vs Delta Lake vs Iceberg vs Hudi——流存储视角的架构总结
Paimon
Delta-Lake
Iceberg
Hudi
数据湖对比
流存储
实时数仓
LSM-Tree
选型
流批一体