汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Home
❯
大数据
❯
数据湖
❯
Hudi
Folder: 大数据/数据湖/Hudi
7 items under this folder.
Mar 02, 2026
Apache Hudi:增量数据湖架构深度解析 · 专栏导览
Hudi
数据湖
Lakehouse
CDC
增量处理
专栏导览
Mar 02, 2026
为什么需要 Hudi——Uber 的 CDC 增量数仓困境与 Timeline 解法
Hudi
数据湖
CDC
增量处理
Lakehouse
Delta-Lake对比
Timeline
数据摄入
Mar 02, 2026
存储类型深度解析——CoW vs MoR 的设计权衡与适用场景
Hudi
CoW
MoR
Copy-on-Write
Merge-on-Read
存储类型
性能权衡
Compaction
Mar 02, 2026
Timeline 机制——Hudi 事务与增量语义的核心
Hudi
Timeline
事务
ACID
增量语义
Commit
Compaction
Rollback
状态机
Mar 02, 2026
Upsert 写入路径——Index 机制、HoodieKey 与 Bucket Index
Hudi
Upsert
Index
HoodieKey
Bloom-Filter
Bucket-Index
写入路径
Record-Level-Index
Mar 02, 2026
增量查询与 Incremental Pull——流批一体的数据消费
Hudi
增量查询
Incremental-Query
Incremental-Pull
CDC消费
流批一体
Checkpoint
增量ETL
Mar 02, 2026
Hudi vs Delta Lake vs Iceberg——架构设计的本质差异与选型
Hudi
Delta-Lake
Iceberg
数据湖对比
Lakehouse
选型
架构对比
CDC
流批一体