汀的知识碎片

Tag: Hudi

9 items with this tag.

  • Mar 02, 2026

    Apache Hudi:增量数据湖架构深度解析 · 专栏导览

    • Hudi
    • 数据湖
    • Lakehouse
    • CDC
    • 增量处理
    • 专栏导览
  • Mar 02, 2026

    为什么需要 Hudi——Uber 的 CDC 增量数仓困境与 Timeline 解法

    • Hudi
    • 数据湖
    • CDC
    • 增量处理
    • Lakehouse
    • Delta-Lake对比
    • Timeline
    • 数据摄入
  • Mar 02, 2026

    存储类型深度解析——CoW vs MoR 的设计权衡与适用场景

    • Hudi
    • CoW
    • MoR
    • Copy-on-Write
    • Merge-on-Read
    • 存储类型
    • 性能权衡
    • Compaction
  • Mar 02, 2026

    Timeline 机制——Hudi 事务与增量语义的核心

    • Hudi
    • Timeline
    • 事务
    • ACID
    • 增量语义
    • Commit
    • Compaction
    • Rollback
    • 状态机
  • Mar 02, 2026

    Upsert 写入路径——Index 机制、HoodieKey 与 Bucket Index

    • Hudi
    • Upsert
    • Index
    • HoodieKey
    • Bloom-Filter
    • Bucket-Index
    • 写入路径
    • Record-Level-Index
  • Mar 02, 2026

    增量查询与 Incremental Pull——流批一体的数据消费

    • Hudi
    • 增量查询
    • Incremental-Query
    • Incremental-Pull
    • CDC消费
    • 流批一体
    • Checkpoint
    • 增量ETL
  • Mar 02, 2026

    Hudi vs Delta Lake vs Iceberg——架构设计的本质差异与选型

    • Hudi
    • Delta-Lake
    • Iceberg
    • 数据湖对比
    • Lakehouse
    • 选型
    • 架构对比
    • CDC
    • 流批一体
  • Mar 02, 2026

    Iceberg vs Delta Lake vs Hudi——格式开放性与生态广度对比

    • Iceberg
    • Delta-Lake
    • Hudi
    • 数据湖对比
    • 开放表格式
    • 生态广度
    • 云原生
    • 选型
    • REST-Catalog
  • Mar 02, 2026

    Paimon vs Delta Lake vs Iceberg vs Hudi——流存储视角的架构总结

    • Paimon
    • Delta-Lake
    • Iceberg
    • Hudi
    • 数据湖对比
    • 流存储
    • 实时数仓
    • LSM-Tree
    • 选型
    • 流批一体

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community