汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Tag: 数据湖
11 items with this tag.
Mar 05, 2026
04 JuiceFS 在大数据场景的应用
JuiceFS
Hadoop
Spark
Flink
AI训练
数据湖
HDFS替代
大数据存储
Mar 05, 2026
Connector 体系——Hive、Iceberg 与联邦查询
中间件
Trino
Connector
Hive
Iceberg
联邦查询
SPI
谓词下推
数据湖
Mar 03, 2026
08 分布式事务在大数据场景下的实践
分布式事务
大数据
Hive
Spark
Flink
Delta-Lake
Iceberg
数据湖
幂等写入
Mar 02, 2026
Apache Hudi:增量数据湖架构深度解析 · 专栏导览
Hudi
数据湖
Lakehouse
CDC
增量处理
专栏导览
Mar 02, 2026
为什么需要 Hudi——Uber 的 CDC 增量数仓困境与 Timeline 解法
Hudi
数据湖
CDC
增量处理
Lakehouse
Delta-Lake对比
Timeline
数据摄入
Mar 02, 2026
Apache Iceberg:开放表格式深度解析 · 专栏导览
Iceberg
数据湖
Lakehouse
开放表格式
多引擎
专栏导览
Mar 02, 2026
为什么需要 Iceberg——Netflix 的多引擎困境与开放表格式
Iceberg
数据湖
开放表格式
Netflix
Hive元存储
多引擎
分区
HMS
Mar 02, 2026
Apache Paimon:流存储数据湖深度解析 · 专栏导览
Paimon
数据湖
LSM-Tree
流存储
Flink
实时数仓
专栏导览
Mar 02, 2026
为什么需要 Paimon——Flink 实时写湖的延迟困境与 LSM 解法
Paimon
LSM-Tree
Flink
实时数仓
流存储
数据湖
延迟
Checkpoint
写湖困境
Feb 28, 2026
Delta Lake:Lakehouse 架构深度解析 · 专栏导览
Delta-Lake
Lakehouse
数据湖
ACID
专栏导览
Feb 28, 2026
为什么需要 Lakehouse:数据仓库与数据湖的架构演进
Delta-Lake
Lakehouse
数据仓库
数据湖
架构演进
ACID
Lambda架构