汀的知识碎片

Tag: Parquet

2 items with this tag.

  • Feb 28, 2026

    ORC 与 Parquet:列式存储格式的内部结构与选型

    • Hive
    • ORC
    • Parquet
    • 列式存储
    • 压缩
    • 谓词下推
    • Row-Group
    • Stripe
    • 文件格式
    • 编码
  • Feb 28, 2026

    数据源与 IO 优化:让数据少读、快读、不重读

    • Spark
    • SparkSQL
    • IO优化
    • Parquet
    • 分区裁剪
    • 谓词下推
    • 布隆过滤器
    • 列裁剪
    • 文件合并
    • DataSource-V2
    • 缓存

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community