汀的知识碎片
Search
Search
Dark mode
Light mode
文章导航
Home
❯
大数据
❯
读书笔记 大数据概览
Folder: 大数据/读书笔记-大数据概览
20 items under this folder.
Feb 28, 2026
01 HDFS:分布式文件系统的数据可靠性与扩展性
Feb 28, 2026
02 YARN:资源调度架构与多租户实践
Feb 28, 2026
03 MapReduce:编程模型与执行引擎剖析
Feb 28, 2026
04 Apache Tez:DAG 引擎与性能优化
Feb 28, 2026
05 Apache Hive:元数据中枢 HMS 与查询编译全流程
Feb 28, 2026
06 Hive ACID 与 Compaction:事务机制与小文件治理
Feb 28, 2026
07 Hive LLAP:低延迟查询加速技术
Feb 28, 2026
08 Apache Spark:核心架构与执行模型
Feb 28, 2026
09 Spark 内存管理与 Tungsten 引擎
Feb 28, 2026
10 Spark SQL 与 Catalyst 优化器
Feb 28, 2026
11 大数据文件格式对决:ORC、Parquet、Avro
Feb 28, 2026
12 Apache Iceberg:表格式革命与数据湖事务
Feb 28, 2026
13 实时数据湖:Delta Lake 与 Apache Hudi 核心机制
Feb 28, 2026
14 PySpark 与 Hive 集成:Python 大数据分析实践
Feb 28, 2026
15 Spark MLlib:分布式机器学习算法实现
Feb 28, 2026
16 Spark 特征工程:从提取到选择的全链路机制
Feb 28, 2026
17 Hadoop 云部署模式:从 On-Premise 到云原生
Feb 28, 2026
18 Apache Kafka:高吞吐消息队列与流集成
Feb 28, 2026
19 Apache Flink:流处理与批流一体
Feb 28, 2026
20 Apache Ranger:统一安全管控与审计