跳到主要内容

4 篇文档带有标签「性能优化」

查看所有标签

Hive 执行计划 ⭐️⭐️⭐️

本文详细介绍了 Hive EXPLAIN 的使用方法,通过解读执行计划中的 Stage 和 Operator,结合实际案例,帮助诊断 SQL 性能瓶颈,掌握 Hive 调优的核心技巧。

Hive任务优化总览 ⭐️⭐️⭐️

面对Hive离线数仓任务耗时过长的问题,本文提供了一套系统性的性能优化指南。文章从HiveQL逻辑、数据模型、参数调优及任务调度四大维度出发,深入剖析了列裁剪、谓词下推、Join关联、数据倾斜、小文件治理等11个核心优化技巧,并提供了具体的SQL示例与参数配置建议,旨在帮助数据开发者高效定位并解决性能瓶颈。

HQL语法优化 ⭐️⭐️⭐️

本文详细介绍了 Hive SQL 的六种核心性能优化技术,包括列/分区裁剪、谓词下推、聚合优化、Join 优化和排序优化,通过代码实例和执行计划分析,助你写出更高性能的 HQL。

数据倾斜优化 ⭐️⭐️⭐️

深入探讨数据倾斜的成因、表现,并针对 GROUP BY、JOIN 和 COUNT DISTINCT 等常见场景,提供详细的优化方案与代码实践。