编辑“︁Hive数据仓库”︁（章节）

== 核心概念 ==

Hive的核心设计理念是将结构化数据映射为数据库表，并提供SQL-like查询功能（HiveQL），同时将这些查询转换为MapReduce、Tez或Spark作业在Hadoop集群上执行。以下是Hive的关键组件：

=== 元数据存储（Metastore） ===
存储表结构、分区信息等元数据，默认使用Derby数据库，但生产环境通常搭配MySQL或PostgreSQL。

=== HiveQL ===
Hive的查询语言，语法类似SQL，支持：
* 数据定义语言（DDL）：如<code>CREATE TABLE</code>
* 数据操作语言（DML）：如<code>INSERT</code>, <code>SELECT</code>
* 用户定义函数（UDF）

=== 执行引擎 ===
支持多种执行引擎：
* MapReduce（默认）
* Tez（优化DAG执行）
* Spark（内存计算）

<mermaid>
graph LR
    A[Hive CLI/Beeline] --> B[Hive Server]
    B --> C[Driver]
    C --> D[Compiler]
    D --> E[Metastore]
    C --> F[Execution Engine]
    F --> G{Hadoop}
    G --> H[HDFS]
    G --> I[YARN]
</mermaid>