Jan 18, 2026

笛卡尔树（Cartesian Tree）及其算法实现

Table of Contents

笛卡尔树是一种极其特殊的数据结构，它巧妙地融合了二叉搜索树（BST）和堆（Heap）的特性。理解笛卡尔树，不仅仅是掌握一种树形结构，更是理解如何在序列的“顺序性”和“优先级”之间建立唯一映射的关键。

一、结构同构的唯一性

笛卡尔树的核心在于结构同构的唯一性。给定一个数组（包含数值和其索引），笛卡尔树是满足以下两个不变性的二叉树：

二叉搜索树（BST）性质（基于索引）： 对于树中的任意节点，其左子树中所有节点的索引（index）都小于该节点的索引，右子树中所有节点的索引都大于该节点的索引。这实际上意味着笛卡尔树的中序遍历结果就是原始数组序列。
堆（Heap）性质（基于数值）： 对于树中的任意节点，其值（value）必须满足堆序性（通常是大根堆或小根堆）。例如在小根堆性质中，父节点的值必然小于或等于子节点的值。

为什么它很重要？ 笛卡尔树将一个线性序列转化为一个树形结构，使得序列中的区间最值查询（Range Minimum/Maximum Query, RMQ）问题转化为树上的最近公共祖先（LCA）问题。这种转换是解决许多复杂区间问题的基石。

与 Treap 的区别：

Treap (Tree + Heap)：也是同时满足 BST 和 Heap 性质。但 Treap 的“优先级”通常是随机生成的，目的是为了平衡树高，防止 BST 退化成链表。Treap 是一种动态平衡树。
笛卡尔树：优先级是确定的（由数组数值决定），结构是唯一的。它不保证平衡，最坏情况下可能退化成链表（例如有序数组构建笛卡尔树）。它主要用于静态分析。

二、直观理解

为了直观理解笛卡尔树，我们可以使用“地形注水”或“挂载模型”作为模型。

1. 挂载模型（The Hanging Model）

想象一个横坐标为索引，纵坐标为数值的直方图。

如果你要构建一个小根堆性质的笛卡尔树，想象你从无穷高的地方向下看。你会首先看到数值最小的那根柱子。
抓住这根“最小柱子”把它提起来，它就成了根节点。
剩余的柱子会自然地垂在它的左边和右边。
然后在左边的一堆柱子里，再抓住其中最小的一根提起来，作为左子节点；右边同理。
递归这个过程，最终形成的结构就是笛卡尔树。

这个模型直观地展示了笛卡尔树的构造逻辑：数值决定层级（堆），位置决定左右（BST）。

2. 二维坐标系的唯一确定性

如果我们将数组中的每个元素看作平面上的点，笛卡尔树实际上是在构建一种空间划分。

X轴约束：保持了原本的左右相对位置。
Y轴约束：决定了上下的父子关系。由于对通常是唯一的（假设值不重复或规定了处理规则），因此对于一个没有重复元素的序列，其对应的笛卡尔树是唯一的。

三、算法实现：线性构建（单调栈法）

虽然可以通过递归寻找区间最小值来构建笛卡尔树（时间复杂度或），但最高效的方法是使用单调栈实现的线性构建。

核心逻辑：右脊（Right Spine）的维护 当我们按照索引顺序（从左到右）逐个插入元素时，新插入的节点的索引最大，根据 BST 性质，它一定位于树的“最右侧路径”上（即从根节点一直往右子节点走的那条路径，称为“右脊”）。

我们需要调整右脊，以满足堆性质（假设构建小根堆）：

向右下潜：新节点试图成为右脊末端节点的右孩子。
向上回溯：如果的值比右脊上的某些节点小，破坏了堆性质，那么必须“篡位”，成为这些较大节点的父节点。

逐步构建过程：

假设我们要构建一个小根堆笛卡尔树，使用一个单调递增栈来存储当前树的右脊上的节点。

遍历：按索引到遍历数组。设当前节点为。
出栈（维护堆性质）：查看栈顶元素（即右脊最末端的节点）。如果栈顶元素的值大于的值，说明栈顶元素不能做的父节点（违反小根堆性质）。
- 将栈顶元素弹出。
- 记录最后一次弹出的节点为。
- 重复此步骤，直到栈为空或栈顶元素的值小于。
连接左子树：在步骤2中， “篡位”成功。原本在右脊上的那些比大的节点，现在必须挂在的左边（因为它们的索引比小，且值比大）。
- 操作：。
连接父节点：此时栈顶元素（如果存在）的值小于。根据 BST 性质，索引更大，应在右侧。
- 操作：。
入栈：将压入栈中，成为右脊的新末端。

复杂度为什么是？

尽管内部有一个 while 循环，但观察每个节点的状态变化：每个节点最多进栈一次，最多出栈一次。因此，总的操作次数是线性的。

代码实现范例（C++）：

#include <iostream>
#include <vector>
#include <stack>

using namespace std;

struct Node {
    int id;       // 原始数组索引
    int val;      // 数值
    int left = 0; // 左子节点索引
    int right = 0;// 右子节点索引
};

// 构建小根堆性质的笛卡尔树
// nums: 输入数组 (下标从1开始便于理解，0作为空节点)
vector<Node> buildCartesianTree(const vector<int>& nums) {
    int n = nums.size();
    vector<Node> tree(n + 1);
    stack<int> s; // 单调栈，存储节点索引

    for (int i = 0; i < n; ++i) {
        tree[i+1].id = i + 1;
        tree[i+1].val = nums[i];
        
        int last_popped = 0; // 记录最近一个被弹出的节点
        
        // 维护单调递增栈（小根堆性质：栈底小，栈顶大）
        // 如果当前值比栈顶小，说明当前值应该在上方，栈顶元素应成为其左子树
        while (!s.empty() && tree[s.top()].val > tree[i+1].val) {
            last_popped = s.top();
            s.pop();
        }
        
        // 1. 连接左子树：被弹出的节点成为当前节点的左孩子
        tree[i+1].left = last_popped;
        
        // 2. 连接父节点：当前节点成为栈顶节点的右孩子
        if (!s.empty()) {
            tree[s.top()].right = i + 1;
        }
        
        s.push(i + 1);
    }
    
    // 根节点是栈底元素
    return tree; 
}

四、应用场景

区间最值查询 (RMQ) 与 LCA 的互转：
- RMQ LCA：数组区间的最小值，即笛卡尔树中节点和节点的最近公共祖先（LCA）的值。
- LCA RMQ：这使得我们可以利用由 Tarjan 算法或倍增法支持的高效 LCA 算法来解决 RMQ 问题，或者反之，利用 +/-1 RMQ 算法在时间内解决 LCA。
最大矩形面积问题 (Largest Rectangle in Histogram)：
- 这是笛卡尔树最经典的应用之一。对于直方图中的每一根柱子，其向左和向右能扩展的边界，实际上受限于其在笛卡尔树中的父节点。通过构建笛卡尔树，可以在时间内解决此问题。
- 笛卡尔树上的每个节点代表一个矩形条。
- 以该节点为最小值的最大区间，对应于该节点在笛卡尔树中的子树大小（如果是下标作为键值，则是左右子树的最远边界）。
表达式树构建：
- 如果将运算符看作节点，优先级作为“数值”，位置作为“索引”，笛卡尔树的构建过程实际上就是在解析数学表达式，构建语法树。

五、例题解析

P14989 传送

本题的核心在于分析题目中定义的“移动规则”与数据结构之间的几何性质。

图论视角的分析： 题目给定了一个有向图，节点有两条出边，分别指向左侧第一个比它大的节点和右侧第一个比它大的节点。如果不存在，则指向自己（形成自环）。由于且（除非自环），所有的移动都是从权值小的节点向权值大的节点进行。这意味着：

图中不存在除了自环以外的环。
这是一张有向无环图（DAG），最终所有节点都会汇聚到全图最大值节点（或者是局部峰值，但根据定义，除了全局最大值，局部峰值也会指向更远的更大值，最终都会流向全局最大值）。

笛卡尔树（Cartesian Tree）的性质关联： 题目中“左边/右边第一个比自己大的元素”这一描述，是笛卡尔树（大根堆性质）构建过程中的标准定义。在一棵以值为权值构建的笛卡尔树中：

根节点是区间内的最大值。
对于任意节点，其左子节点是原序列中左侧子区间的最大值，右子节点是右侧子区间的最大值。
关键性质：节点在树上的父节点，恰好是和中距离较近（或者根据构建逻辑选定）的那个节点，且。
关于边的结论：原题中的两条出边和，在笛卡尔树上，一条对应于“指向父节点”的边，另一条则指向“更高层的祖先节点”。

连通性结论： 由于从任意节点出发的边都指向笛卡尔树上的祖先节点，且必定包含指向直接父节点的路径（或等效路径），因此：

在原图中，从节点出发能到达的所有节点集合，严格等价于笛卡尔树上的所有祖先节点集合（包含自身）。
题目要求多个起始点的机器人汇合。若它们最终能在某点汇合，则必须同时属于所有的可达集合。
即：。
根据树的性质，多个节点的公共祖先集合，等价于这组节点的最近公共祖先（LCA）的所有祖先节点。

问题转化： 对于每个任务，给定集合，我们需要找到它们在笛卡尔树上的最近公共祖先。最终可能的汇合点数量，就是的祖先节点数量（包含自身），在树上等价于节点的深度（depth）（设根节点深度为 1）。

我们将问题分解为三个阶段：建树、预处理、查询响应。

阶段一：构建笛卡尔树

利用单调栈（Monotonic Stack）可以在时间内构建笛卡尔树。
维护一个存储节点编号的栈，使得栈中节点对应的值单调递减。
当扫描到新元素时，将栈中所有小于的元素弹出。不仅要弹出，还需要维护树的结构：
1. 最后一个被弹出的节点，通过“接管”关系，变为的左子节点。
2. 弹栈结束后，当前栈顶元素（若存在）变为的父节点（即是栈顶的右子节点）。
3. 将入栈。

阶段二：LCA 预处理

为了在大规模数据下快速查询 LCA，采用倍增法（Binary Lifting）或欧拉序 + ST表（RMQ）。
需要一次 DFS 遍历，计算每个节点的深度 depth，以及初始化倍增数组 up[u][j]（表示向上跳步的祖先）。同时也需要记录DFS序（dfn），用于后续查询优化。

阶段三：查询优化与处理

对于一个包含个节点的集合求 LCA，朴素做法是迭代求取：，耗时。
优化策略：在树上，一组节点的 LCA 等价于该组节点中DFS序最小的节点与DFS序最大的节点的 LCA。
对于每个查询，只需遍历个点找出 min_dfn_node 和 max_dfn_node，计算这两个点的 LCA 即可。复杂度降为。
最终答案为 depth[LCA]。

六、总结

笛卡尔树通过索引维持左右顺序，通过数值维持上下层级。它是将一维序列的拓扑结构显式化的一种手段。掌握单调栈构建法是理解该数据结构的关键，其本质是在扫描序列的过程中，动态维护“当前最右侧路径”的形态，从而实现线性时间的结构化。

笛卡尔树（Cartesian Tree）及其算法实现

一、 结构同构的唯一性

二、 直观理解