当前位置：

首页
/
IT
/
程序
/
Objective-C
/
LCA 最近公共祖先

LCA 最近公共祖先

Tarjan(离线) 算法的基本思路及其算法实现

首先是最近公共祖先的概念 (什么是最近公共祖先？)：

在一棵没有环的树上，每个节点肯定有其父亲节点和祖先节点，而最近公共祖先，就是两个节点在这棵树上深度最大的公共的祖先节点。

换句话说，就是两个点在这棵树上距离最近的公共祖先节点。

所以 LCA 主要是用来处理当两个点仅有唯一一条确定的最短路径时的路径。

有人可能会问：那他本身或者其父亲节点是否可以作为祖先节点呢？

答案是肯定的，很简单，按照人的亲戚观念来说，你的父亲也是你的祖先，而 LCA 还可以将自己视为祖先节点。

举个例子吧，如下图所示４和５的最近公共祖先是２，５和３的最近公共祖先是１，２和１的最近公共祖先是１。

这就是最近公共祖先的基本概念了，那么我们该如何去求这个最近公共祖先呢？

通常初学者都会想到最简单粗暴的一个办法：对于每个询问，遍历所有的点，时间复杂度为 O(n*q)，很明显，n 和 q 一般不会很小。

常用的求 LCA 的算法有：Tarjan/DFS+ST / 倍增

后两个算法都是在线算法，也很相似，时间复杂度在 O(logn)~O(nlogn) 之间，我个人认为较难理解。

有的题目是可以用线段树来做的，但是其代码量很大，时间复杂度也偏高，在 O(n)~O(nlogn) 之间，优点在于也是简单粗暴。

这篇博客主要是要介绍一下 Tarjan 算法 (其实是我不会在线...)。

什么是 Tarjan(离线) 算法呢？顾名思义，就是在一次遍历中把所有询问一次性解决，所以其时间复杂度是 O(n+q)。

Tarjan 算法的优点在于相对稳定，时间复杂度也比较居中，也很容易理解。

下面详细介绍一下 Tarjan 算法的基本思路：

1. 任选一个点为根节点，从根节点开始。

2. 遍历该点 u 所有子节点 v，并标记这些子节点 v 已被访问过。

3. 若是 v 还有子节点，返回 2，否则下一步。

4. 合并 v 到 u 上。

5. 寻找与当前点 u 有询问关系的点 v。

6. 若是 v 已经被访问过了，则可以确认 u 和 v 的最近公共祖先为 v 被合并到的父亲节点 a。

遍历的话需要用到 dfs 来遍历 (我相信来看的人都懂吧...)，至于合并，最优化的方式就是利用并查集来合并两个节点。

下面上伪代码：

 1 Tarjan(u)//marge和find为并查集合并函数和查找函数
 2 {
 3     for each(u,v)    //访问所有u子节点v
 4     {
 5         Tarjan(v);        //继续往下遍历
 6         marge(u,v);    //合并v到u上
 7         标记v被访问过;
 8     }
 9     for each(u,e)    //访问所有和u有询问关系的e
10     {
11         如果e被访问过;
12         u,e的最近公共祖先为find(e);
13     }
14 }

个人感觉这样还是有很多人不太理解，所以我打算模拟一遍给大家看。

建议拿着纸和笔跟着我的描述一起模拟！！

假设我们有一组数据 9 个节点 8 条边联通情况如下：

1--2，1--3，2--4，2--5，3--6，5--7，5--8，7--9 即下图所示的树

设我们要查找最近公共祖先的点为 9--8，4--6，7--5，5--3；

设 f[] 数组为并查集的父亲节点数组，初始化 f[i]=i，vis[] 数组为是否访问过的数组，初始为 0;

下面开始模拟过程：

取 1 为根节点，往下搜索发现有两个儿子 2 和 3；

先搜 2，发现 2 有两个儿子 4 和 5，先搜索 4，发现 4 没有子节点，则寻找与其有关系的点；

发现 6 与 4 有关系，但是 vis[6]=0，即 6 还没被搜过，所以不操作；

发现没有和 4 有询问关系的点了，返回此前一次搜索，更新 vis[4]=1；

表示 4 已经被搜完，更新 f[4]=2，继续搜 5，发现 5 有两个儿子 7 和 8;

先搜 7，发现 7 有一个子节点 9，搜索 9，发现没有子节点，寻找与其有关系的点；

发现 8 和 9 有关系，但是 vis[8]=0, 即 8 没被搜到过，所以不操作；

发现没有和 9 有询问关系的点了，返回此前一次搜索，更新 vis[9]=1；

表示 9 已经被搜完，更新 f[9]=7，发现 7 没有没被搜过的子节点了，寻找与其有关系的点；

发现 5 和 7 有关系，但是 vis[5]=0，所以不操作；

发现没有和 7 有关系的点了，返回此前一次搜索，更新 vis[7]=1；

表示 7 已经被搜完，更新 f[7]=5，继续搜 8，发现 8 没有子节点，则寻找与其有关系的点；

发现 9 与 8 有关系，此时 vis[9]=1，则他们的最近公共祖先为 find(9)=5；

(find(9) 的顺序为 f[9]=7-->f[7]=5-->f[5]=5 return 5;)

发现没有与 8 有关系的点了，返回此前一次搜索，更新 vis[8]=1；

表示 8 已经被搜完，更新 f[8]=5，发现 5 没有没搜过的子节点了，寻找与其有关系的点；

发现 7 和 5 有关系，此时 vis[7]=1，所以他们的最近公共祖先为 find(7)=5；

(find(7) 的顺序为 f[7]=5-->f[5]=5 return 5;)

又发现 5 和 3 有关系，但是 vis[3]=0，所以不操作，此时 5 的子节点全部搜完了；

返回此前一次搜索，更新 vis[5]=1，表示 5 已经被搜完，更新 f[5]=2；

发现 2 没有未被搜完的子节点，寻找与其有关系的点；

又发现没有和 2 有关系的点，则此前一次搜索，更新 vis[2]=1；

表示 2 已经被搜完，更新 f[2]=1，继续搜 3，发现 3 有一个子节点 6；

搜索 6，发现 6 没有子节点，则寻找与 6 有关系的点，发现 4 和 6 有关系；

此时 vis[4]=1，所以它们的最近公共祖先为 find(4)=1;

(find(4) 的顺序为 f[4]=2-->f[2]=2-->f[1]=1 return 1;)

发现没有与 6 有关系的点了，返回此前一次搜索，更新 vis[6]=1，表示 6 已经被搜完了；

更新 f[6]=3，发现 3 没有没被搜过的子节点了，则寻找与 3 有关系的点；

发现 5 和 3 有关系，此时 vis[5]=1，则它们的最近公共祖先为 find(5)=1；

(find(5) 的顺序为 f[5]=2-->f[2]=1-->f[1]=1 return 1;)

发现没有和 3 有关系的点了，返回此前一次搜索，更新 vis[3]=1；

更新 f[3]=1，发现 1 没有被搜过的子节点也没有有关系的点，此时可以退出整个 dfs 了。

经过这次 dfs 我们得出了所有的答案，有没有觉得很神奇呢？是否对 Tarjan 算法有更深层次的理解了呢？

日后将会给出一些题目对 LCA 算法进行深度分析，敬请期待！

转载请注明：http://www.cnblogs.com/ECJTUACM-873284962/

来源: http://www.cnblogs.com/ECJTUACM-873284962/p/6613379.html

与本文相关文章

暂无,快来抢沙发吧！