这个算法真是研究了好久才明白……众多博客真的不是面向小白的
模板拿cf600E举例子,问题是给一棵有根树(rt==1),每个节点有一个颜色值,树的节点数和颜色值的范围都是1e5。对于每个节点我们定义其子树中数量最多的那个颜色值为主颜色(可以有多个并列),现要给出每个节点的主颜色的值的和。
首先想到暴力做法,直接去挨个点算他们的子树的答案,统计子树中每种颜色的数量并维护当前主颜色的和。这种算法显然是$O(n^2)$的。同时我们注意到一个细节,每个点的访问计算中所用到的cnt数组,应该是一个公用的全局数组,因为节点和颜色值的上限都是1e5,我们没法建立一个cnt[maxn][maxcolor]的数组(如果能建就简单多了),所以每次在访问一个点后,需要清空该点的树的记录,因为后面马上要去访问它的兄弟节点。这时就需要再写一个dfs去清除记录,用dfs而不是memset去清除是因为可以精准限制访问次数。
那么优化点在哪里呢,我们发现,当你把所有的兄弟节点访问完后,接下来需要计算父亲的答案值,又需要把这些兄弟节点的贡献加起来,十分浪费时间。如果能把他们保存在一个大数组里就好了(但是空间受限不行),最多只能保存最后访问的那个兄弟,于是我们选择把重儿子放在最后,尽可能利用这一优势。
那么这样优化下来的复杂度是多少呢?oiwiki上有严格证明,是nlogn。大概是每个点的访问次数是它到根的轻边+1?而轻边最多logn条,因为轻树的size小于父树的1/2。
看代码吧
1 | #include<bits/stdc++.h> |
再来一道cf375d
给出一棵树,m个询问(v,k)要求回答树v中有多少种颜色出现超过k次。
我们在cal函数中维护树u中各个出现次数的颜色数量,然后将询问预先存在数组中,询问同一棵树的放在一起,在dfs函数中执行完cal后去依次回答这些提问。
只贴上不同的代码:
1 | void cal(int u,int fa,int val){ |