CF1303E序列自动机+dp

序列自动机其实就是一个数组,记录了每个位置后第一次出现字符c是哪个位置,用于解决一些子序列的问题,它共有n+1个状态,即位置0-n,每个状态都是子序列的接受状态。这个数组在On内完成构建

CF1303E:给字符串s、t问能不能从s中抽取两个不重复的子序列拼接成t。由于长度最大400,考虑枚举两个子序列的分界点,然后两个指针指向两个序列已满足的位置。最初考虑的算法是,直接看这两个指针之后的字符哪个能被较近的字符满足,就先让那个指针增1,这种算法整体是n^2的但有问题就是如果两个指针后需求的字符相同,就没法判断了,所以最后我们还是要用dp。

dp的话依然先枚举分界位置,然后设置dp[i][j]表示两个子序列分别匹配了i个和j个字符时,已使用的s的最短长度,注意对于每个分界位置i,dp范围是i*(|t|-i)的小矩形,最终整体复杂度是n^3/6。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
#include<bits/stdc++.h>
using namespace std;

const int maxn=401;
int T,n,m;
char s[maxn],t[maxn];
int to[maxn][26],lst[26];
inline void init(){
for(int i=0;i<26;i++)
lst[i]=to[n][i]=n+1;
for(int i=n-1;i>=0;i--){
lst[s[i+1]-'a']=i+1;
for(int j=0;j<26;j++){
to[i][j]=lst[j];
}
}
}

int dp[maxn][maxn]; //dp[i][j]表示两段分别匹配长度i和j时最低消耗的原字符串长
int main(){
cin>>T;
while(T--){
cin>>(s+1)>>(t+1);
n=strlen(s+1),m=strlen(t+1);
init();
bool f=false;
for(int l=1;l<=m;l++){
//l是第一段子序列的长度
for(int i=0;i<=l;i++)
for(int j=0;j<=m-l;j++)
dp[i][j]=n+1;
dp[0][0]=0;
for(int cl=1;cl<=m;cl++){ //cl是当前枚举的解决的总长度
int i=max(0,cl-m+l);
for(;i<=min(cl,l);i++){
if(i>0&&dp[i-1][cl-i]<n)
dp[i][cl-i]=min(dp[i][cl-i],to[dp[i-1][cl-i]][t[i]-'a']);
if(cl-i>0&&dp[i][cl-i-1]<n)
dp[i][cl-i]=min(dp[i][cl-i],to[dp[i][cl-i-1]][t[l+cl-i]-'a']);
}
}
if(dp[l][m-l]<=n){
f=true;
break;
}
}
cout<<(f?"YES":"NO")<<endl;
}
}

/*
aacab
cacab
*/