ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

【洛谷】P2743 [USACO5.1]乐曲主题Musical Themes(后缀数组+二分)

2022-03-20 11:36:54  阅读:146  来源: 互联网

标签:子串 P2743 洛谷 lcp leq 后缀 mid USACO5.1 int


原题链接

题意

给出长度为 \(N\) 的数字串,求最大相似子串长度,如果没有输出 \(0\)。

相似子串定义为:

1.两个不重叠的子串,其中一个是另一个加/减一个数得来的。

2.长度 \(\geq 5\)。

数据范围

\(1 \leq N \leq 20000,1 \leq a_i \leq 88\)。

思路

对于相似子串的第一个定义,很容易想到将原数组差分,就可以题意转化为求两个本质相同的不重叠子串。至于长度的要求,最后判断一下就好。下面讨论如何求本质不同的不重叠子串。

利用后缀数组的思想。原数字串的所有子串就是原数字串的所有后缀的所有前缀。这句话有点绕,但理解起来不复杂。那么就可以将题意进一步转化为求两个后缀的最长公共前缀(即 \(lcp\))。同时还要满足这两个最长公共前缀在原串中没有重叠的部分。那么就可以二分最大长度

设当前枚举的长度为 \(mid\)。根据后缀数组中 \(lcp\) 的性质,即对于排序后的后缀(下文默认后缀为排序后的后缀),满足 \(lcp(i,j)=\min_{i\leq k \leq j}(lcp(i,k),lcp(k,j))\)。可以将所有后缀分成几个大的区间,边界点 \(i\) 满足 \(lcp(i,i-1) < mid\) 。那么此时的区间 \([i,j]\) 中的任意两个后缀的 \(lcp\) 都 \(\geq mid\)。只需要记录一下区间中的后缀在原数字串中的最大起始点和最小起始点,如果它们的差不小于 \(mid\),就是找到了一组长度为 \(mid\) 相似子串。接下来按照二分的基本流程操作即可。

code:

#include<cstring>
#include<algorithm>
using namespace std;
const int N=2e5+10;
int n,m,height[N],sa[N],rk[N],s[N],x[N],y[N],c[N];
void get_sa()
{
	memset(c,0,sizeof(c));m=188;
	for(int i=1;i<=n;i++) c[x[i]=s[i]]++;
	for(int i=2;i<=m;i++) c[i]+=c[i-1];
	for(int i=n;i>=1;i--) sa[c[x[i]]--]=i;
	for(int k=1;k<=n;k<<=1)
	{
		int num=0;
		for(int i=n-k+1;i<=n;i++) y[++num]=i;
		for(int i=1;i<=n;i++) 
		    if(sa[i]>k) y[++num]=sa[i]-k;
		for(int i=1;i<=m;i++) c[i]=0;
		for(int i=1;i<=n;i++) c[x[i]]++;
		for(int i=2;i<=m;i++) c[i]+=c[i-1];
		for(int i=n;i>=1;i--) sa[c[x[y[i]]]--]=y[i],y[i]=0;
		swap(x,y);num=1;x[sa[1]]=1;
		for(int i=2;i<=n;i++) x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
		if(num==n) break;m=num;
	}
}
void get_height()
{
	memset(height,0,sizeof(height));
	for(int i=1;i<=n;i++) rk[sa[i]]=i;
	for(int i=1,k=0;i<=n;i++)
	{
		if(rk[i]==1) continue;
		if(k) k--;
		int j=sa[rk[i]-1];
		while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k]) k++;
		height[rk[i]]=k;
	}
}
bool check(int mid)
{
	int maxx=sa[1],minn=sa[1];
	for(int i=2;i<=n;i++)
		if(height[i]<mid) maxx=minn=sa[i];
		else
		{
			maxx=max(maxx,sa[i]);
			minn=min(minn,sa[i]);
			if(maxx-minn-1>=mid) return true;
		}
	return false;
}
int main()
{
	scanf("%d",&n);
	for(int last=0,now,i=1;i<=n;i++) scanf("%d",&now),s[i]=now-last+100,last=now;//注意在差分的时候可能会出现数字小于0的情况,需要整体加上一个偏移量才能进行后缀排序
	get_sa();get_height();
	int l=1,r=n/2,ans=-1;
	while(l<=r)
	{
		int mid=l+r>>1;
		if(check(mid)) ans=mid,l=mid+1;
		else r=mid-1;
	}
	printf("%d\n",++ans<5?0:ans);
	return 0;
}```

标签:子串,P2743,洛谷,lcp,leq,后缀,mid,USACO5.1,int
来源: https://www.cnblogs.com/NLCAKIOI/p/16029365.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有