标签:基于 计算公式 min 距离 编辑 序列 字符串 aligned 动态
文章目录
https://www.jianshu.com/p/a617d20162cf
1. 编辑距离的定义
编辑距离(Minimum Edit Distance,MED),由俄罗斯科学家 Vladimir Levenshtein 在1965年提出,也因此而得名 Levenshtein Distance。编辑距离一般用于度量两个序列相似程度的指标,具体来说,它计算的是一个序列A最少可以经过多少次操作变成另一个序列。这里的操作包括以下三种:
- 插入(Insert)
- 删除(Deletion)
- 替换(Substitution)
比如字符串australia
和austrian
,后者可以由前者进行三次操作得到(2次删除,分别是a和l;一次插入,n);字符串ABCDE
和AFGE
进行3次操作得到。
2. 基于动态规划的求解算法
2.1. 递推公式
对于两个字符串
a
,
b
a,b
a,b,记
f
(
i
,
j
)
f(i,j)
f(i,j)为
a
a
a中前
i
i
i个字符与
b
b
b中前
j
j
j个字符的编辑距离,则有:
f
(
i
,
j
)
=
{
m
a
x
(
i
,
j
)
,
i
f
m
i
n
(
i
,
j
)
=
0
m
i
n
{
f
(
i
−
1
,
j
)
+
1
f
(
i
,
j
−
1
)
+
1
f
(
i
−
1
,
j
−
1
)
+
1
(
a
i
≠
b
j
)
i
f
m
i
n
(
i
,
j
)
≠
0
f(i,j)=\left\{ \begin{aligned} &max(i,j),&if\ min(i,j)=0 \\ &min { \left\{ \begin{aligned} &f(i-1,j)+1\\ &f(i,j-1)+1\\ &f(i-1,j-1)+1_{(a_i\neq b_j)} \end{aligned} \right. } &if\ min(i,j)\neq 0 \end{aligned} \right.
f(i,j)=⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧max(i,j),min⎩⎪⎨⎪⎧f(i−1,j)+1f(i,j−1)+1f(i−1,j−1)+1(ai=bj)if min(i,j)=0if min(i,j)=0
标签:基于,计算公式,min,距离,编辑,序列,字符串,aligned,动态 来源: https://blog.csdn.net/THUChina/article/details/121044763
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。