51nod 1183 编辑距离【线性dp+类似最长公共子序列】

时间:2021-01-18 20:07:30
1183 编辑距离
基准时间限制:1 秒 空间限制:131072 KB 分值: 0 难度:基础题
51nod 1183 编辑距离【线性dp+类似最长公共子序列】 收藏
51nod 1183 编辑距离【线性dp+类似最长公共子序列】 关注
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
 
Input
第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten
sitting
Output示例
3
【分析】:
设dp[i][j]代表a字符串前i个变形 b字符串前j个最小操作步数;
此题类型和求两字符串最长公共子序列有相同部分,但最长公共序列对相同字符位置没有要求,但在此题中则是解题关键,
若两位置相同,则不需任何操作,但若两相同部分之间相错n位,则需增加n次操作,同时还要考虑最优解;
同时dp[i][0]=dp[0][i]=i;

(1) 必须 S[i] == T[j], 这时前i – 1和j – 1位都已经对齐了,这部分肯定要最少扣分。这种情况下最少的扣分是dp(i-1,j-1)
(2) 和(1)类似,S[i]≠T[j],这种情况下最少的扣分是dp(i - 1, j – 1) + 1
(3) S的前i位和T的前(j – 1)位已经对齐了,这部分扣分也要最少。这种情况下最少的扣分是dp(i, j - 1) + 1
(4) S的前(i - 1)位已经和T的前j位对齐了,这部分扣分要最少。这种情况下最少的扣分是dp(i - 1, j) + 1

这样就能得到状态转移方程:

dp(i,j) = min(dp(i – 1, j – 1) + ( S[i] == T[j] ? 0:1 ), dp(i – 1,j ) + 1, dp(i, j – 1) + 1)

【代码】:

#include <bits/stdc++.h>
using namespace std;
const int AX = 1e3+; int dp[AX][AX];
char a[AX];
char b[AX]; int main(){
while(~scanf("%s%s",a,b)){
memset(dp,,sizeof(dp));
int n = strlen(a);
int m = strlen(b);
for( int i = ; i <= n ; i++ ){
dp[i][] = i;
}
for( int j = ; j <= m ; j++ ){
dp[][j] = j;
}
for( int i = ; i <= n ; i++ ){
for( int j = ; j <= m ;j++ ){
if( a[i-] != b[j-] )
dp[i][j] = min(dp[i-][j-],min(dp[i-][j],dp[i][j-])) + ;
else dp[i][j] = dp[i-][j-];
}
}
printf("%d\n",dp[n][m]);
}
return ;
}