ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

动态规划——最长公共子序列(LCS)

2021-10-20 20:02:50  阅读:282  来源: 互联网

标签:字符 LCS int 字符串 序列 include 最长


暴力搜索枚举法

  1. 枚举序列X里的每一个子序列xi
  2. 检查子序列xi是否也是Y序列里的子序列;
  3. 在每一步记录当前找到的子序列里面的最长的子序列。
#include<iostream>
#include<cstring>
#include <math.h>
#include<algorithm>
using namespace std;
int main(){
string x,y; // 两个待比较的字符串
string seq;//最长公共子序列
string tmp;//临时变量
int len=0;//最长公共子序列长度
cin>>x>>y;
for(int i=0;i<pow(2,x.strlen());i++)
{
     tmp = "";
     // 获得子序列
     for(int j=x.strlen()-1;j>=0;j--)
     {
        if((i>>j)&1==1)
        {
            tmp = tmp + x[x.strlen()-1-j];
        }
     }
     int t=0,k=0;
     // 判断x的该子序列是否出现在y中
     while(k<y.strlen()&&t<tmp.strlen())
     {
        if(y[k]==tmp[t])
        {
           t++;
           k++;
        }
        else
        {
            k++;
        }
     }
     if(t==tmp.strlen())
     {
          len = max(len,tmp.strlen());
          seq=tmp;
     }
}
return 0;
}

在第1步枚举X中所有的子序列有2^m个,
每个子序列在Y中检查时间复杂度为O(n)。
因此蛮力策略的最坏时间复杂度为O(n*2^m),
这是指数级算法,对较长的序列求LCS是不适用的。
https://blog.csdn.net/qq_55553431/article/details/115189524

动态规划方法


X=<x1,x2,x3,x4…,xm>,
Y=<y1,y2,y3,y4…,yn>为两个序列,
Z=<z1,z2,z3,z4…,zk>是他们的任意公共子序列

经过分析,我们可以知道:

1、如果xm = yn,则zk = xm = yn 且 Zk-1是Xm-1和Yn-1的一个LCS

2、如果xm != yn 且 zk != xm,则Z是Xm-1和Y的一个LCS

3、如果xm != yn 且 zk != yn,则Z是X和Yn-1的一个LCS

用一个二维数组c表示
字符串X前i和Y前j个字符的LCS的长度,
可以得到以下公式:

在这里插入图片描述
只需要从c[0][0]开始填表,填到c[m-1][n-1],所得到的c[m-1][n-1]就是LCS的长度

例如,ABCB和BDCA两个字符串的最大公共子序列长度为2,打表计算的过程如下所示。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
右下角的2即为LCS的长度

由于只需要填一个m行n列的二维数组,
其中m代表第一个字符串长度,n代表第二个字符串长度。
时间复杂度为O(m*n)

获得最长公共子序列的方法:

X、Y两个字符串,
用一个二维数组b,
在对应字符相等的时候,用↖标记;
对应字符不相等,
在f(i-1,j)>=f(i,j-1)的时候,用↑标记;
在f(i-1,j)<f(i,j-1)的时候,用←标记。
比如说求ABCBDAB和BDCABA的LCS:
在这里插入图片描述
若想得到LCS,则再遍历一次b数组就好了,从最后一个位置开始往前遍历:
如果箭头是↖,则代表这个字符是LCS的一员,存下来后 i-- , j–;
如果箭头是←,则代表这个字符不是LCS的一员,j–;
如果箭头是↑ ,也代表这个字符不是LCS的一员,i–。
如此直到i = 0或者j = 0时停止,最后存下来的字符就是所有的LCS字符。

#include <iostream>
#include <string>
#include <stack>
using namespace std;
void LCS(string s1,string s2)
{
    int m=s1.length()+1;
    int n=s2.length()+1;// 比字符串长度应该多出1
    //c[i][j] 表示字符串X前i和Y前j个字符的LCS的长度
     //b[i][j] 表示字符串的前进方向
    int **c;
    int **b;
    c=new int* [m];// b、c两个矩阵都有m行
    b=new int* [m];
    for(int i=0;i<m;i++)
    {
        c[i]=new int [n];// c[i]、b[i]是一个行向量,有n列
        b[i]=new int [n];
        for(int j=0;j<n;j++)
            b[i][j]=0; // b矩阵全部元素初始化为0
    }
    // 边界初始化
    for(int i=0;i<m;i++)
        c[i][0]=0;
    for(int i=0;i<n;i++)
        c[0][i]=0;
    // 对c[m][n]打表
    for(int i=0;i<m-1;i++)
    {
        for(int j=0;j<n-1;j++)
        {
            if(s1[i]==s2[j])
            {
                c[i+1][j+1]=c[i][j]+1;
                b[i+1][j+1]=1;          //1表示箭头为  左上
            }
            else if(c[i][j+1]>=c[i+1][j])
            {
                c[i+1][j+1]=c[i][j+1];
                b[i+1][j+1]=2;          //2表示箭头向  上
            }
            else
            {
                c[i+1][j+1]=c[i+1][j];
                b[i+1][j+1]=3;          //3表示箭头向  左
            }
        }
    }
    
    for(int i=0;i<m;i++)                //输出c数组
    {
        for(int j=0;j<n;j++)
        {
            cout<<c[i][j]<<' ';
        }
        cout<<endl;
    }

    //  最长公共子序列字符顺序是先进后出
    stack<char> same;                   //存LCS字符
    stack<int> same1,same2;             //存LCS字符在字符串1和字符串2中对应的下标,方便显示出来
    for(int i = m-1,j = n-1;i >= 0 && j >= 0; )
    {
        if(b[i][j] == 1)
        {
            i--;
            j--;
            same.push(s1[i]);
            same1.push(i);
            same2.push(j);
        }
        else if(b[i][j] == 2)
                i--;
             else
                j--;
    }
    
    cout<<s1<<endl;                     //输出字符串1
    // same1存LCS字符在字符串1中对应的下标
    for(int i=0;i<m && !same1.empty();i++)      //输出字符串1的标记
    {
        if(i==same1.top())
        {
            cout<<1;
            same1.pop();
        }
        else
            cout<<' ';
    }
    
    cout<<endl<<s2<<endl;                //输出字符串2
    for(int i=0;i<n && !same2.empty();i++)      //输出字符串2的标记
    {
        if(i==same2.top())
        {
            cout<<1;
            same2.pop();
        }
        else
            cout<<' ';
    }


    cout<<endl<<"最长公共子序列为:";
    while(!same.empty())
    {
        cout<<same.top();
        same.pop();
    }
    
    cout<<endl<<"长度为:"<<c[m-1][n-1]<<endl;
    // 先删除行
    for (int i = 0; i<m; i++)
    {
        delete [] c[i];
        delete [] b[i];
    }
    // 再删除列
    delete []c;
    delete []b;
}



int main()
{
    string s1="ABCPDSFJGODIHJOFDIUSHGD";
    string s2="OSDIHGKODGHBLKSJBHKAGHI";
    LCS(s1,s2);// 调用求两个字符串公共子序列的函数
    return 0;
}

代码的运行效果,如图所示。
在这里插入图片描述

标签:字符,LCS,int,字符串,序列,include,最长
来源: https://blog.csdn.net/qq_41734963/article/details/120872831

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有