ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

判断子序列

2022-06-24 23:35:13  阅读:144  来源: 互联网

标签:判断 false int tt 字符串 序列 复杂度


来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/is-subsequence

给定字符串 s 和 t ,判断 s 是否为 t 的子序列。

字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"abcde"的一个子序列,而"aec"不是)。

点击查看代码
 public static boolean isSubsequence(String s, String t) {
        //得到 s、t 字符串的长度
        int sL = s.length();
        int tL = t.length();
        //如果 s 长度大于 t 则一定不能是 t 的子字符串,直接返回 false
        if (sL > tL) {
            return false;
        }
        for (int i = 0; i < sL; i++) {
            //获得 s 字符串的当前索引处的字符
            char sC = s.charAt(i);
            //判断当前字符在 t 字符串中的索引位置
            int index = t.indexOf(sC);
            if (index == -1) {
                //不存在直接返回 false
                return false;
            }
            //存在将当前索引处到开始的字符串舍弃,为了不改变原来次序。
            t = t.substring(index + 1);
        }
        return true;
    }

进阶:

如果有大量输入的 S,称作 S1, S2, ... , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?

示例 1:

输入:s = "abc", t = "ahbgdc"
输出:true
示例 2:

输入:s = "axc", t = "ahbgdc"
输出:false

力扣题解:

点击查看代码
方法一:双指针
思路及算法

本题询问的是,ss 是否是 tt 的子序列,因此只要能找到任意一种 ss 在 tt 中出现的方式,即可认为 ss 是 tt 的子序列。

而当我们从前往后匹配,可以发现每次贪心地匹配靠前的字符是最优决策。

假定当前需要匹配字符 cc,而字符 cc 在 tt 中的位置 x_1x1​ 和 x_2x2​ 出现(x_1 < x_2x1​<x2​),那么贪心取 x_1x1​ 是最优解,因为 x_2x2​ 后面能取到的字符,x_1x1​ 也都能取到,并且通过 x_1x1​ 与 x_2x2​ 之间的可选字符,更有希望能匹配成功。

这样,我们初始化两个指针 ii 和 jj,分别指向 ss 和 tt 的初始位置。每次贪心地匹配,匹配成功则 ii 和 jj 同时右移,匹配 ss 的下一个位置,匹配失败则 jj 右移,ii 不变,尝试用 tt 的下一个字符匹配 ss。

最终如果 ii 移动到 ss 的末尾,就说明 ss 是 tt 的子序列。

代码

class Solution {
    public boolean isSubsequence(String s, String t) {
        int n = s.length(), m = t.length();
        int i = 0, j = 0;
        while (i < n && j < m) {
            if (s.charAt(i) == t.charAt(j)) {
                i++;
            }
            j++;
        }
        return i == n;
    }
}
复杂度分析

时间复杂度:O(n+m)O(n+m),其中 nn 为 ss 的长度,mm 为 tt 的长度。每次无论是匹配成功还是失败,都有至少一个指针发生右移,两指针能够位移的总距离为 n+mn+m。

空间复杂度:O(1)O(1)。

方法二:动态规划
思路及算法

考虑前面的双指针的做法,我们注意到我们有大量的时间用于在 tt 中找到下一个匹配字符。

这样我们可以预处理出对于 tt 的每一个位置,从该位置开始往后每一个字符第一次出现的位置。

我们可以使用动态规划的方法实现预处理,令 f[i][j]f[i][j] 表示字符串 tt 中从位置 ii 开始往后字符 jj 第一次出现的位置。在进行状态转移时,如果 tt 中位置 ii 的字符就是 jj,那么 f[i][j]=if[i][j]=i,否则 jj 出现在位置 i+1i+1 开始往后,即 f[i][j]=f[i+1][j]f[i][j]=f[i+1][j],因此我们要倒过来进行动态规划,从后往前枚举 ii。

这样我们可以写出状态转移方程:

f[i][j]=\begin{cases} i, & t[i]=j\\ f[i+1][j], & t[i] \neq j \end{cases}f[i][j]={i,f[i+1][j],​t[i]=jt[i]​=j​

假定下标从 00 开始,那么 f[i][j]f[i][j] 中有 0 \leq i \leq m-10≤i≤m−1 ,对于边界状态 f[m-1][..]f[m−1][..],我们置 f[m][..]f[m][..] 为 mm,让 f[m-1][..]f[m−1][..] 正常进行转移。这样如果 f[i][j]=mf[i][j]=m,则表示从位置 ii 开始往后不存在字符 jj。

这样,我们可以利用 ff 数组,每次 O(1)O(1) 地跳转到下一个位置,直到位置变为 mm 或 ss 中的每一个字符都匹配成功。

同时我们注意到,该解法中对 tt 的处理与 ss 无关,且预处理完成后,可以利用预处理数组的信息,线性地算出任意一个字符串 ss 是否为 tt 的子串。这样我们就可以解决「后续挑战」啦。

代码


class Solution {
    public boolean isSubsequence(String s, String t) {
        int n = s.length(), m = t.length();

        int[][] f = new int[m + 1][26];
        for (int i = 0; i < 26; i++) {
            f[m][i] = m;
        }

        for (int i = m - 1; i >= 0; i--) {
            for (int j = 0; j < 26; j++) {
                if (t.charAt(i) == j + 'a')
                    f[i][j] = i;
                else
                    f[i][j] = f[i + 1][j];
            }
        }
        int add = 0;
        for (int i = 0; i < n; i++) {
            if (f[add][s.charAt(i) - 'a'] == m) {
                return false;
            }
            add = f[add][s.charAt(i) - 'a'] + 1;
        }
        return true;
    }
}
复杂度分析

时间复杂度:O(m \times |\Sigma| + n)O(m×∣Σ∣+n),其中 nn 为 ss 的长度,mm 为 tt 的长度,\SigmaΣ 为字符集,在本题中字符串只包含小写字母,|\Sigma| = 26∣Σ∣=26。预处理时间复杂度 O(m)O(m),判断子序列时间复杂度 O(n)O(n)。

如果是计算 kk 个平均长度为 nn 的字符串是否为 tt 的子序列,则时间复杂度为 O(m \times |\Sigma| +k \times n)O(m×∣Σ∣+k×n)。
空间复杂度:O(m \times |\Sigma|)O(m×∣Σ∣),为动态规划数组的开销。

标签:判断,false,int,tt,字符串,序列,复杂度
来源: https://www.cnblogs.com/xy7112/p/16410496.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有