ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

字符串专题-KMP+扩展KMP

2022-08-14 00:03:41  阅读:179  来源: 互联网

标签:专题 pat RS int sp tp KMP 字符串 size


 

KMP算法

例题1:E. Martian Strings【前缀函数的运用】

这一题笨笨地写了个SA+二分,慢死了(常数大)。虽然这一题是多串匹配,但是\(m=100\),S串长度为\(1e5\),所以是可以暴力check每一个pattern的。。但是因为这一题要把一个串分成两个不相交的区间,所以考虑顺序、逆序做一次KMP,特判长度为1的pat。复杂度\(O(m*n=1e7)\)

思路来自于:聚聚的blog LINK

查看代码

int n, q, k, nt[maxn], pv[maxn], sf[maxn];
char pat[1111], s[maxn];

inline void initNxt(char s[], int n) {
  nt[1] = 0;
  for (int i = 2, k = 0; i <= n; i++) {
    while (k && s[i] != s[k + 1]) k = nt[k];
    nt[i] = (s[i] == s[k + 1] ? ++k : 0);
  }
}

inline void search(int* ar, int n, int m) {
  for (int i = 1, k = 0; i <= n; i++) {
    while (k && k < m && s[i] != pat[k + 1]) k = nt[k];
    if (k < m && s[i] == pat[k + 1]) k++;
    ar[i] = max(ar[i - 1], k);  // 根据题目而取 max
  }
}

inline bool chk() {
  int m = strlen(pat + 1);
  if (m > n || m == 1) return false;
  initNxt(pat, m), search(pv, n, m);
  reverse(pat + 1, pat + m + 1);
  reverse(s + 1, s + 1 + n);
  initNxt(pat, m), search(sf, n, m);
  reverse(s + 1, s + 1 + n);
  reverse(sf + 1, sf + 1 + n);
  for (int i = 1; i < n; i++)
    if (pv[i] + sf[i + 1] >= m) return true;
  return false;
}

inline void solve() {
  cin >> s + 1 >> q, n = strlen(s + 1);
  int ans = 0;
  for (int i = 1; i <= q; i++) cin >> pat + 1, ans += chk();
  cout << ans << endl;
}

 

 

扩展KMP算法 - Z函数

 

例题1: E. Text Editor【贪心 + Z函数预处理】

题意:给一个长度为m的T串,和一个长度为n>m的S串。现在让你删去S中的一些位置,使得S变成T。最开始光标在S串末尾,你只能操作1.backspace、2.left、3.right、4.home、5.end 这5个按键。求出最少按键次数。

思路:

枚举S中的一个分界点sp,再枚举T中的一个分界点tp。

① sp左侧尽可能往左边匹配,计算公式为:\(sp-tp+|LCS|\),其中LCS是S[1:sp]和T[1:tp]的最长公共后缀

② sp右侧尽可能往右匹配,计算公式为:\(|LCP|\),其中LCP是S[sp+1:n]和T[tp+1:m]的最长公共前缀。

考虑使用Z函数预处理优化掉一个n,同时使用贪心策略判断能不能表示,最后复杂度是:\(O(n^2+n*m)\)。妈的,因为脑子猪了,所以写了一年。

查看代码
 int n, m, pre[maxn], suf[maxn];
string S, T, revT;

vector<int> getZ(const string& s) {
  vector<int> z(s.size(), 0);
  for (int i = 1, l = 0, r = 0; i < s.size(); ++i) {
    if (i <= r && z[i - l] < r - i + 1) {
      z[i] = z[i - l];
    } else {
      z[i] = max(0, r - i + 1);
      while (i + z[i] < s.size() && s[z[i]] == s[i + z[i]]) ++z[i];
    }
    if (i + z[i] - 1 > r) l = i, r = i + z[i] - 1;
  }
  return z;
}

void solve() {
  cin >> n >> m >> S >> T;
  revT = T, reverse(all(revT));
  for (int i = 0, j = -1; i <= n; i++) {
    if (i < n && j < m - 1 && S[i] == T[j + 1]) j++;
    pre[i] = j;
  }
  suf[n] = m + 1;   // 记得初始化
  for (int i = n - 1, j = m; i >= 0; i--) {
    if (j > 0 && S[i] == T[j - 1]) j--;
    suf[i] = j;
  }
  int ans = inf_int;
  string LS, RS = S;
  for (int sp = 0; sp <= n; sp++) {
    auto lz = getZ(LS + "#" + revT);
    move(lz.begin() + LS.size() + 1, lz.end(), lz.begin());
    auto rz = getZ(RS + "#" + T);
    move(rz.begin() + RS.size() + 1, rz.end(), rz.begin());
    for (int tp = 0; tp <= sp; tp++) {
      if (tp - 1 > (sp ? pre[sp - 1] : -1)) break;
      if (tp < suf[sp] || m - tp > n - sp) continue;
      // 这里存在一个边界条件,当tp=0且sp=0时,说明不会按home键,反之默认按home键
      int Lans = 2 * (int)LS.size() + (tp ? 1 - lz[m - tp] - tp : (sp != 0));
      int Rans = (int)RS.size() - (tp < m ? rz[tp] : 0);
      if (Lans < 0 || Rans < 0) continue;
      ans = min(Lans + Rans, ans);
    }
    if (sp == n || RS.size() == 0) break;
    LS.insert(0, 1, S[sp]);
    RS = RS.substr(1, (int)RS.size() - 1); \\ string的erase有bug,会删除p之后所有字符
  }
  cout << (ans == inf_int ? -1 : ans) << '\n';
}

 

标签:专题,pat,RS,int,sp,tp,KMP,字符串,size
来源: https://www.cnblogs.com/guanjinquan/p/15832599.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有