ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

【算法4】5.3.4.子字符串查找-BoyerMoore算法

2022-06-04 14:01:14  阅读:126  来源: 互联网

标签:5.3 int pattern 模式 算法 right text BoyerMoore 字符串


Boyer Moore 算法思想:将模式字符串与文本字符串从右往左进行匹配。

Boyer Moore 需要先对模式字符串进行预处理,根据模式字符串生成 right[] 数组,记录字符集中的字符在模式字符串中最右出现的位置。

当将模式字符串从右往左对比出现不匹配时,会有以下情况:

  • 文本字符 text.chatAt(i+j) 不在模式字符串中,需要将模式字符串右移到 text.chatAt(i+j) 之后
  • 文本字符 text.chatAt(i+j) 在模式字符串中,需要将模式字符串该字符出现的最右位置与该字对齐(要保证至少右移一个位置)
/*
 * Boyer Moore 算法
 * */
public class BoyerMoore {
    private static final int R = 256; // 字母表
    private int[] right; // 记录字符集中的字符在模式字符串中出现的最后位置,不存在则是 -1
    private String pattern;

    public BoyerMoore(String pattern) {
        right = new int[R];
        this.pattern = pattern;
        int M = pattern.length();
        for (int i = 0; i < R; i++) {
            right[i] = -1;
        }
        for (int i = 0; i < M; i++) {
            right[pattern.charAt(i)] = i;
        }
    }

    public int search(String text) {
        int M = pattern.length();
        int N = text.length();
        int skip;
        for (int i = 0; i <= N - M; i += skip) {
            skip = 0;
            for (int j = M - 1; j >= 0; j--) {
                if (text.charAt(i + j) != pattern.charAt(j)) {
                    skip = j - right[text.charAt(i + j)];
                    if (skip < 1) skip = 1; // 至少需要向右移动一个位置
                    break;
                }
            }
            if (skip == 0) {
                return i;
            }
        }
        return -1;
    }
}

标签:5.3,int,pattern,模式,算法,right,text,BoyerMoore,字符串
来源: https://www.cnblogs.com/liaozibo/p/boyer-moore.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有