ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

108 后缀数组(SA)

2022-04-16 10:04:51  阅读:142  来源: 互联网

标签:后缀 122 int 108 -- sa include SA


视频链接:

 

 

 

 

 

 

 

 

 

 

 

 

#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;

const int N = 1000010;
int n, m = 122; //把z的ASC码122,作为桶个数的初始值
char s[N];
int sa[N], c[N], x[N], y[N];
int height[N], rk[N];

void get_sa(){
    // 把后缀按第一个字母排序--sa[]
    for (int i = 1; i <= m; i++) c[i] = 0; // 清空桶
    for (int i = 1; i <= n; i++) c[x[i] = s[i]] ++;
    for (int i = 2; i <= m; i++) c[i] += c[i-1];
    for (int i = n; i; i -- ) sa[c[x[i]] --] = i;
    
    for (int k = 1; k <= n; k <<= 1) { // 循环logn轮
        // 把后缀按第二关键字排序--y[]
        int p = 0;
        for(int i = n-k+1; i <= n; i++) y[++p] = i; 
        for(int i = 1; i <= n; i++) 
            if(sa[i] > k) y[++ p] = sa[i]-k;
              // 后缀sa[i]是后缀sa[i]-k的第二关键字
              
        // 把后缀按双关键字排序--sa[]
        for(int i=1; i <= m; i++) c[i] = 0;
        for(int i=1; i <= n; i++) c[x[i]] ++;
        for(int i=2; i <= m; i++) c[i] += c[i-1];
        for(int i=n; i; i--) sa[c[x[y[i]]]--] = y[i];
             // 后缀y[i]--桶号x[]--排名c[]--生成sa[]
             
        // 把后缀按双关键字放入桶--x[]
        swap(x, y);
        x[sa[1]] = 1, p = 1;
        for (int i = 2; i <= n; i++)
            x[sa[i]]= (y[sa[i]]==y[sa[i-1]]
                    &&y[sa[i]+k]==y[sa[i-1]+k])?p:++p;
        m = p; //更新桶的个数
        if(m == n) break; //桶数等于后缀数,说明已排好
    }
}
void get_height(){
    for(int i = 1; i <= n; i++) rk[sa[i]] = i;
    for(int i=1, k=0; i <= n; i++){ //枚举后缀i
        if(rk[i] == 1) continue; //第一名height为0
        if(k) k--; //上一个后缀的height值减1
        int j = sa[rk[i]-1]; //找出后缀i的前邻后缀j
        while(i+k<=n && j+k<=n && s[i+k]==s[j+k])k++;
        height[rk[i]] = k;
        // printf("i=%d j=%d h[rk[%d]]=%d\n",i,j,i,k);
    }
}
int main(){
    scanf("%s", s+1);
    n = strlen(s+1);
    get_sa();
    get_height();
    for(int i=1; i<=n; i++) printf("%d ", sa[i]);
    puts("");
    for(int i=1; i<=n; i++) printf("%d ", height[i]);
    return 0;
}

 

标签:后缀,122,int,108,--,sa,include,SA
来源: https://www.cnblogs.com/dx123/p/16151908.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有