\(Kmp\)\(Trie\)的优美结合,相当于在\(Trie\)上跑\(Kmp\)

一个重要定义:\(Fail\)指针(失配指针),指向其他路径上与该字母相同的节点。当前路径的模式串的后缀与\(fail\)指针指向的模式串前缀相同(与\(kmp\)类似)。
\(Fail\)指针的作用:在对于一个文本串匹配多个模式串时,如果当前模式串已经结束或失配,一般情况下我们需要回溯到根节点再换路递归,但是可以用\(fail\)直接跳到下一条路径,而且这条路径是紧接上一条的(并且与文本串对应),这样省去了回溯。因为对于\(fail\)指向的那一条路径的前缀已经在这时(被当前模式串)走过了,我们不需再走一遍重复路径。
在跳\(fail\)指针时不断统计答案,就可以遍历到以该字母为结尾的所有模式串。
构造\(Fail\)指针:对于每一层的\(fail\)指针,我们都需要用到上一层的\(fail\)状态,所以采取\(bfs\),分层构造,对于第一层的\(fail\),都指向\(0\)号根节点(它只是一个虚点)。对于一个节点x,它的\(fail\)只需要指向它父亲的\(fail\)的同字符儿子。

struct Trie
{
    int kid[26];//26个字母
    int fail;//失配指针
    int end;//以该节点结尾的单词数量
    #define son ac[rt].kid[i]
}; Trie ac[Z << 2];
int tot = 0;
inline void insert(char s[], int len)
{
    int rt = 0;
    for (re t = 1; t <= len; t++)
    {
        int i = s[t] - 'a';
        if (!son) son = ++tot;//新建一个节点
        rt = son;//进入下一层
    }
    ac[rt].end++;
}
void getfail()
{
    ac[0].fail = 0;//fail结束边界
    queue <int> q;
    int rt = 0;
    for (re i = 0; i < 26; i++)
        if (son)
        {
            ac[son].fail = 0;//初始化失配指针
            q.push(son);
        }
    while (!q.empty())
    {
        rt = q.front(); q.pop();
        for (re i = 0; i < 26; i++)
        {
            if (son)
            {
                ac[son].fail = ac[ac[rt].fail].kid[i];//扩展后缀
                q.push(son);
            }
            else son = ac[ac[rt].fail].kid[i];//保证字符串能沿着路径走完
        }
    }
}
inline int match(char s[], int len)
{
    int rt = 0, ans = 0;
    for (re t = 1; t <= len; t++)
    {
        rt = ac[rt].kid[s[t] - 'a'];//向下走一层
        for (re j = rt; j && ac[j].end != -1; j = ac[j].fail)
            ans += ac[j].end, ac[j].end = -1;//j不断跳fail直到完全失配
    }
    return ans;
}

原文地址:http://www.cnblogs.com/sandom/p/16833415.html

1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长! 2. 分享目的仅供大家学习和交流,请务用于商业用途! 3. 如果你也有好源码或者教程,可以到用户中心发布,分享有积分奖励和额外收入! 4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解! 5. 如有链接无法下载、失效或广告,请联系管理员处理! 6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需! 7. 如遇到加密压缩包,默认解压密码为"gltf",如遇到无法解压的请联系管理员! 8. 因为资源和程序源码均为可复制品,所以不支持任何理由的退款兑现,请斟酌后支付下载 声明:如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性