ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

CF710F String Set Queries

2021-08-28 23:31:54  阅读:155  来源: 互联网

标签:cnt Set String int AC ++ ch Queries fail


我的第一篇黑题题解,应该好好庆祝。

题目大意

给定一个字符串集合,支持的操作有插入,删除和查询给定字符串在给出的模板字符串出现的次数。

操作数 \(m \leq 3 \times 10^5\),输入字符串总长度 \(\sum |s_i| \leq 3\times 10^5\)。

本题强制在线。

解题思路

首先看到多模式匹配字符串应该想到 AC 自动机。

关于 AC 自动机,可以参考我的博客,点这里

先考虑删除操作,再开一个 AC 自动机记录删除的串,两个 query 的结果相减即可(满足相减性)。

再考虑插入操作,每次插入都要改 fail 指针,这意味着我们每次插入需要 \(O(n)\),怎么办?

考虑优化每次插入对应 AC 自动机的节点个数,可将 AC 自动机进行二进制分组。

例,已经插入 \(15\) 个字符串,则有 \(5\) 个 AC 自动机,每个 AC 自动机对应的字符串个数分别为 \(8\),\(4\),\(2\),\(1\)。

假设现在又要插入一个字符串,则 AC 自动机会合并成 \(1\) 个,对应的字符串个数为 \(16\)。

说实话这有点像那个 2048 小游戏。

因为二进制分组保证了每个节点的更新次数只有 \(\log n\) 次,最多维护 \(\log n\) 个块,顾时间复杂度为 \(O(m n \log n)\)。

AC CODE

小细节:应在每次输出后调用 fflush(stdout)(然而我也不知道为什么)

#include <bits/stdc++.h>
using namespace std;

const int _ = 6e5 + 5;

struct AC
{
    int tot, val[_], sum[_], fail[_], c[_][26], ch[_][26];
    int id, cnt, rt[_], siz[_];

    void ins(char *s, int len, int k)
    {
        int now = k;
        for (int i = 0; i < len; i++)
        {
            int v = s[i] - 'a';
            if (!c[now][v])
                c[now][v] = ++tot;
            now = c[now][v];
        }
        val[now]++;
    }

    void get_fail(int s)
    {
        fail[s] = s;
        queue<int> q;
        for (int i = 0; i < 26; i++)
            if (c[s][i])
            {
                ch[s][i] = c[s][i];
                q.push(c[s][i]);
                fail[ch[s][i]] = s;
            }
            else
                ch[s][i] = s;
        while (!q.empty())
        {
            int k = q.front();
            q.pop();
            for (int i = 0; i < 26; i++)
            {
                if (c[k][i])
                {
                    ch[k][i] = c[k][i];
                    fail[c[k][i]] = ch[fail[k]][i];
                    q.push(c[k][i]);
                }
                else
                    ch[k][i] = ch[fail[k]][i];
            }
            sum[k] = val[k] + sum[fail[k]];
        }
    }

    int merge(int x, int y)
    {
        if (!x || !y)
            return x + y;
        val[x] += val[y];
        for (int i = 0; i < 26; i++)
            c[x][i] = merge(c[x][i], c[y][i]);
        return x;
    }

    void insert(char *s, int len)
    {
        rt[++cnt] = ++id;
        siz[cnt] = 1;
        ins(s, len, rt[cnt]);
        while (siz[cnt] == siz[cnt - 1])
        {
            cnt--;
            siz[cnt] *= 2;
            rt[cnt] = merge(rt[cnt], rt[cnt + 1]);
        }
        get_fail(rt[cnt]);
    }

    int query(char *s, int len)
    {
        int now = 0, ans = 0;
        for (int i = 1; i <= cnt; i++)
        {
            now = rt[i];
            for (int j = 0; j < len; j++)
            {
                now = ch[now][s[j] - 'a'];
                ans += sum[now];
            }
        }
        return ans;
    }

} A, B;

int T, op, len;
char c[_];

signed main()
{
    A.tot = B.tot = 3e5 + 1;
    scanf("%d", &T);
    while (T--)
    {
        scanf("%d%s", &op, c);
        len = strlen(c);
        if (op == 1)
            A.insert(c, len);
        if (op == 2)
            B.insert(c, len);
        if (op == 3)
            printf("%d\n", A.query(c, len) - B.query(c, len));
        fflush(stdout);
    }
    return 0;
}

标签:cnt,Set,String,int,AC,++,ch,Queries,fail
来源: https://www.cnblogs.com/orzz/p/15201535.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有