【BZOJ-3555】企鹅QQ 字符串Hash

时间:2022-05-02 05:13:46

3555: [Ctsc2014]企鹅QQ

Time Limit: 20 Sec  Memory Limit: 256 MB
Submit:
1545  Solved: 593
[Submit][Status][Discuss]

Description

PenguinQQ是中国最大、最具影响力的SNS(Social Networking
Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的
个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。

Input

第一行包含三个正整数N ,L ,S 。其中 N表示账户名称数量,L表示账户名称长度,S用来表示字符集规模大小,它的值只可能为2或64。

等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证
个字符串是两两不同的。

Output

仅一行一个正整数,表示共有多少对相似的账户名称。

Sample Input

4 3
64
Fax
fax
max
mac

Sample Output

4

HINT

4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。N<=30000,L<=200,S<=64

Source

Solution

字符串Hash硬上

比较每一对是否可行,很明显不行,不妨比较去掉每一位是否一样

读入字符串的时候Hash一下,枚举每一位,分离一下Hash值,快排一下统计答案即可...

Code

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cmath>
#include<cstring>
using namespace std;
int N,L,SS,ans=;
unsigned long long bin[],hash[][],HASH[];
char S[][];
#define BASE 131
void Hash(char *s,unsigned long long t)
{
for (int i=; i<=L; i++)
hash[t][i]=hash[t][i-]*BASE+s[i];
}
unsigned long long GetHash(unsigned long long t,int l)
{
return hash[t][L]-hash[t][l]*bin[L-l]+hash[t][l-]*bin[L-l+];
}
int main()
{
scanf("%d%d%d",&N,&L,&SS);
bin[]=;
for (int i=; i<=L; i++) bin[i]=bin[i-]*BASE;
for (int i=; i<=N; i++)
scanf("%s",S[i]+),Hash(S[i],i);
for (int i=; i<=L; i++)
{
for (int j=; j<=N; j++)
HASH[j]=GetHash(j,i);
sort(HASH+,HASH+N+); HASH[N+]=;
for (int pre=,cnt,j=; j<=N+; j++)
if (HASH[j]!=HASH[pre])
cnt=j-pre,ans+=cnt*(cnt-)/,pre=j;
}
printf("%d\n",ans);
return ;
}

很怀疑这真的是CTSC?