UOJ Logo peehs_moorhsum的博客

博客

UOJ NOI Round #4 Day2 题解

2020-08-13 13:42:39 By peehs_moorhsum

这次的题目背景大部分是vfleaking写的。

出题人 01,02,03 只是主人公的名字,和真实出题人没有任何的关系。

同构判定鸭

from Picks,标程 by Aprilgrimoire,数据、题解 by zhouyuyangvfleaking

算法0

这题好不可做啊!

交个简单的代码跑路吧:

print 'Same'

期望得分:0

算法1

我会爆搜!

在wc上学了高超的搜索技巧感觉充满了力量!

期望得分:1535

算法2

对于 DAG 的情况,显然若存在坏串则坏串长度不超过 max{n1,n2}

适当选取一种对字符串集合的哈希函数之后,我们就可以对于每一个结点 v 和每一个 k,递推计算出从 v 出发可匹配的且长度为 k 的字符串集合的哈希值。然后就容易根据哈希值计算出坏串的最短长度了。

输出字典序最小的最短坏串可以通过按位贪心来实现。

时间复杂度O(n2m)O(nm)

期望得分:2040

算法3

DAG 的情况启发我们去思考:如果存在坏串,那么最短的坏串长度是否比较短呢?

注意如果不是比较短的话,题目也不会让我们输出方案的。不然岂不是出题人亲自邀请大家炸测评机?

实际上我们确实能证出如下结论:

结论:如果存在坏串,则最短的坏串长度不超过 n1+n2

证明是这样的。首先我们可以把 G1,G2 拼成一个n1+n2个点的大图 GG2 的结点编号都加上 n1)。给定一个字符串 s=s1s2sL,想统计 sG1G2 中的出现次数之差,我们可以用 fk,v 表示 G 中长度为 k 且与 s1sk 匹配且最后一个结点是 v 的路径条数,然后递推求出 f。最后如果 1vn1fL,vn1<vn1+n2fL,v=0 则出现次数相等,否则不相等。

仔细分析递推式可以发现这是个线性的递推式,且相同的 k 的转移只跟 skv 有关。那么我们可以把转移写成 26 个矩阵 Ma,Mb,,Mz。若把初始的 f0,v 写成一个行向量 uI(一个元素均为 1 的行向量),那么最终 fL,v 就是 uIMs1Ms2MsL。令 uO 为前 n1 个元素都是 1,其他元素都为 1 的向量,则 sG1,G2 中出现次数相等当且仅当 uIMs1Ms2MsLuO=0

现在我们令 VK 为所有 LKs 对应的行向量 uIMs1Ms2MsL 组成的集合。如果 G1,G2 不等价,就说明存在一个 K 使得 VK 内有元素 u 满足 uuO0

下面要用到一点点向量空间的概念。对于一个行向量集合 V,我们用 span(V) 表示所有 V 中元素的线性组合组成的集合,也即 VK 张成的向量空间。数学表达式为: span(V)={i=1mλiui:m1,u1,,umV,λ1,,λmR} 比如共线的向量张成的是一条线,共面的向量张成的是一个平面。对于每个 VK,我们令 UK=span(VK)。容易看出,VK 内有元素 u 满足 uuO0 当且仅当 UK 内有元素 u 满足 uuO0

对于一个行向量集合 V 和一个矩阵 M,我们用 VM 表示 {uM:uV}。那么 VK 是可以递推的:VK=VK1(c{a,,z}(VK1Mc))。因此 span(VK) 也是可以递推的: UK=span(UK1(c{a,,z}(UK1Mc)))

根据定义,U1U2U3。那么 UK 是否会随着 K 的增大而一直变大呢?根据向量空间的性质和上面的 UK 的递推式,答案是不会的。

这里要用到向量空间的维数的概念。直观上一个向量空间 U 的维数就是你直观所以为的那个维数(线是 1,面是 2)。数学上,维数的一个等价定义是你在 U 中最大的线性无关组的大小。其中线性无关组是指一组向量 u1,,ud,满足性质:任意线性组合 i=1dλiui 等于 0 当且仅当 λi 全为 0。对于两个有限维的向量空间 UU,可以证明要么 U 的维数比 U 大,要么 U=U。这是因为 UU 的时候我们可以取一个 uUU 加到 U 的最大线性无关组里,就得到一个 U 的线性无关组了。

显然,UK 的维数不会超过 n1+n2,因为这些向量就 n1+n2 个坐标嘛。因此,UK 的维数先会随着 K 严格单调递增,然后到某个 K=KUK=UK+1,且这里 Kn1+n2。根据递推式我们可以看出相同的 UK1 一定推出的是相同的 UK。所以一旦 UK=UK+1,则 UK=UK+1=UK+2= 大家都相等了。这就说明如果存在 UK 内有元素 u 满足 uuO0,则最小的 Kn1+n2,就证好啦。

细节不太清楚的可以去找本自己看得懂的线性代数教材瞧瞧向量空间的具体定义。不知道是否有不依赖于线性代数的证明,如果有的话欢迎分享下咯。

回到算法上来。现在我们知道了,如果对于所有长度不超过 n1+n2+1 的序列均合法则可以对于所有串均合法。

因此可以通过哈希确定坏串最短长度后即可按位确定答案。

时间复杂度O(n2m)O(nm)

期望得分:70100

我和算法3一样为什么我挂掉了

你的哈希函数 H 需要满足:H("ab")H("ba")H("bc")+H("de")H("be")+H("cd"),否则你的算法就会是错的。

Aprilgrimoire 在验题的时候加了一个extest把这种情况干掉了

一些正确的哈希姿势

例如从后往前数,位于不同位置的相同字符有着不同的哈希值。字符串的哈希值就是字符哈希值的乘积,多串的哈希值是每个串哈希值的和。

另一种方法是把字符串的哈希值设为 bisiai,然后多串的哈希值还是每个串哈希值的和。

还有一种方法是把哈希值设成矩阵的形式,例如每个字符都对应一个 3×3 的随机小矩阵。

OIer 当然可以使用反正法说明哈希的正确率:“反正哈希正确率很高!” 但我们这里还是分析一下第一种方法。

第一种方法即事先随机出 xi,c(n1+n2)×26 个随机数,然后每个字符串的哈希值即 H(s1sL)=i=1LxLi+1,si。我们递推求出的是对于每个 Ln1+n2,两个图各自对应的哈希值:f1(L)=s1sLg1(s)H(s)f2(L)=s1sLg2(s)H(s)。这里我们用 g1(s),g2(s) 表示 sG1,G2 中的出现次数。

现在我们将 xi,c 看成变量而非随机数,则 f1(L,x),f2(L,x) 都可以看作是 xi,cL 次多项式。不存在长度为 L 的坏串,等价于 f1(L,x),f2(L,x) 作为两个关于 x 的多项式时是相等的(也即多项式系数相等,也即这两个函数在带入任意一组 x 的时候都相等)。

因此就是要看看两个多项式不相等,但随机一组 x 带入进去之后导致 f1(L,x)=f2(L,x) 的概率是多少。我们可以用 Schwartz-Zippel 引理来说明:对于某个域 F 上的不超过 d 次的多项式 f(x1,,xm),如果每个 x1,,xm 都是从 F 中的一个大小为 S 的子集中独立地均匀随机选取的,那么 f(x)=0 的概率不超过 dS

对于本题,大家当然会在模一个素数 p 的情况下计算。令 F=Fp,f(x)=f1(L,x)f2(L,x),d=n1+n2,S=p,就可以知道失败概率不超过 (n1+n2)/p

但这个失败概率仅仅是做一次“用哈希值相等来判断两个字符串集合相等”的失败概率。算法中我们要枚举长度,还要按位贪心,所以大概要做 O((n1+n2)Σ) 次,其中 Σ 是字符集大小。使用 union bound 可知总的失败概率是 O((n1+n2)2Σ/p)。取个大点的 p 就可以高枕无忧啦。

对这个问题有兴趣的同学可以搜一下 Polynomial Identity Testing (PIT) 学习一波。

Bonus

如果要求严格字典序最小,能否证明在存在严格字典序最小的情况下,答案串长度是否有限?若有限,答案串长度是否存在上界?

己酸集合

from zhouyuyang,数据、标程、题解 by zhouyuyang

把题目名字的拼音拿出来,JiSuanJiHe,这提示了这是一道计(Ji)算(Suan)几(Ji)何(He)题。

算法0

我会暴力!

每次询问暴力计算答案!

期望得分15

如果利用算法2中的方程判断,可能可以通过Subtask 3

算法1

我会KD-Tree!

随机数据KD-Tree的复杂度看上去很真实。

极端情况下会被卡到O(nQ),但是跑跑subtask 2应该没啥问题。

事实证明KDT是一个死掉的算法。

期望得分:45

算法2

我会写方程!

写出圆方程xi2+(yizi)2Ri2

移项得到xi2+yi2Ri2zi2+2yizi

如果我们把(xi,yi)映射到(yi,xi2+yi2),则问题转化为询问直线l:kx+b以下的点个数。其中k=2zi,b=Ri2zi2

维护斜率固定时的点的相对顺序,每次询问二分即可。

时间复杂度O((n2+Q)logn)

期望得分:30,结合算法1期望60

算法3

n=12000好像不太能继续用算法2了。

欸能不能把n给分成若干块,每块单独计算贡献。

如果按照分块的思路去维护,设把点序列分成S块,每一块按照算法2的思路来处理,则时间复杂度为O((n2S+QS)logn)

S=nQ时最优,为O(nQlogn)

期望得分:100

我和算法3一样为什么我又挂掉了

坐标范围是109因此用 double 精度有可能会爆炸。

出题人没有说过点集互不相同,公告里也更新过了,所以对于相同点要又高超的处理技巧。

可能将点坐标转换后会出现三点共线,同时sort是不稳定排序,因此需要一些小技巧处理这种情况。

挑战哈密顿

from peehs_moorhsum,数据、标程、题解 by peehs_moorhsum

算法0

我会暴力!

暴力搜索哈密顿路径,或者状压DP,可以通过前两个点。

期望得分20

算法1

第三个点是DAG,第四个点缩强连通分量之后每个分量很小。

可以对于每个分量搜任两点之间有没有哈密顿路。

期望得分40

算法2

第五个点到第十个点是在一条链上随机加边生成的。

有各种乱搞姿势,看起来能在这些点获得10~57分不等

结合算法1,可以获得50~97分

算法3

接下来是标算。

维护边的一个尽量大的子集,满足只考虑这些边时每个点出入度都不超过1,且不构成圈。

如果子集大小达到n1,则找到了一条哈密顿路。

考虑调整维护子集。按随机顺序考虑边,如果加入后不构成圈,且加入之后所有点度数均仍合法,则加入这条边。

否则如果不构成圈,但有一个点度数不合法,则以一半概率加入并把该点相连的与新加入边矛盾的边断掉。

用最暴力的方法实现,也能总用时在10秒左右跑出前9个点,10分钟左右跑出最后一个点。

期望得分:100

如果利用LCT维护是否构成圈,能够快很多。但出题人因为太懒,并没有写

一些彩蛋

关于有向图哈密顿链,似乎是有不少论文的。

验题人实现了其中一些,发现都是反向优化没有很好的表现。

所以欢迎吊打论文的大家在题解区交流做法ww

另:这道题主角真的是03

评论

前排
T3又是毒瘤提答题……和那个三染色一样……
一个奇怪的 hash 想法:给每个字符随机赋予一个在 Fp 上的 k×k 矩阵,这样就不会直接满足交换律,并且看起来能支持更一般情况的字符串集合的 hash 功能,比如把两个集合里的串两两拼接构成的一个乘积形式的集合什么的。看起来 3×3 的随机矩阵通过了目前的数据(
评论回复
EntropyIncreaser:2*2 似乎也能过目前的数据 /jy
xuyixuan:可以给每一个字符在每一位赋不同的随机权,这样同样不会满足交换律
跑路被发现了[大哭][大哭][大哭]
t2算法二期望得分是45吧(
评论回复
luosiyuan:错了是算法一
前排支持
前排自闭
kdtree 怎么找圆内点数。。不太会
评论回复
cbio:类似找矩形内点数。。暴力搜,遇到子树中的点坐标极值与圆不相交的就返回
前排声明:那个提答 97pts 的是 gcz 不是我 /fad
评论回复
1tst:啊这
看第三题随机算法跑 NP,想到一篇 [CF 的文章](https://codeforces.com/blog/entry/81024)
@zhouyuyang http://a1b3c7d9.blog.uoj.ac/blog/5263
计算几何无细节做法:直接按整数击败时间做。重合点、三点共线都不用判(然而负数除法下取整写成向零取整FST了/kk)
评论回复
memset0:按照取整后的击败时间做怎么安排打败顺序啊
nealchen2003:回复 @memset0:在这个整时刻,前面打败后面就交换,也就是冒泡排序,所以顺序不需要特殊考虑。
memset0:回复 @nealchen2003:我一开始也是这么写的,可是如果每次交换的不是相邻两个就会GG...
nealchen2003:回复 @memset0:qwq
memset0:回复 @nealchen2003:所以怎么处理使得每次交换相邻的呢,还是您的算法不需要这样的性质
T2算法3时间复杂度错了吧,应该是O(((nS)2+QS)logn)
评论回复
nealchen2003:没错,(n/S)^2要跑S趟
panyf:好吧我算错了……
panyf:可是O(nQlogn)为什么能跑进4s啊……
memset0:回复 @panyf:2e8级别为什么跑不进啊
话说T1正确率咋分析啊。
评论回复
Picks:回复 @zx2003:参考我新发的博客哦~
vfleaking:更新了
T1 用普通 hash + 判断最后一个字符可以 AC。。这样能 hack 吗?http://uoj.ac/submission/425864
“反正法”草

发表评论

可以用@mike来提到mike这个用户,mike会被高亮显示。如果你真的想打“@”这个字符,请用“@@”。