《哈利波特》是小美最喜欢的一本小说。马上就是小美的生日了,作为生日礼物,蒜斜在网上下载了《哈利波特》1-7 部的英文文本,并按照顺序整理成了一本电子书。
然而,在整理完之后,蒜斜不小心运行了自己在《自然语言处理》课上写的洗数据代码,并将整理好的电子书文件覆盖了。具体来说:
- 电子书文件中所有的大写字符都变成了小写字符。
- 电子书文件中所有除了英文字母以外的符号,包括标点、空格、阿拉伯数字等,都被删除了。
现在,蒜斜辛辛苦苦整理好的电子书文件变成了一个包含小写字母的长度为
作为补救,他掏出了自己在《自然语言处理》课的大作业中用到的英文单词表
下面是一个简单的例子,假设字典中包含两个单词 suan
和 xie
,那么 suan
+ x
+ i
+ e
和 suan
+ xie
都是字符串 suanxie
的分词方案。因为前者的代价为
在字典的帮助下,蒜斜很轻松的将
作为一名热爱动脑的 21 世纪大学生,蒜斜发现分词这个问题比他想象中的更加有趣,于是他就作了一下延伸的思考。
对于
输入格式
本题是一个提交答案题,本题的下发文件中包含如下部分:
harry-potter.txt
中存储了哈利波特串。dict.txt
中按照字典序从小到大的顺序给出了 中的所有单词。harry1.in
和harry2.in
是本题的两组测试数据,分别对应 Small Task 和 Large Task。
输入数据包含一行一个正整数
输出格式
你需要输出
样例输出
这儿展示一个假象场景下的输出。假设需要分词的字符串是 suanxie
,字典中仅包含两个单词 suan
和 xie
,且
suan 5 xie 4
限制与约定
Small Task:
Large Task: