我正在研究一些排序算法,需要练习一些东西。在搜索未排序的字典文件时,我得到的只是寻求帮助的人的结果。我正在寻找一个问题,而不是一个解决方案。
有人能指出我一个未分类的字典吗?越大越好,我希望找到一条大约120,000行。
感谢您的帮助。
答案 0 :(得分:5)
在Linux上,您可以使用shuf /usr/share/dict/words
创建自己的随机字典。在我的机器上,这本字典包含98569,所以还没有你想要的尺寸。但是,如果您找到一个更大的有序字典,您也可以使用shuf
命令对其进行删除。
此外,如果您需要每个单词的倍数,您只需执行cat /usr/share/dict/words /usr/share/dict/words /usr/share/dict/words /usr/share/dict/words | shuf
,每个单词将出现四次。
答案 1 :(得分:1)
我使用的一件事是外语翻译词典,第一列包含已删除的已排序外语词。这留下了未排序的单词列表,尽管它不是完全随机的,因为类似的单词通常具有相似的翻译。