有人能指点我一个未分类的字典吗?

时间:2011-11-07 16:41:41

标签: file sorting text text-files

我正在研究一些排序算法,需要练习一些东西。在搜索未排序的字典文件时,我得到的只是寻求帮助的人的结果。我正在寻找一个问题,而不是一个解决方案。

有人能指出我一个未分类的字典吗?越大越好,我希望找到一条大约120,000行。

感谢您的帮助。

2 个答案:

答案 0 :(得分:5)

在Linux上,您可以使用shuf /usr/share/dict/words创建自己的随机字典。在我的机器上,这本字典包含98569,所以还没有你想要的尺寸。但是,如果您找到一个更大的有序字典,您也可以使用shuf命令对其进行删除。

此外,如果您需要每个单词的倍数,您只需执行cat /usr/share/dict/words /usr/share/dict/words /usr/share/dict/words /usr/share/dict/words | shuf,每个单词将出现四次。

答案 1 :(得分:1)

我使用的一件事是外语翻译词典,第一列包含已删除的已排序外语词。这留下了未排序的单词列表,尽管它不是完全随机的,因为类似的单词通常具有相似的翻译。