如何获得英语单词数据库?

时间:2010-02-06 15:31:52

标签: database words

我需要一个英文每个有效单词的数据库。我检查了/usr/share/dict/words文件,它包含的文字少于100k。维基百科说英语有475k字。我在哪里可以获得完整列表(美国拼写)?

此外,是否还有一个网站可以为其他语言提供单词,包括亚洲和欧洲语言?

编辑:忘记添加,我不需要姓名等,只需要有效的英文单词。

6 个答案:

答案 0 :(得分:66)

WordNet数据库可能会有所帮助。我曾经在一个Firefox插件上工作,它处理单词和各种简单到复杂的关联。看起来WordNet对你非常有用。

这是MySQL formatthis one(网站存档链接)使用Wordnet v3.0数据,而不是较旧的Wordnet 2.0数据。

答案 1 :(得分:31)

您可以在infochimps.org上找到所需内容。

他们列出了350,000个简单(即非复合)单词可供免费下载。

Word List - 350,000+ Simple English Words

关于其他语言,您可能想要了解维基词典。以下是所有database backups的链接 - 信息不是很有可能组织的,但如果他们有语言,您可以下载SQL格式的数据。

答案 2 :(得分:11)

我没有看到这里提到http://wordlist.sourceforge.net/,但如果我正在寻找类似的东西,那就是我要去的地方(当我偶然发现这个问题时,我就是这样)。

如果你在那里找不到你想要的东西,你想要的是一个英文单词列表,那么你应该多花一些时间来描述如何识别你想要的东西。

答案 3 :(得分:8)

没有“完整”列表这样的东西。不同的人有不同的衡量方法 - 例如,他们可能包括俚语,新词,多词短语,冒犯性词语,外来词,动词变形等等。有些人甚至算过a million words!所以你必须在单词列表中决定你想要什么。

答案 4 :(得分:3)

您可以查看Mozilla,OpenOffice以及其他许多软件使用的*spell en-GB dictionary

答案 5 :(得分:1)

您没有说明您需要此列表的内容。如果用作密码检查黑名单的内容足够cracklib可能对您有好处。它包含超过150万字。