如何从真实语言中生成随机单词

时间:2014-06-08 17:00:48

标签: web-services asp.net-web-api words

如何从真实语言中生成随机单词?

有人知道任何来自互联网的API吗?

例如,我发送http请求到'ht_tp://www.any...api.com/getword?lang = en ',我得到了'Town'的回复。或者“快”。或者'已收到'...例如我发送http请求到'ht_tp://www.any...api.com/getword?lang = ru '我得到回应'Ходить' 。或者'Шапка'。或'Отправлено'......任何语言的任何形式(名词,形容词,动词等......)。

我找到了资源“http://www.randomlists.com/random-words”。但这不是JSON格式,只有英文,并且长时间不做任何保修工作。

请任何想法。

3 个答案:

答案 0 :(得分:1)

请参阅此答案:https://stackoverflow.com/questions/824422/can-i-get-an-english-dictionary-word-list-somewhere下载单词词典,粘贴数据库并获取随机记录或每次从文件中读取随机行。这样您就不会依赖第三方API,而是可以使用您可以找到的所有语言进行扩展。

答案 1 :(得分:1)

您可以下载the OpenOffice dictionaries。它们是扩展名(oxt),与ZIP文件没什么区别。你可以用7zip或类似的方式打开它们。你会发现很多文件,有趣的是* .dic文件。它们还包含分辨率或数字。

当你遇到像abandon/LdS这样的东西时,摆脱/LdS这用于hunspell。

将这些* .dic文件用作密钥,将它们放入数据库,然后从中选择一个随机单词,以获取给定的语言代码。

<强>更新

较旧,但更容易访问,the archived hunspell dictionaries from OpenOffice

答案 2 :(得分:-1)

这个问题可以通过两种方式来看待,因此我给出了两个答案:

  • 为了收集单词,我会在已知语言的网站上运行蜘蛛(维基百科是一个很好的起点)并剥离HTML标签。
  • 从真实语言生成单词更加棘手。使用收集的单词中的统计数据,可以使用产生统计真实单词的Markow链。我已经逐字逐句地尝试过,但效果很差。这可能是使用音节结构的更好方法。