Java:如何识别“真实”单词

时间:2012-09-02 16:02:35

标签: java nlp

我正在开发一个接收文本块的程序。文本可能在单词之间或单词中间分开 - 没有办法确定。无论是在开头还是结尾,我都想丢弃部分词。是否有一个程序/ API可以帮助识别合法的单词?显然,会有一些问题,有正确的名字,复合词等等。谢谢!

1 个答案:

答案 0 :(得分:2)

所以你在寻找类似英语词典的东西?然后:How to implement an English dictionary in Java?应该会帮助你。 Natural English language words也可能很有趣。

基本上,他们正在解析英语中所有(或大多数)单词的长列表,并检查是否包含特定单词。