我正在开发一个接收文本块的程序。文本可能在单词之间或单词中间分开 - 没有办法确定。无论是在开头还是结尾,我都想丢弃部分词。是否有一个程序/ API可以帮助识别合法的单词?显然,会有一些问题,有正确的名字,复合词等等。谢谢!
答案 0 :(得分:2)
所以你在寻找类似英语词典的东西?然后:How to implement an English dictionary in Java?应该会帮助你。 Natural English language words也可能很有趣。
基本上,他们正在解析英语中所有(或大多数)单词的长列表,并检查是否包含特定单词。