我使用Standford NLP来识别给定句子的POS。
我需要从句子中提取适当的单词(在词典中定义的单词)。
例如:如果句子是“我在飞行中去了纽约6AWDR ”
当我使用Standford NLP时,PartOfSpeechAnnotation.class将“ flight ”和“ 6AWDR ”这两个词标记为“NNP”。
如何在一个句子中单独提取适当的英语单词?
答案 0 :(得分:0)
我使用Apache Utils来识别字符串是否为Alpha。
假设大多数字母数字单词在字典中不是有效单词(除非它们是缩写)