标签: algorithm text nlp stanford-nlp opennlp
我有一堆格式错误的文字,标点丢失很多。我想知道是否有任何方法可以在缺少句点,分号,大写等时将文本分段为句子。 例如,考虑一下这段:“狮子被称为森林之王,它有一种雄伟的外表它吃肉,它能跑得很快,狮子的轰鸣声非常有名”。 该文本应分为单独的句子:
可以这样做还是不可能?任何建议都非常感谢!