我有一个来自视频的录音文本(语音到文本),并希望将其拆分成句子。没有使用标点符号(例如,;:?!)。
到目前为止我做了什么:
from stanfordcorenlp import StanfordCoreNLP
nlp = StanfordCoreNLP(r'/home/lukas/corenlp', lang='de', memory='4g')
text = "Ähm also und das war voll toll Ich dachte so hä wie kann das /n sein da haben so viele teilgenommen und gerade bei mir hat es geklappt später ist mir alles klar geworden "
properties={
"annotators": "ssplit",
"outputFormat": "xml",
"pinelineLanguage": "de",
"enforceRequirements": "false",
}
output = nlp.annotate(text, properties=properties)
print(output)
nlp.close()
但我没有得到任何结果。
谢谢