我给出的是一个标记化的文本,类似于
“在2005年的夏天,人们一直在寻找一张照片 转发到 T -1开始* -2以各种专业的频率出现 媒体。“
我需要得到斯坦福大学的共识解决方案,但是我想从标记化后的步骤开始,有人可以帮助我,因为我得到了令牌而我正在尝试创建句子注释但它给出了null,可以有人帮忙(我看了帖子Coreference resolution using Stanford CoreNLP)这很有帮助,但还不够。
答案 0 :(得分:0)
尝试设置tokenize.whitespace
属性。这将告诉tokenizer在空格上进行标记化;即,将文本视为已经标记化。