标签: machine-learning nlp stanford-nlp
在此链接中http://nlp.stanford.edu/software/tokenizer.html 处理文档,并以不同方式识别所有缩写点和句点。我想知道这背后使用的逻辑或过程。请解释。
答案 0 :(得分:-2)
您可以将文档拆分为句子(使用斯坦福或任何其他工具,例如this);显然句子末尾的点是句号。