在文本中添加标点符号

时间:2019-02-12 10:27:44

标签: nltk stanford-nlp spacy

我正在寻找一种在句子中添加标点符号的方法,例如:

hey mike how are you -> Hey Mike, how are you?

如果该型号能够正确安装套管,我也不会生气。我过去曾经使用过nltkspacyCodeNLP,但我无法回忆(或找到)任何可以使我增强这样的句子的东西。

是否可以对任何一个或那些库执行此操作?

2 个答案:

答案 0 :(得分:1)

根据this post,在语音识别(用于转录)和自然语言处理(NLP)中进行了研究。

所引用的一种实现可以在here中找到。

将您的例句作为demo中的输入将导致“嘿,迈克,你好吗”。如您所见,结果有点接近某人的预期,但并不完全相同。

答案 1 :(得分:0)

在给定字符串中添加适当的标点符号的任务在研究界通常称为“ punctuation restoration”。 nltkspacyCodeNLP没有此功能。

https://github.com/ottokart/punctuator2Simon suggested是python 2.7 + Theano + MIT许可证+单词级预测+于2016年发布。更新的软件包是https://github.com/geyang/deep-auto-punctuation(Pytorch,字符级预测+已发布在2017年,但没有许可证。