我正在寻找一种在句子中添加标点符号的方法,例如:
hey mike how are you -> Hey Mike, how are you?
如果该型号能够正确安装套管,我也不会生气。我过去曾经使用过nltk
,spacy
和CodeNLP
,但我无法回忆(或找到)任何可以使我增强这样的句子的东西。
是否可以对任何一个或那些库执行此操作?
答案 0 :(得分:1)
根据this post,在语音识别(用于转录)和自然语言处理(NLP)中进行了研究。
所引用的一种实现可以在here中找到。
将您的例句作为demo中的输入将导致“嘿,迈克,你好吗”。如您所见,结果有点接近某人的预期,但并不完全相同。
答案 1 :(得分:0)
在给定字符串中添加适当的标点符号的任务在研究界通常称为“ punctuation restoration”。 nltk
,spacy
和CodeNLP
没有此功能。
https://github.com/ottokart/punctuator2。 Simon suggested是python 2.7 + Theano + MIT许可证+单词级预测+于2016年发布。更新的软件包是https://github.com/geyang/deep-auto-punctuation(Pytorch,字符级预测+已发布在2017年,但没有许可证。