我有一些文字,我想用Python分解成字幕。我的代码使用NLTK将文本分成句子,然后分成最多36个字符的行。我无法弄清楚如何根据词性选择字幕中的换行符。因此,例如,这是一个使用我当前代码分成字幕的句子:
孩子们并没有多少人 占据他们所以他们进入了
经常麻烦。
在实践中,这不适合作为副标题。如果换行符就像
那样会更好孩子们并没有多少人 占据他们
所以他们经常陷入麻烦。
NLTK中有什么东西会这样做吗?
答案 0 :(得分:1)
NLTK在http://www.nltk.org/api/nltk.chunk.html
下有内置的分块(和chinking)功能使用NLTK进行分块的好的简介教程是http://nbviewer.ipython.org/github/lukewrites/NP_chunking_with_nltk/blob/master/NP_chunking_with_the_NLTK.ipynb