是否可以通过字符串上下文在python中使用NLP将字符串分隔为多个句子。
输入:
string =“中国人在中国使用称为微博的社交媒体,它与Twitter相同。”
输出:
或者我们可以设置句子的边界。
我尝试过使用标记化,但是使用它我只能通过标点符号,空格,空白行等分隔字符串。
答案 0 :(得分:0)
查找上下文无关语法,然后为英语语言定义一个语法,然后使用诸如http://pyparsing.wikispaces.com/之类的包进行解析。
参见例如http://www.nltk.org/book/ch08.html。实际上,http://www.nltk.org/可能是一个很好的资源。
答案 1 :(得分:-1)
你的例子可以分成不同的地方,仍然给出有效的句子。
string="Chinese people use social media called weibo in China it is the same as Twitter."
依旧......
对于给定的示例,没有一个最佳分割,因此您的算法应该生成所有有效的可能性。