是否可以使用上下文将字符串分隔成句子?

时间:2016-11-10 09:59:20

标签: python nlp

是否可以通过字符串上下文在python中使用NLP将字符串分隔为多个句子。

输入:

string =“中国人在中国使用称为微博的社交媒体,它与Twitter相同。”

输出:

  • 中国人在中国使用名为微博的社交媒体
  • 与Twitter相同。

或者我们可以设置句子的边界。

我尝试过使用标记化,但是使用它我只能通过标点符号,空格,空白行等分隔字符串。

2 个答案:

答案 0 :(得分:0)

查找上下文无关语法,然后为英语语言定义一个语法,然后使用诸如http://pyparsing.wikispaces.com/之类的包进行解析。

参见例如http://www.nltk.org/book/ch08.html。实际上,http://www.nltk.org/可能是一个很好的资源。

答案 1 :(得分:-1)

你的例子可以分成不同的地方,仍然给出有效的句子。

string="Chinese people use social media called weibo in China it is the same as Twitter."
  • 中国人使用社交媒体
  • 中国人使用名为微博的社交媒体。
  • 在中国称为微博的社交媒体与Twitter相同。
  • 中国的微博与Twitter相同
  • 中国与Twitter相同

依旧......

对于给定的示例,没有一个最佳分割,因此您的算法应该生成所有有效的可能性。