在括号中调整NLTK句子标记器保留句

时间:2019-11-04 05:42:59

标签: nltk

我有一句话,我不想让它放在方括号内,知道吗?

示例:

  

今天是星期一。 [金钱可以买这个和这个。但这不能买爱。]

当前输出:

  

今天是星期一。

     

[金钱可以买这个和这个。

     

但它不能买爱。]

预期输出:

  

今天是星期一。

     

[金钱可以通过这个和这个。但这不能买爱。]

1 个答案:

答案 0 :(得分:0)

您需要对输入数据进行一些预处理。使用split()函数在左括号和右括号处进行拆分。这样,您可以为元素编入索引,它们是“普通”句子和括在方括号中的句子。那么您可以决定将哪个拆分,哪些不拆分。然后重新加入元素并在需要时恢复括号。