将连字符与新行字符组合使用

时间:2018-05-28 06:15:36

标签: python regex nltk tokenize

const mapStateToProps = (state, ownProps) => ({
    cart: state.cart,
    products: state.products
});

我想要标记文字。问题是,所有在一行末尾的单词都被标记错误。所以我必须在新行字符之前删除连字符。

感谢您的帮助!

1 个答案:

答案 0 :(得分:3)

尝试使用前瞻来识别换行符,而不是将其包含在子操作的一部分中:

string = re.sub(r'-(?=\n)', '', string)

Demo