标签: python regex nltk tokenize
const mapStateToProps = (state, ownProps) => ({ cart: state.cart, products: state.products });
我想要标记文字。问题是,所有在一行末尾的单词都被标记错误。所以我必须在新行字符之前删除连字符。
感谢您的帮助!
答案 0 :(得分:3)
尝试使用前瞻来识别换行符,而不是将其包含在子操作的一部分中:
string = re.sub(r'-(?=\n)', '', string)