如何使用正则表达式在正确的位置分割汉字?

时间:2019-05-27 03:50:31

标签: python python-3.x

我想将特定的汉字分成几行。确实可以,但是分割字符的位置错误。我怎样才能将其拆分到正确的位置?

我在python 3.6中通过正则表达式拆分了汉字

str = '我到家'
pattern = '([\u4e00-\u9fa5]?(?:到))'
compiled_pattern = re.compile(pattern)
new_str = re.split(compiled_pattern, str)
print(new_str)

我的代码输出为

['', '我到', '家']

但是我想要的是

['我', '到', '家']

我该如何修复并将角色吐到正确的位置?

2 个答案:

答案 0 :(得分:1)

只要这样做

list(str)

我尝试过,输出与您想要的相同

['我', '到', '家']

答案 1 :(得分:0)

尝试一下:

str = '我到家'
pattern = '(我)(到)(家)'
compiled_pattern = re.compile(pattern)
new_str = list(re.findall(compiled_pattern,str)[0])
print(new_str)