我有一个单词列表转换为unciode
字符串列表,但我无法匹配字符串列表中特定单词的结束字符串,例如:
包含需要删除的字符串的列表。例如
उपलब्धियां
是转换为unicode时的单词u'\u0909\u092a\u0932\u092c\u094d\u0927\u093f\u092f\u093e\u0902'
包含字符串的列表,如果在unicode中的单词末尾找到,则需要将其删除
r3_bad= [u"0900", u"0901", u"0902",u"0903"];
在这种情况下,u0902
位于错误字符串列表的末尾,因此要删除。
我试过
if re.search(r'u$[0-3]',word[-1]) :
它不会返回true 我不知道为什么。
请提前帮助谢谢。
答案 0 :(得分:0)
为何选择RegEx?我认为你需要像普通字符串比较那样的东西:
s = u'\u0909\u092a\u0932\u092c\u094d\u0927\u093f\u092f\u093e\u0902'
r3_bad= [u'\u0900',u'\u0901',u'\u0902',u'\u0903']
print s # output: उपलब्धियां
if s[-1] in r3_bad: print s[:-1] # output: उपलब्धिया