我需要将ascii char转换为unicode转义
实施例:
"&"
至
"\\u0026"
上下文:
我在输入中收到两个值,第一个是字符串,另一个是带有一些内容的原始字节。 在此之后,在正则表达式中使用第一个字符串来捕获raw中的数据。
teste = "teste's teste & teste"
raw = '.... teste\'s teste \\u0026 teste",null,["here","here2"] ....'
在此之后,正则表达式与第一个变量teste
一起使用,以在变量here
中获取单词here2
和raw
,但是在某些字符变为& {在第一个var中,他无法在raw中找到任何模式,因为在raw中var是unicode escape。
所以我尝试将像&
之类的字符转换为unicode escape而没有成功
答案 0 :(得分:0)
非常感谢,我将暂时解决这个问题:
def escape_word(word):
whitelist = [" ", "'"] + list(string.ascii_letters)
new_word = ""
for _c in word:
if _c in whitelist:
new_word += _c
else:
new_word += "\\u%04x" % ord(_c)
return new_word
直到找到更好的解决方案。