Python 3:将ascii char转换为unicode转义

时间:2018-05-08 22:03:56

标签: python regex python-3.x parsing unicode

我需要将ascii char转换为unicode转义

实施例: "&""\\u0026"

上下文:

我在输入中收到两个值,第一个是字符串,另一个是带有一些内容的原始字节。 在此之后,在正则表达式中使用第一个字符串来捕获raw中的数据。

teste = "teste's teste & teste" raw = '.... teste\'s teste \\u0026 teste",null,["here","here2"] ....'

在此之后,正则表达式与第一个变量teste一起使用,以在变量here中获取单词here2raw,但是在某些字符变为& {在第一个var中,他无法在raw中找到任何模式,因为在raw中var是unicode escape。

所以我尝试将像&之类的字符转换为unicode escape而没有成功

1 个答案:

答案 0 :(得分:0)

非常感谢,我将暂时解决这个问题:

def escape_word(word):
    whitelist = [" ", "'"] + list(string.ascii_letters)
    new_word = ""
    for _c in word:
        if _c in whitelist:
            new_word += _c
        else:
            new_word += "\\u%04x" % ord(_c)
    return new_word

直到找到更好的解决方案。