我从PDF中提取javascript代码,但它转换为八进制转义序列。
我想将其转换为普通的JavaScript代码。
\040\040\040\040\146\165\156\143\164\151\157\156\040\163\167\050\051\17....
请告诉我。
答案 0 :(得分:2)
您可以使用unicode_escape
encoding:
在Python 2.x中:
>>> r'\040\040\040\040\146\165\156\143\164\151\157\156'.decode('unicode-escape')
u' function'
在Python 3.x中:
>>> br'\040\040\040\040\146\165\156\143\164\151\157\156'.decode('unicode-escape')
' function'
答案 1 :(得分:-1)
这适用于Python 2.x和3.x:
>>> b'\040\040\040\040\146\165\156\143\164\151\157\156\040\163\167'.decode('utf-8')
' function sw'