我正在尝试编写包含许多列表的csv文件。在某些列表中,有一个包含阿拉伯语的unicode。例如:
list1 = ['No data'], list2 = ['data1', 'data2, '\\u...', '\\u...']
unicode还包含一个额外的反斜杠。如何创建csv或更改我的代码,将unicode转换为阿拉伯字符?
答案 0 :(得分:0)
您可以使用以下函数对char进行编码/解码:
your_string.encode("utf-8").decode('unicode-escape')
例如:
test = "test \\u0643\\uFEBD"
print(test.encode("utf-8").decode('unicode-escape')) => test كﺽ
编辑1: 要转换所有数组,您可以循环遍历所有元素并逐个转换它们或使用 map 函数,如:
def f(string):
return string.encode("utf-8").decode('unicode-escape')
for sublist in main_list:
sublist = list(map(f, sublist))