我遇到了处理西里尔字母符号的问题。我有一个2列的数据框,其中包含西里尔符号。此熊猫数据框的示例:
count word
0 2193 u''
1 543 u'\u0440'
2 397 u'\u043d\u0430'
3 392 u'\u0438'
4 359 u'\u0411\u0430\u043b\u0430\u043d\u0441'
5 199 u'\u0432'
6 178 u'\u0441'
7 139 u'\u043f\u043e'
8 133 u'VISA'
9 122 u'\u043f\u043e\u0434\u043a\u043b\u044e\u0447\...
但是,例如,如果我仅将print()
用于一个字符串,例如print(u'\u043c\u043e\u0436\u043d\u043e')
,则输出如下:можно
。这意味着print()
可以正确解释西里尔文符号。
如何使用正常显示的西里尔符号打印数据框?是否可以将此熊猫数据帧转换为西里尔符号并将其写入.csv
格式?感谢您的任何建议。
BR,
弗拉基米尔。