在CSV熊猫python中添加特殊字符

时间:2019-07-25 20:57:50

标签: python pandas csv utf-8

在编写包含某些特殊字符的字符串时,例如

showSubComponent: BehaviorSubject<boolean> = new BehaviorSubject<boolean>(false);

//button click method
subComponentLoadBtn(){
  this.showSubComponent.next(true)
}

使用 pandas 中的 to_csv ,csv中的结果看起来像

    Töölönlahdenkatu

我们如何直接写出字符串文本?这是我的to_csv命令

    T%C3%B6%C3%B6l%C3%B6nlahdenkatu

我什至尝试过

    df.to_csv(csv_path,index=False,encoding='utf8')

仍然没有成功。还有其他字符替换为随机符号

    df.to_csv(csv_path,index=False,encoding='utf-8')
    df.to_csv(csv_path,index=False,encoding='utf-8-sig')

有解决方法吗?

2 个答案:

答案 0 :(得分:1)

您要执行的操作是删除德国变音符和西班牙波浪号。有一个简单的解决方案。

import unicodedata

data = u'Töölönlahdenkatu Adiós Pequeño'
english = unicodedata.normalize('NFKD', data).encode('ASCII', 'ignore')
print(english)

输出:b'Toolonlahdenkatu Adios Pequeno'

让我知道它是否有效,或者是否存在任何边缘情况。

答案 1 :(得分:0)

ö这样的特殊字符不能像英文字母一样存储在csv中。 “随机符号”告诉像excel这样的程序,当您打开文件时将其解释为特殊字符,但是当您在vscode中查看csv时,看不到特殊字符。