read_csv 熊猫,编码问题

时间:2021-04-16 11:16:37

标签: pandas csv

我有一个包含关键字列表的 csv 文件,我想用它来过滤文本。

我保存了 csv 文件,并尝试使用 pd.from_csv('file.csv', encoding = 'UTF-8') 在我的笔记本中打开它

即使我为此编码类型指定了编码,这也不起作用。

经过一番搜索,我发现了一些不同的编码,我决定去

keywords = pd.read_csv('file.csv', encoding = 'latin1')

为我获取实际的关键字,但是在检查单词时,我发现空格按如下方式传递:

['falsification\xa0',
 'détournement\xa0de\xa0subsides\xa0',
 'parachutes\xa0dorés\xa0',...]

关于 csv 文件:它有两列关键字,一列是荷兰语,另一列是法语。即使我使用其他编码(如

),空格问题仍然存在

0 个答案:

没有答案