我有一个包含关键字列表的 csv 文件,我想用它来过滤文本。
我保存了 csv 文件,并尝试使用 pd.from_csv('file.csv', encoding = 'UTF-8') 在我的笔记本中打开它
即使我为此编码类型指定了编码,这也不起作用。
经过一番搜索,我发现了一些不同的编码,我决定去
keywords = pd.read_csv('file.csv', encoding = 'latin1')
为我获取实际的关键字,但是在检查单词时,我发现空格按如下方式传递:
['falsification\xa0',
'détournement\xa0de\xa0subsides\xa0',
'parachutes\xa0dorés\xa0',...]
关于 csv 文件:它有两列关键字,一列是荷兰语,另一列是法语。即使我使用其他编码(如
),空格问题仍然存在