Notepad ++将'\ ufeff0'添加到某些文件的开头,使其无法合并

时间:2017-09-26 13:01:23

标签: python encoding notepad++

我有大量的* .txt文件,我读了收集数据。不经意间,我用Notepad ++打开了一些,看看分隔符是什么。在这样做时,我知道Noepad ++在文件中包含了'\ ufeff0'。

反过来,这使得读取数据变得不可能,因为它将第一个字符转换为'\ ufeff0'。

因此,当我想使用公共列合并文件时,会出错。例如,我应该合并的列包含以下内容:

temp1.month.unique()
array(['\ufeff0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11',
   '12', '13', '14', '15', '16', '17', ... 1, 2, 3, 4, 5, ...], dtype=object)

因此,我无法将数字转换为字符串并合并,因为第一个字符。

早些时候,我已经将Notepad ++的设置设置为使用BOM进行编码。

0 个答案:

没有答案