我有大量的* .txt文件,我读了收集数据。不经意间,我用Notepad ++打开了一些,看看分隔符是什么。在这样做时,我知道Noepad ++在文件中包含了'\ ufeff0'。
反过来,这使得读取数据变得不可能,因为它将第一个字符转换为'\ ufeff0'。
因此,当我想使用公共列合并文件时,会出错。例如,我应该合并的列包含以下内容:
temp1.month.unique()
array(['\ufeff0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11',
'12', '13', '14', '15', '16', '17', ... 1, 2, 3, 4, 5, ...], dtype=object)
因此,我无法将数字转换为字符串并合并,因为第一个字符。
早些时候,我已经将Notepad ++的设置设置为使用BOM进行编码。