我有一个形状的熊猫数据帧(455698,62)。我想将它保存为csv文件,稍后再用pandas加载它。现在我这样做:
df.to_csv("/path/to/file.csv",index=False,sep="\\", encoding='utf-8') #saving
df=pd.read_csv("/path/to/file.csv",delimiter="\\",encoding ='utf-8') #loading
我得到一个有形状的数据帧(455700,62):还有2行?当我详细检查(查看每列中的所有唯一值)时,我发现某些值在过程中更改了列。
我尝试了多个分隔符,强制dtype =" object",我无法弄清楚bug的位置。我该怎么办?
答案 0 :(得分:3)
您的某些字符串是否可能包含换行符(\n
)?
在这种情况下,我建议在保存CSV文件时使用引用:
import csv
df.to_csv("/path/to/file.csv",index=False,sep="\\", encoding='utf-8', quoting=csv.QUOTE_NONNUMERIC)
...