熊猫在写CSV时不会读取CSV

时间:2019-05-29 12:35:45

标签: python pandas csv export

我创建了一个数据框,我想将其导出为CSV。我用了 df.to_csv()方法。

当我读取自己创建的csv时,解析得不好,并且有一些 列之间相互混合的值。

我试图更改编码以及定界符,但是它 不能解决我的问题。

这是我的数据框在导出为CSV之前的示例:

                                           societe  ...     cluster
    6                      ACTION AIR ENVIRONNEMENT  ...  aquavalley
    7                                    AD NUCLEIS  ...  aquavalley
    8                                        AD'OCC  ...  aquavalley
    9                                     ADEQUABIO  ...  aquavalley
    10                              ADICT SOLUTIONS  ...  aquavalley

然后我用来导出它:

csv_df.to_csv(r"path.csv", sep="\t")

并阅读:

pd.read_csv(r"path.csv", sep="\t", engine='python')

我得到类似的东西

    7                                    AD NUCLEIS  ...  aquavalley
    8                                        AD'OCC  ...        None
    215 Rue         34000 Mont...    contact@cc.com  ...        None         
    9                                     ADEQUABIO  ...  aquavalley

3 个答案:

答案 0 :(得分:0)

尝试将其读取为pd.read_csv("path.csv")

答案 1 :(得分:0)

您可以尝试在index中添加参数to_csv

df.to_csv(r"path.csv", sep="\t", index=False)

或者可能是您的字段包含选项卡的问题,所以在这种情况下,我建议您更改分隔符

答案 2 :(得分:-1)

感谢您的快速解答。我解决了我的问题。

我以为我使用df.replace('\ r','')摆脱了回车符'\ r'和换行符'\ n',但是它没有用(仍然不知道为什么) ,所以当我以为他们不在时,他们仍然在这里。

相反,我使用了:

df.replace(to_replace=[r"\\t|\\n|\\r", "\t|\n|\r"], value=[" "," "], regex=True)

摆脱它之后,我没有任何问题。

再次感谢您的帮助。