Question

我创建了一个数据框，我想将其导出为CSV。我用了 df.to_csv()方法。

当我读取自己创建的csv时，解析得不好，并且有一些列之间相互混合的值。

我试图更改编码以及定界符，但是它不能解决我的问题。

这是我的数据框在导出为CSV之前的示例：

                                           societe  ...     cluster
    6                      ACTION AIR ENVIRONNEMENT  ...  aquavalley
    7                                    AD NUCLEIS  ...  aquavalley
    8                                        AD'OCC  ...  aquavalley
    9                                     ADEQUABIO  ...  aquavalley
    10                              ADICT SOLUTIONS  ...  aquavalley

然后我用来导出它：

csv_df.to_csv(r"path.csv", sep="\t")

并阅读：

pd.read_csv(r"path.csv", sep="\t", engine='python')

我得到类似的东西

    7                                    AD NUCLEIS  ...  aquavalley
    8                                        AD'OCC  ...        None
    215 Rue         34000 Mont...    contact@cc.com  ...        None         
    9                                     ADEQUABIO  ...  aquavalley

Answer 1

尝试将其读取为pd.read_csv("path.csv")

Answer 2

您可以尝试在index中添加参数to_csv：

df.to_csv(r"path.csv", sep="\t", index=False)

或者可能是您的字段包含选项卡的问题，所以在这种情况下，我建议您更改分隔符

Answer 3

感谢您的快速解答。我解决了我的问题。

我以为我使用df.replace（'\ r'，''）摆脱了回车符'\ r'和换行符'\ n'，但是它没有用（仍然不知道为什么），所以当我以为他们不在时，他们仍然在这里。

相反，我使用了：

df.replace(to_replace=[r"\\t|\\n|\\r", "\t|\n|\r"], value=[" "," "], regex=True)

摆脱它之后，我没有任何问题。

再次感谢您的帮助。

熊猫在写CSV时不会读取CSV

3 个答案: