我创建了一个数据框,我想将其导出为CSV。我用了
df.to_csv()
方法。
当我读取自己创建的csv时,解析得不好,并且有一些 列之间相互混合的值。
我试图更改编码以及定界符,但是它 不能解决我的问题。
这是我的数据框在导出为CSV之前的示例:
societe ... cluster
6 ACTION AIR ENVIRONNEMENT ... aquavalley
7 AD NUCLEIS ... aquavalley
8 AD'OCC ... aquavalley
9 ADEQUABIO ... aquavalley
10 ADICT SOLUTIONS ... aquavalley
然后我用来导出它:
csv_df.to_csv(r"path.csv", sep="\t")
并阅读:
pd.read_csv(r"path.csv", sep="\t", engine='python')
我得到类似的东西
7 AD NUCLEIS ... aquavalley
8 AD'OCC ... None
215 Rue 34000 Mont... contact@cc.com ... None
9 ADEQUABIO ... aquavalley
答案 0 :(得分:0)
尝试将其读取为pd.read_csv("path.csv")
答案 1 :(得分:0)
您可以尝试在index
中添加参数to_csv
:
df.to_csv(r"path.csv", sep="\t", index=False)
或者可能是您的字段包含选项卡的问题,所以在这种情况下,我建议您更改分隔符
答案 2 :(得分:-1)
感谢您的快速解答。我解决了我的问题。
我以为我使用df.replace('\ r','')摆脱了回车符'\ r'和换行符'\ n',但是它没有用(仍然不知道为什么) ,所以当我以为他们不在时,他们仍然在这里。
相反,我使用了:
df.replace(to_replace=[r"\\t|\\n|\\r", "\t|\n|\r"], value=[" "," "], regex=True)
摆脱它之后,我没有任何问题。
再次感谢您的帮助。