我对csv有另一个问题。我正在使用pandas从csv文件中删除重复项。在这样做之后,我注意到所有数据都放在一列中(预处理数据已包含在9列中)。怎么避免呢?
以下是数据示例:
39,43,197,311,112,88,47,36,Label_1
以下是功能:
import pandas as pd
def clear_duplicates():
df = pd.read_csv("own_test.csv", sep="\n")
df.drop_duplicates(subset=None, inplace=True)
df.to_csv("own_test.csv", index=False)
答案 0 :(得分:4)
删除sep
,因为read_csv
中的默认分隔符为,
:
def clear_duplicates():
df = pd.read_csv("own_test.csv")
df.drop_duplicates(inplace=True)
df.to_csv("own_test.csv", index=False)
也许不那么好,但也有效:
pd.read_csv("own_test.csv").drop_duplicates().to_csv("own_test.csv", index=False)