Question

我对csv有另一个问题。我正在使用pandas从csv文件中删除重复项。在这样做之后，我注意到所有数据都放在一列中（预处理数据已包含在9列中）。怎么避免呢？

以下是数据示例：

39,43,197,311,112,88,47,36,Label_1

以下是功能：

import pandas as pd

def clear_duplicates():
    df = pd.read_csv("own_test.csv", sep="\n")
    df.drop_duplicates(subset=None, inplace=True)
    df.to_csv("own_test.csv", index=False)

Answer 1

删除sep，因为read_csv中的默认分隔符为,：

def clear_duplicates():
    df = pd.read_csv("own_test.csv")
    df.drop_duplicates(inplace=True)
    df.to_csv("own_test.csv", index=False)

也许不那么好，但也有效：

pd.read_csv("own_test.csv").drop_duplicates().to_csv("own_test.csv", index=False)

Pandas将一行中的所有数据放在一列中

1 个答案: