Pandas将一行中的所有数据放在一列中

时间:2017-04-24 13:01:59

标签: python-3.x pandas

我对csv有另一个问题。我正在使用pandas从csv文件中删除重复项。在这样做之后,我注意到所有数据都放在一列中(预处理数据已包含在9列中)。怎么避免呢?

以下是数据示例:

39,43,197,311,112,88,47,36,Label_1

以下是功能:

import pandas as pd

def clear_duplicates():
    df = pd.read_csv("own_test.csv", sep="\n")
    df.drop_duplicates(subset=None, inplace=True)
    df.to_csv("own_test.csv", index=False)

1 个答案:

答案 0 :(得分:4)

删除sep,因为read_csv中的默认分隔符为,

def clear_duplicates():
    df = pd.read_csv("own_test.csv")
    df.drop_duplicates(inplace=True)
    df.to_csv("own_test.csv", index=False)

也许不那么好,但也有效:

pd.read_csv("own_test.csv").drop_duplicates().to_csv("own_test.csv", index=False)