使用pandas保留行时删除行中的所有重复值(python)

时间:2017-01-27 03:54:36

标签: python pandas

以下是数据框的子集。

enter image description here

我想删除每一行中的所有重复项目。例如,在第一行中,应该删除最后一个值头晕,因为第1行的WD2列已经存在头晕。

输出应该是这样的: enter image description here

我知道如何删除列中的重复但我不知道如何连续执行。提前致谢。

2 个答案:

答案 0 :(得分:1)

只需指定另一个轴:

@Override
    protected void onCreate(@Nullable Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);
        listView = (ListView) findViewById(R.id.listViewBooks);
        getBooks();
        listView.setOnItemClickListener(this);
    }

答案 1 :(得分:0)

import numpy as np
import pandas as pd

df = pd.DataFrame([
    ['a', 'b', 'c', np.nan],
    ['a', 'b', 'b', 'a'],
    ['c', 'b', 'c', 'd']
])
duplicated = df.apply(lambda x: x.duplicated(keep='first'), axis=1)  # converts each row into a pd.Series of True/False values indicating whether a cell is a duplicate
print(duplicated)  # this is a pd.DataFrame of True/False indicating which cells to drop.
df[duplicated] = np.nan  # assign np.nan to duplicates