根据行号删除数据框的行

时间:2019-04-25 14:33:15

标签: python pandas dataframe indexing

假设我有一个数据帧(DF),并且还有一个像这样的数组:

rm_indexes = np.array([1, 2, 3, 4, 34, 100, 154, 155, 199])

我想从rm_indexes中删除DF中的行号。 rm_indexes中的一个表示行号1(DF的第二行),三表示数据帧的第三行,依此类推(第一行为0)。该数据帧的索引列是时间戳。

PS。我有许多与数据帧索引相同的时间戳。

2 个答案:

答案 0 :(得分:2)

您只需按索引拖放即可。这将通过索引1、2、3、4..etc..199删除df中的条目。

df.reset_index()    #this will change the index from timestamp to 0,1,2...n-1
df.drop([1, 2, 3, 4, 34, 100, 154, 155, 199])  # will drop the rows
df.index = df['myTimeStamp']  # this will restore the index back to timestamp

答案 1 :(得分:1)

尝试:

df.drop(df.index[rm_indexes])

示例

import pandas as pd

df = pd.DataFrame({"A":[0,1,2,3,4,5,6,7,8],
                   "B":[0,1,2,3,4,5,6,7,8],
                   "C":[0,1,2,3,4,5,6,7,8]})

pos = [0,2,4]
df.drop(df.index[pos], inplace=True)

输出

    A   B   C
1   1   1   1
3   3   3   3
5   5   5   5
6   6   6   6
7   7   7   7
8   8   8   8

编辑,在OP提供进一步说明后:具有相同索引的多行

df = pd.DataFrame({"A":[0,1,2,3,4,5,6,7,8],
                   "B":[0,1,2,3,4,5,6,7,8],
                   "C":[0,1,2,3,4,5,6,7,8],},
                   index=["a","b","b","a","b","c","c","d","e"])
df['idx'] = df.index

pos = [1]
df.reset_index(drop=True, inplace=True)
df.drop(df.index[pos], inplace=True)
df.set_index('idx', inplace=True)

输出

    A   B   C
idx         
a   0   0   0
b   2   2   2
a   3   3   3
b   4   4   4
c   5   5   5
c   6   6   6
d   7   7   7
e   8   8   8