假设我有一个数据帧(DF
),并且还有一个像这样的数组:
rm_indexes = np.array([1, 2, 3, 4, 34, 100, 154, 155, 199])
我想从rm_indexes
中删除DF
中的行号。 rm_indexes
中的一个表示行号1(DF
的第二行),三表示数据帧的第三行,依此类推(第一行为0)。该数据帧的索引列是时间戳。
PS。我有许多与数据帧索引相同的时间戳。
答案 0 :(得分:2)
您只需按索引拖放即可。这将通过索引1、2、3、4..etc..199删除df中的条目。
df.reset_index() #this will change the index from timestamp to 0,1,2...n-1
df.drop([1, 2, 3, 4, 34, 100, 154, 155, 199]) # will drop the rows
df.index = df['myTimeStamp'] # this will restore the index back to timestamp
答案 1 :(得分:1)
尝试:
df.drop(df.index[rm_indexes])
示例:
import pandas as pd
df = pd.DataFrame({"A":[0,1,2,3,4,5,6,7,8],
"B":[0,1,2,3,4,5,6,7,8],
"C":[0,1,2,3,4,5,6,7,8]})
pos = [0,2,4]
df.drop(df.index[pos], inplace=True)
输出
A B C
1 1 1 1
3 3 3 3
5 5 5 5
6 6 6 6
7 7 7 7
8 8 8 8
编辑,在OP提供进一步说明后:具有相同索引的多行
df = pd.DataFrame({"A":[0,1,2,3,4,5,6,7,8],
"B":[0,1,2,3,4,5,6,7,8],
"C":[0,1,2,3,4,5,6,7,8],},
index=["a","b","b","a","b","c","c","d","e"])
df['idx'] = df.index
pos = [1]
df.reset_index(drop=True, inplace=True)
df.drop(df.index[pos], inplace=True)
df.set_index('idx', inplace=True)
输出
A B C
idx
a 0 0 0
b 2 2 2
a 3 3 3
b 4 4 4
c 5 5 5
c 6 6 6
d 7 7 7
e 8 8 8