加快DataFrame的“处于”状态

时间:2019-04-10 08:30:15

标签: python dataframe indexing

给出一个DataFrame,如果它不在DF中,我想添加一行。

if state not in df.index:
    # append new state DataFrame
    df = df.append(pd.Series([0] * len(self.actions), index=df.columns, name=state))

state是一个类似[0 1 12 36 67 0 14 5 6 4]的字符串(10个条目的列表,以字符串形式移交)。

对于添加的前几行,平均大约需要0.0045秒。拥有10.000+行已经大大降低了速度,大约为0.0623秒,而拥有100.000+行则变成了0.1364秒...

有什么方法可以加快检查索引是否已经存在?我是python的新手,但是也许有一种方法可以将索引保留在RAM中并检查其中是否有更好的性能?也许对索引进行哈希处理可以加快索引的速度,或者结合使用这些索引?

任何提示都非常感谢!

0 个答案:

没有答案