给出一个DataFrame,如果它不在DF中,我想添加一行。
if state not in df.index:
# append new state DataFrame
df = df.append(pd.Series([0] * len(self.actions), index=df.columns, name=state))
state
是一个类似[0 1 12 36 67 0 14 5 6 4]
的字符串(10个条目的列表,以字符串形式移交)。
对于添加的前几行,平均大约需要0.0045秒。拥有10.000+行已经大大降低了速度,大约为0.0623秒,而拥有100.000+行则变成了0.1364秒...
有什么方法可以加快检查索引是否已经存在?我是python的新手,但是也许有一种方法可以将索引保留在RAM中并检查其中是否有更好的性能?也许对索引进行哈希处理可以加快索引的速度,或者结合使用这些索引?
任何提示都非常感谢!