我有2个数据框,分别是适合的和适合的。它们只有一个相似的列“ CATAID”。拟合数据框包含有关整个实验的信息。但是,大规模实验仅包含一小部分实验。
对于我的工作,我需要适合的DataFrame中的信息,但需要大量Dataframe中的“ CATAID”值。我需要遍历适合的列值,并选择与质量中的CATAID值匹配的行。
我正在使用以下循环,
pathlib
我唯一关心的是此循环花费的时间。我想知道是否有人对如何改善此循环有任何建议?
答案 0 :(得分:0)
您可以先在海量数据框中获取ID
mass_id = mass_df['CATAID'].unique().tolist()
然后,您可以从CATAID位于mass_id内的主数据框中获取行:
relevant_df = fit_df.loc[fit_df['CATAID'].isin(mass_id)]
我不认为合并在这里像Prune注释一样起作用,因为我们没有试图合并这两个数据框。我们只是试图从一个数据帧中提取ID,并获取与这些ID相匹配的行。