我有一个超过2000个元素的DataFrame,我必须将一个函数应用于DF,每个元素花费1-3秒,如果该函数不能应用于其中一个元素,它会瘫痪,我必须停止执行,所有用于计算其他有效值的资源都会被滥用。该功能很重,因为它进入网站并且可以部分被阻止。
因此,这种想法是将函数以这种方式应用于数据帧的不同部分,并且在某个段失败的情况下,它将为我提供一些输出值,而不会失去所有完成的工作。 / p>
df_read['ratio_image'] = df_read.apply(lambda row: fir.CompareImages(
row['seller_image'], row['supplier_image_url']).main_process_ssim(), axis=1)
这就是我应用该功能的方式,它适用于小型数据框