如何在python中对熊猫数据框的每一行进行计算?

时间:2018-07-19 19:04:20

标签: python pandas for-loop

我是python的新手,我正在尝试将我在R中创建的函数转换为Python,此处描述了R函数:

How to optimize this process?

从我的阅读看来,在python中执行此操作的最佳方法似乎是使用将采用以下形式的for循环

for line 1 in probe test
 find user in U_lookup
 find movie in M_lookup
 take the value found in U_lookup and retrieve that line number from knn_text
 take the values found in that row of knn_text, and retrieve the line numbers from dfm
 for those line numbers in dfm, retrieve column=U_lookup
 take the average of the non zero values found
 save value into pandas datafame in new column for that line

这是完成这样的操作的最有效的方式(就计算速度而言)吗?来自R,所以我不确定pandas软件包中是否有类似功能的更好功能。

作为后续,在python中是否有与R中的dput()函数等效的函数? dput本质上提供了用于轻松共享诸如此类问题的数据子集的代码。

1 个答案:

答案 0 :(得分:2)

您可以使用df.apply(my_func, axis=1)将函数/计算应用于数据框的每一行。 在哪里,my_func将包含所需的计算