过去几个月,我在熊猫公司工作,我陷入一种无法在互联网上找到类似人来解决我的疑问的情况。
我有一个包含所有程序知识库的数据框,它仅用于阅读和咨询,如下所示:
pragma solidity ^0.4.17;
在使用上面的数据框进行一些处理之后,我得到了另一个数据框,如下所示:
userId movieId rating timestamp genres title
196 242 3 881250949 Comedy Kolya (1996)
22 377 1 878887116 Children|Comedy Heavyweights (1994)
305 451 3 886324817 Comedy|Musical|Romance Grease (1978)
6 86 3 883603013 Drama Remains of the Day, The (1993)
我想在第二个数据框中创建一个名为userId movieId cluster avg_rating
196 242 2 3.5
22 377 2 3.5
305 451 2 3.0
6 86 2 3.75
的新列,并将值分配给主数据库中的确切名称。
我知道通常使用title
函数来比较来自不同数据帧的数据,但是由于isin()
是最重要的,因此恐怕输出的顺序可能会影响结果。列在第二个数据框中,并且不能混淆。
结果将是这样的:
avg_rating
谢谢。