我目前正在尝试创建一个表,该表给出一种电影的单幅表示形式以及描述它们的关键字。
这是我拥有的数据:
movie_id title INFO
0 Avatar [sam_worthington, zoe_saldana','future',...]
1 Specter [daniel_craig, christoph_waltz, sam_mendes,...]
...
sam_worthington zoe_saldana james_cameron ... culture_clash
Avatar 0.0 0.0 0.0 ... 0.0
Pirates
of the 0.0 0.0 0.0 ... 0.0
Caribbean:
At World's
End
Spectre 0.0 0.0 0.0 ... 0.0
...
The Dark
Knight
Rises 0.0 0.0 0.0 ... 0.0
我的目标是在DataFrame中用1填充,其中某个电影由某个关键字描述。像这样(如果关键字与该电影不匹配,则忽略;突出显示是出于演示目的):
sam_worthington zoe_saldana james_cameron ... culture_clash
Avatar 1 1 1 ... 0.0
Pirates
of the 0.0 0.0 0.0 ... 1
Caribbean:
At World's
End
Spectre 0.0 0.0 1 ... 0.0
...
The Dark
Knight
Rises 0.0 1 0.0 ... 0.0
我已经根据我在网上找到的一些代码尝试了此操作,但是它不起作用:
for index, value in data['MOVIEINFO'].iteritems():
for token in value:
basket.loc[index][token]= 1
这可能没有多大意义(请记住,我是个新手)。有谁知道我该怎么做?
谢谢您的时间!