好吧,我有很多推文。我会计算每条推文的极性,然后更新集合中添加此极性分数的文档。 因此,
1。获取所有没有字段'极性的推文ID
2. 在python中计算极性
3。使用新字段(极性)更新每条推文
我正在使用pymongo链接我的收藏,我会避免循环(耗时)更新推文。因此,我会在同一时间探索解决方案更新几条推文。我已经阅读了一些文档,我已经找到了两种方法:
首先,查询:
db.update({},{},multi=True)
但我无法在此查询中进行计算,我需要在此查询之外计算极性,然后此查询似乎没用。 另一种方式是批量查询。 Pymongo包含此查询,但我无法处理KeyID重复问题..