如果不重复,我会编写此脚本以将文档插入Mongodb
import tldextract
from pymongo import MongoClient
client = MongoClient()
db = client.my_domains
collection = db.domain
with open('inputcut.csv', 'r') as f:
for line in f:
ext = tldextract.extract(line)
domain = {"domain":ext.registered_domain}
collection.update(domain,{'upsert':True})
当我运行脚本时,没有域插入数据库。 如果域名尚未出现在mongodb中,我想插入一个域名。 如果域已经存在,我们不会插入它,我们会转到下一个...
提前感谢您的帮助。
答案 0 :(得分:0)
collection.update需要3个参数 - 查询,更新和选项。由于upsert应该在选项中,所以重写调用如下:
collection.update(domain, {$set: domain}, {'upsert':True})