嗨,所以我试图用PyMongo为名为term的变量创建一个哈希索引。最初(在我尝试使用哈希索引之前)我写过:
mycol.update_one({"token":term}, {"$set": {p: {"doc": doc_id, "freq": freq}}}, True)
这完全符合我的要求,只是花了太长时间(几天才完成)。我读到使用散列索引可以大大提高速度,但是我在弄清楚如何正确创建索引方面遇到了麻烦。我以为我必须做
mycol.create_index({"token":"hashed"}, {"$set": {p: {"doc": doc_id, "freq": freq}}})
,但是然后我不确定如何使令牌真正包含要插入到该信息中的术语。
任何帮助将不胜感激。