我使用python和django来制作基于Web的应用程序。我使用mongodb作为后端数据库。我有一个名为MongoConnection的基类,它使用pymongo层与mongodb进行通信。我对这个层非常好,因为它为我分离了业务层的数据库。我的自定义MongoConnenction类如下: -
#!/usr/bin/env python
# encoding: utf-8
# Create your views here.
from pymongo import MongoClient
import pymongo
from pymongo import Connection
import json
from bson import BSON
from bson import json_util
class MongoConnection():
def __init__ (self, host="localhost",port=27017, db_name='indexer', conn_type="local", username='', password=''):
self.host = host
self.port = port
self.conn = Connection(self.host, self.port)
self.db = self.conn[db_name]
self.db.authenticate(username, password)
def ensure_index(self, table_name, index=None):
self.db[table_name].ensure_index([(index,pymongo.GEOSPHERE)])
def create_table(self, table_name, index=None):
self.db[table_name].create_index( [(index, pymongo.DESCENDING)] )
def get_one(self,table_name,conditions={}):
single_doc = self.db[table_name].find_one(conditions)
json_doc = json.dumps(single_doc,default=json_util.default)
json_doc = json_doc.replace("$oid", "id")
json_doc = json_doc.replace("_id", "uid")
return json.loads(json_doc)
def get_all(self,table_name,conditions={}, sort_index ='_id', limit=100):
all_doc = self.db[table_name].find(conditions).sort(sort_index, pymongo.DESCENDING).limit(limit)
json_doc = json.dumps(list(all_doc),default=json_util.default)
json_doc = json_doc.replace("$oid", "id")
json_doc = json_doc.replace("_id", "uid")
return json.loads(str(json_doc))
def insert_one(self, table_name, value):
self.db[table_name].insert(value)
def update_push(self, table_name, where, what):
#print where, what
self.db[table_name].update(where,{"$push":what},upsert=False)
def update(self, table_name, where, what):
#print where, what
self.db[table_name].update(where,{"$set":what},upsert=False)
def update_multi(self, table_name, where, what):
self.db[table_name].update(where,{"$set":what},upsert=False, multi=True)
def update_upsert(self, table_name, where, what):
self.db[table_name].update(where,{"$set":what},upsert=True)
def map_reduce(self, table_name, mapper, reducer, query, result_table_name):
myresult = self.db[table_name].map_reduce(mapper, reducer, result_table_name, query)
return myresult
def map_reduce_search(self, table_name, mapper, reducer,query, sort_by, sort = -1, limit = 20):
if sort_by == "distance":
sort_direction = pymongo.ASCENDING
else:
sort_direction = pymongo.DESCENDING
myresult = self.db[table_name].map_reduce(mapper,reducer,'results', query)
results = self.db['results'].find().sort("value."+sort_by, sort_direction).limit(limit)
json_doc = json.dumps(list(results),default=json_util.default)
json_doc = json_doc.replace("$oid", "id")
json_doc = json_doc.replace("_id", "uid")
return json.loads(str(json_doc))
def aggregrate_all(self,table_name,conditions={}):
all_doc = self.db[table_name].aggregate(conditions)['result']
json_doc = json.dumps(list(all_doc),default=json_util.default)
json_doc = json_doc.replace("$oid", "id")
json_doc = json_doc.replace("_id", "uid")
return json.loads(str(json_doc))
def group(self,table_name,key, condition, initial, reducer):
all_doc = self.db[table_name].group(key=key, condition=condition, initial=initial, reduce=reducer)
json_doc = json.dumps(list(all_doc),default=json_util.default)
json_doc = json_doc.replace("$oid", "id")
json_doc = json_doc.replace("_id", "uid")
return json.loads(str(json_doc))
def get_distinct(self,table_name, distinct_val, query):
all_doc = self.db[table_name].find(query).distinct(distinct_val)
count = len(all_doc)
parameter = {}
parameter['count'] = count
parameter['results'] = all_doc
return parameter
def get_all_vals(self,table_name,conditions={}, sort_index ='_id'):
all_doc = self.db[table_name].find(conditions).sort(sort_index, pymongo.DESCENDING)
json_doc = json.dumps(list(all_doc),default=json_util.default)
json_doc = json_doc.replace("$oid", "id")
json_doc = json_doc.replace("_id", "uid")
return json.loads(json_doc)
def get_paginated_values(self, table_name, conditions ={}, sort_index ='_id', pageNumber = 1):
all_doc = self.db[table_name].find(conditions).sort(sort_index, pymongo.DESCENDING).skip((pageNumber-1)*15).limit(15)
json_doc = json.dumps(list(all_doc),default=json_util.default)
json_doc = json_doc.replace("$oid", "id")
json_doc = json_doc.replace("_id", "uid")
return json.loads(json_doc)
def get_count(self, table_name,conditions={}, sort_index='_id'):
count = self.db[table_name].find(conditions).count()
return count
现在,问题是我的moongodb使用了大量的处理能力和RAM。通常它消耗大约80-90%的CPU。
我怀疑每次创建这个类的实例时我都没有关闭mongoconnection。我是否需要在mongodb中手动关闭连接?
答案 0 :(得分:8)
没有必要关闭Connection
实例,它会在Python垃圾收集后自行清理。
您应该使用MongoClient
代替Connection
;不推荐使用Connection
。要利用连接池,您可以创建一个MongoClient
,持续整个过程。
PyMongo将文档表示为dicts。你为什么编码它给你的每个字典作为JSON,然后再解码?直接修改对象可能更有效。
那就是说,我同意user3683180的说法,真正的问题 - MongoDB占用如此多CPU的原因 - 在你的架构或索引设计中,而不是在你的Python代码中。
答案 1 :(得分:5)
根据您的数据库名称' indexer'以及' unique'需要索引的属性,我认为您的CPU使用率可能与此代码无关。
尝试使用mongostat和mongotop来看看mongo正在花时间做些什么......我以为你会发现它花时间处理数据并且你的代码很好。