我有一个json文件,其中包含以下格式的一些信息:
{ "_id" : ObjectId("xxx"), "date_time" : ISODate("2014-06-11T19:16:45Z"), "name" : "AAA", "phone_no" : "111", "address" : "BBB", "categories" : "CCC" }
{ "_id" : ObjectId("yyy"), "date_time" : ISODate("2014-06-11T19:16:44Z"), "name" : "EEE", "phone_no" : "222", "address" : "FFF", "categories" : "GGG" }
{ "_id" : ObjectId("zzz"), "date_time" : ISODate("2014-06-11T19:16:46Z"), "name" : "HHH", "phone_no" : "333", "address" : "III", "categories" : "JJJ" }
我使用的代码是:
db = pymongo.MongoClient().test
path ='/home/files'
for f in listdir(path):
filepath = path+'/'+f
data = []
for line in open(filepath):
try:
data.append(json.loads(line))
except:
pass
db.temp.insert(data)
这会导致错误,指出无法进行空批量写入。基本上,json.loads(line)
永远不会奏效。这是json文件的格式问题吗?应该变量'数据'以其他方式宣布?
如何将此文件加载到 mongoDB ?
答案 0 :(得分:-2)
json不知道ObjectID是什么或ISODate ...它只能处理简单的类型...如果您为这些clases定义了序列化规则,您可以尝试使用yaml加载数据...或者您可以只是在行中使用简单的字符串。
for line in open(filepath):
line = re.sub("[a-zA-Z_]+\(([^)]+)\)","\\1",line)
print json.loads(line)
... #do your thing
这将删除类调用 转换
{ "_id" : ObjectId("xxx"), "date_time" : ISODate("2014-06-11T19:16:45Z"), "name" : "AAA", "phone_no" : "111", "address" : "BBB", "categories" : "CCC" }
到
{ "_id":"xxx", "date_time" : "2014-06-11T19:16:45Z", "name" : "AAA", "phone_no" : "111", "address" : "BBB", "categories" : "CCC" }
然后您应该能够使用json加载