MongoDB中的区别在于密钥名称中的空格

时间:2016-05-19 04:09:05

标签: python mongodb pymongo mongodb-aggregation

我有一个具有以下结构的集合:

{'cnpj_fundo': '08.807.621/0001-93',
 'pl_posicao': 'R$ 8.654.202,31',
 'posicao': [{'empresa_ligada': 'Não',
   'quantidade_vendas': '',
   'detalhes': "{'Tipo de Ativo:': ['Fundo de Investimento e de Cotas'], 'Fundo:': ['BTGP ACCESS SELECTION FUNDO DE INVESTIMENTO EM COTAS DE FUNDOS DE INVESTIMENTO MULTIMERCADO'], 'Tipo de Aplicação:': ['Cotas de Fundos'], 'CNPJ:': ['05.892.577/0001-79']}",
   'categoria': '',
   'valor_vendas': '',
   'perc_carteira': '99,76',
   'quantidade_compras': '',
   'posicao_final': '8.633.395,56',
   'classificacao': '',
   'valor_custos ': '',
   'link': 'CDADetAplic.aspx?PkCDAAplic=7234077',
   'valor_compras': '4.657.681'},
  {'empresa_ligada': 'Não',
   'quantidade_vendas': '',
   'detalhes': "{'Tipo de Ativo:': ['Fundo de Investimento e de Cotas'], 'Fundo:': ['BTG PACTUAL YIELD DI FUNDO DE INVESTIMENTO REFERENCIADO CRÉDITO PRIVADO'], 'Tipo de Aplicação:': ['Cotas de Fundos'], 'CNPJ:': ['00.840.011/0001-80']}",
   'categoria': '',
   'valor_vendas': '',
   'perc_carteira': '0,235',
   'quantidade_compras': '',
   'posicao_final': '20.315,84',
   'classificacao': '',
   'valor_custos ': '',
   'link': 'CDADetAplic.aspx?PkCDAAplic=7234076',
   'valor_compras': '2.059'},
  {'empresa_ligada': '',
   'quantidade_vendas': '',
   'detalhes': "{'Tipo de Ativo:': ['Outros'], 'Descrição:': ['VALORES A RECEBER'], 'Tipo de Aplicação:': ['Valores a receber']}",
   'categoria': ' VALORES A RECEBER',
   'valor_vendas': '',
   'perc_carteira': '0,006',
   'quantidade_compras': '',
   'posicao_final': '490,91',
   'classificacao': 'Paranegociação',
   'valor_custos ': '',
   'link': 'CDADetAplic.aspx?PkCDAAplic=7234078',
   'valor_compras': ''}],
 'nome_fundo': 'FUNDO DE INVESTIMENTO MULTIMERCADO CRÃ\x89DITO PRIVADO BOA ESPERANÃ\x87A - INVESTIMENTO NO EXTERIOR',
 'data_carteira': '10/2007',
 '_id': ObjectId('573d22f7a5c5da185c67fbd7')}

如何获得“Tipo de Ativo:”的“不同”值?

db.distinct("posicao.detalhes.Tipo de Ativo:")

不起作用。

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

首先,您的记录存在问题。 'detalhes'的值不是BSON,它们是字符串(JSON),但这使得查询更加困难。

所以你需要先去改变你的记录。在Python中,您可以使用:

import json
updated_value = json.loads(value_of_detalhes)
db.update( ... {"$set": {"detalhes": updated_value}})

修改JSON格式化字符串后,您可以使用聚合框架查找不同的值。这是一个例子:

> db.foo.find()
{ "_id" : ObjectId("573...94"), "p" : [ { "d" : { "tda" : [ "y" ] } } ] }
{ "_id" : ObjectId("573...95"), "p" : [ { "d" : { "tda" : [ "x" ] } } ] } 

请注意我的虚拟记录与您的记录具有相似的结构。它们的不同之处在于d的值为BSON。与d并行的detalhes与您的> db.foo.aggregate([{$group: {_id: "$p.d.tda"}}]) { "_id" : [ [ "x" ] ] } { "_id" : [ [ "y" ] ] } 平行。将JSON修改为BSON后,您可以执行以下操作:

tda

因此您发现嵌入字段SELECT DISTINCT p.PONumber, p.POdate, p.customername, p.[description], SUM(q.deliveryqty) FROM tb_po p INNER JOIN tb_spb q ON p.PONumber = q.PONumber AND p.description = q.description GROUP BY p.PONumber,p.POdate,p.customername,p.[description] 有两个不同的值。

我的代码片段是JS(使用mongo shell),但Python的原理保持不变。