如何在.bson文件中导入数据

时间:2016-11-15 02:39:54

标签: json import load stata bson

我想导入此处的数据:https://thecodebarbarian.wordpress.com/2014/02/14/crunching-30-years-of-nba-data-with-mongodb-aggregation/(您可以在结论部分的底部下载数据)。

数据有两个文件。首先,名为games.metadata.json的文件。完整的内容在这里:

{ "indexes" : [ { "v" : 1, "key" : { "_id" : 1 }, "ns" : "nba.games", "name" : "_id_" } ] }

另一个文件名为games.bson

此文件的示例是:

@_idRÚüë›ΩuT
∫mÆboxd0´
players»    0‡ast   blkdrbfgfg3fg3_pctfg3afg_pct.533fgaftft_pct.750ftamp41:00orbpfplayerJeff Rulandptsstltovtrb1„astblkdrbfg    fg3fg3_pctfg3afg_pct.643fgaftft_pct.667ftamp36:00orbpfplayerCliff Robinsonptsstltovtrb2Êastblkdrbfgfg3fg3_pct.000fg3afg_pct.571fgaftft_pct1.000ftamp30:00orbpfplayer
Gus Williamsptsstltovtrb3‡astblkdrbfgfg3fg3_pctfg3afg_pct.533fgaftft_pct.667ftamp30:00orbpfplayerJeff Maloneptsstltovtrb4„astblkdrbfgfg3fg3_pctfg3afg_pct.250fgaftft_pct1.000ftamp25:00orbpfplayerCharles Jonesptsstltovtrb5„astblkdrbfgfg3fg3_pctfg3afg_pct.000fgaftft_pct.500ftamp26:00orbpfplayerDan Roundfieldptsstltovtrb6‡astblkdrbfgfg3fg3_pctfg3afg_pct.750fgaftft_pct1.000ftamp20:00orbpf

有关如何将其纳入Stata的任何提示?

1 个答案:

答案 0 :(得分:0)

我担心你必须遵循几个步骤

  1. 将您的数据从bson转换为csv
  2. 导出csv
  3. 在Stata中加载csv
  4. 做你的东西
  5. 根据我的经验insheetjson(Dimitri的好建议)对于中型数据集来说非常慢。