将大型JSON文件转换为XLS / CSV文件(Kickstarter广告系列)

时间:2015-11-29 15:25:56

标签: json excel csv

作为硕士论文的一部分,我试图运用一些统计数据来确定哪些因素会影响众筹活动是否获得资助。我一直试图从最大的平台Kickstarter.com获取数据。不幸的是,他们已经从他们的网站上删除了所有未成功的广告系列(除非您有直接链接)。

幸运的是,我并不是唯一一个寻找这些数据的人。 Webrobots.io有一个刮刀机器人,可以抓取所有Kickstarter项目并以JSON格式(http://webrobots.io/kickstarter-datasets/)收集数据。

最新数据集可在以下位置找到: http://webrobots.io/wp-content/uploads/2015/10/Kickstarter_2015-10-22.json_.zip

但是,我的编程技巧有限,而且我不知道如何将其转换为excel文件,我可以在其中操作数据并运行我的分析。我发现了一些在线转换器,但文件太大了(约300 mb)。 有人可以帮我转换文件吗?

它将在我的硕士论文发表时获得你的认可:)

提前致谢!!!

2 个答案:

答案 0 :(得分:0)

我想这个问题的答案在很多方面都有很大差异。

  1. 大师们的主题是什么? (主要是为了安抚许多人,他们可能会认为你希望人们为你做功课!这也许可以解释为什么线程已经被投票了)
  2. 你提到你的编程技巧是有限的......你有什么编程技巧?你会用什么语言来实现这个目标?请记住,即使使用完全编码的解决方案,如果它不是您所知的语言,您也可能无法编译它!
  3. 您希望从JSON文件中获得哪些信息?
  4. 关于问题3,我查看了JSON文件,它包含分层数据,这很难在平面文件中复制,即Excel或CSV文件(我应该知道,我们必须这么做在我以前的工作中。)

    但是,我会看看以下行动计划,以实现您的目标:

    1. 使用JSON解析器将数据序列化为类结构(Visual Studio可以为您创建类...请参阅此S / O线程 - How to show the "paste Json class" in visual studio 2012 when clicking on Paste Special?
    2. 一旦你有了内存中的对象,你就可以逐个遍历它们并选出你想要的数据并将它们附加到逗号分隔的字符串中(在C#中我使用StringBuilder)并写入数据行输出到磁盘上的文件。
    3. 完成后,您将获得所需的数据。 根据您希望从JSON文件中获取哪些数据,步骤2 可能是最困难的部分,因为您需要进入数据层次结构的不同级别。

      希望这能指出你正确的方向吗?

答案 1 :(得分:0)

您可能需要查看此博客。

http://jdunkerley.co.uk/2015/09/04/downloading-and-parsing-met-office-historic-station-data-with-alteryx/

他使用Alteryx的流程,可以与你想要做的事情对齐。我希望做类似的事情,但尚未尝试过。如果我开始工作,我会更新这个答案。