作为硕士论文的一部分,我试图运用一些统计数据来确定哪些因素会影响众筹活动是否获得资助。我一直试图从最大的平台Kickstarter.com获取数据。不幸的是,他们已经从他们的网站上删除了所有未成功的广告系列(除非您有直接链接)。
幸运的是,我并不是唯一一个寻找这些数据的人。 Webrobots.io有一个刮刀机器人,可以抓取所有Kickstarter项目并以JSON格式(http://webrobots.io/kickstarter-datasets/)收集数据。
最新数据集可在以下位置找到: http://webrobots.io/wp-content/uploads/2015/10/Kickstarter_2015-10-22.json_.zip
但是,我的编程技巧有限,而且我不知道如何将其转换为excel文件,我可以在其中操作数据并运行我的分析。我发现了一些在线转换器,但文件太大了(约300 mb)。 有人可以帮我转换文件吗?
它将在我的硕士论文发表时获得你的认可:)
提前致谢!!!
答案 0 :(得分:0)
我想这个问题的答案在很多方面都有很大差异。
关于问题3,我查看了JSON文件,它包含分层数据,这很难在平面文件中复制,即Excel或CSV文件(我应该知道,我们必须这么做在我以前的工作中。)
但是,我会看看以下行动计划,以实现您的目标:
完成后,您将获得所需的数据。 根据您希望从JSON文件中获取哪些数据,步骤2 可能是最困难的部分,因为您需要进入数据层次结构的不同级别。
希望这能指出你正确的方向吗?
答案 1 :(得分:0)
您可能需要查看此博客。
他使用Alteryx的流程,可以与你想要做的事情对齐。我希望做类似的事情,但尚未尝试过。如果我开始工作,我会更新这个答案。