哪一个是最好的CSV或JSON才能导入大数据(PHP)

时间:2014-10-02 08:05:39

标签: php json performance csv

我试图获取大量数据(约3M行),我只有两种选择。

  1. 调用API然后恢复3M JSON对象。
  2. 导入包含3M行的CSV文件。
  3. 我还没有测试过任何一种这样的解决方案,而是告诉哪一种解决方案速度最快。

1 个答案:

答案 0 :(得分:16)

如果您要将简单数据检索为列表或带有某些列的行,则选项#2是好选项,您可以在下面阅读一组优点和缺点:

<强>赞成

    需要
  • 更少的带宽,因为json需要更多的语法字符来保持格式,而csv就像使用字符分隔符一样简单
  • 流程数据更快,因为只需要按分隔符分割,而JSON需要解释语法
  • 大数据技术 Hadoop具有CSV格式的集成解析,同时需要一个特定的函数来解析Json(例如使用Hive语言)。

<强>缺点

  • 非结构化数据,更难以被人类阅读
  • 您必须注意分隔符不能出现在数据字段中。

如果数据包含复杂数据作为tupla,则数组和结构JSON更好,因为:

  • 保持清晰且结构化格式
  • 不重复数据引用它,因为一个标签可能包含多个数据。