为DATABASE解析文本文件的最佳方法

时间:2014-12-30 08:19:11

标签: sql database parsing sorting

我有一个格式为

的文本文件
catid: xxxxx,
description: xxxxx,
category: xxxxxx,
platform: xxxxx,
stuff-i-don't-need: xxxxxx

catid: xxxxx,
description: xxxxx,
category: xxxxxx,
platform: xxxxx,
stuff-i-don't-need: xxxxxx


catid: xxxxx,<p>
description: xxxxx,<p>
category: xxxxxx,<p>
platform: xxxxx,<p>
stuff-i-don't-need: xxxxxx<p>

我需要以EASIEST和最有效的方式格式化为类似数据库CSV格式的文件。

所以它看起来像

cat id      description         category             platform
xxxxx       xxxxxxxx           xxxxxxxx              xxxxxxxx
xxxxx       xxxxxxxx           xxxxxxxx              xxxxxxxx
xxxxx       xxxxxxxx           xxxxxxxx              xxxxxxxx
我不需要的东西......好吧,我不需要的东西。

我想知道如何做到这一点....使用像SQL DATABASE导入器这样的软件, 或者至少是PHP。

提前感谢。

编辑*我需要知道用于解析文本文件以获得上述结果的最佳软件/语言。感谢

1 个答案:

答案 0 :(得分:0)

正如我从原始文件格式中看到的那样,它看起来或多或少是一个JSON对象数组

通过一些简单的tweek,您可以将文件转换为典型的JSON数组,如下所示:

[
  {
    catid: "xxxxx",
    description: "xxxxx",
    category: "xxxxxx",
    platform: "xxxxx",
    stuff-i-dont-need: "xxxxxx"
  },
  {
   catid: "xxxxx",
   description: "xxxxx",
   category: "xxxxxx",
   platform: "xxxxx",
   stuff-i-dont-need: "xxxxxx"
  }
]

我所做的更改如下:

  1. 包含双引号值
  2. 从标题中删除了特殊字符(即将“不要”改为“不要”)
  3. 包含花括号中的每条记录,通过查找和替换
  4. 可以使用任何编辑器轻松完成

    然后,您可以使用许多在线工具自动将JSON数组解析为CSV

    我尝试this one并且效果很好