重新格式化要导入到有理数据库的文件格式

时间:2017-11-01 10:35:23

标签: regex

我有一个文件格式为

的文件
    1021 set([1, 3, 4, 7, 34, 11, 44])
    1016 set([34, 37, 1, 63, 36])
    1016 set([34, 36])
    1016 set([34, 37, 1, 14, 28, 63, 36])

我需要最终得到一个只有括号中的数字的表。(所以我可以将表导入MySQL数据库) 所以我的最终输出看起来像这样:

1, 3, 4, 7, 34, 11, 44
34, 37, 1, 63, 36 , NULL , NULL
34, 36 , NULL,  NULL, NULL ,NULL ,NULL
34, 37, 1, 14, 28, 63, 36

我该如何做到这一点?

1 个答案:

答案 0 :(得分:1)

您可以使用notepad ++

在树形步骤中执行此操作
  1. 通过将\d{4} set\(\[替换为

  2. 来切换第一部分
  3. ])替换为])。请务必将“搜索模式”更改为正常或写入\]\)

  4. 通过替换

  5. 添加“NULL” 带有^(\d+)$

    $1, NULL, NULL, NULL, NULL, NULL, NULL 带有^([^,]+(?:,[^,]+){1})$

    $1, NULL, NULL, NULL, NULL, NULL

    ...

    带有^([^,]+(?:,[^,]+){4})$

    $1, NULL, NULL, NULL 带有^([^,]+(?:,[^,]+){5})$

    $1, NULL