文件格式使其易于解析

时间:2014-07-24 07:57:07

标签: parsing python-2.7 file-format

我必须解析一些具有通用格式的文件并将数据转储到文件中。我想知道它的格式应该是什么,以便解析很容易。

文件格式及其解析机制应该是什么?

我设计了文件格式及其解析机制如下

user1.txt

24-07-2014
tag_1
some_data
tag_2
some_data
tag_3
some_data
end

31-07-2014
tag_1
some_data
tag_2
some_data
tag_3
some_data
end

每周都会使用某些数据更新这些文件

解析机制:

func()
    get index of date(passed as arg) and end(first occurence from after date)
    make a list out of it
    from this list take index of tag_1, tag_2, tag_3 and append data between tag_1 index and tag_2 index, tag_2 and tag_3, tag_3 and end in tag_1_data, tag_2_data, tag_3_data respectively

main()
    call func() for each file as argument to it.
    then dump data in list tag_1_data, tag_2_data & tag_3_data into a file

因此,从中生成的文件将包含来自所有归档文件的tag_1,tag_2,tag3的数据  seperately。

python script.py 24-07-2014

generated_file.txt

24-07-2014
tag_1
data from user1
data from user2
data from user3

tag_2
data from user1
data from user2
data from user3


tag_3
data from user1
data from user2
data from user3

注意* - 用其他脚本每周(在用户输入数据之前)使用该格式更新user1.txt,user2.txt等文件,以便用户只需编写数据(在每个标签)不是格式和数据

如果您知道更好的文件格式,这使得解析更容易,那么请发表评论。

0 个答案:

没有答案