我必须解析一些具有通用格式的文件并将数据转储到文件中。我想知道它的格式应该是什么,以便解析很容易。
文件格式及其解析机制应该是什么?
我设计了文件格式及其解析机制如下
user1.txt
24-07-2014
tag_1
some_data
tag_2
some_data
tag_3
some_data
end
31-07-2014
tag_1
some_data
tag_2
some_data
tag_3
some_data
end
每周都会使用某些数据更新这些文件
解析机制:
func()
get index of date(passed as arg) and end(first occurence from after date)
make a list out of it
from this list take index of tag_1, tag_2, tag_3 and append data between tag_1 index and tag_2 index, tag_2 and tag_3, tag_3 and end in tag_1_data, tag_2_data, tag_3_data respectively
main()
call func() for each file as argument to it.
then dump data in list tag_1_data, tag_2_data & tag_3_data into a file
因此,从中生成的文件将包含来自所有归档文件的tag_1,tag_2,tag3的数据 seperately。
python script.py 24-07-2014generated_file.txt
24-07-2014
tag_1
data from user1
data from user2
data from user3
tag_2
data from user1
data from user2
data from user3
tag_3
data from user1
data from user2
data from user3
注意* - 用其他脚本每周(在用户输入数据之前)使用该格式更新user1.txt,user2.txt等文件,以便用户只需编写数据(在每个标签)不是格式和数据
如果您知道更好的文件格式,这使得解析更容易,那么请发表评论。