我刚开始在20分钟前学习openrefine。我有一个文本文件,其数据在每个数据块的开头由一致的标题(“JP”)分隔。数据块的行数并不完全相同。我希望原始数据的每个块都在openrefine中的1行。我怎么能这样做?
编辑:这是一个示例。这是一个相当混乱的文件,但我可以依靠每个不同条目开头的JP ..
JP
0034
1-25-60
01
checked 1/92
I am so happy to have taken these. The brown envelopes, blah blah. roll 1: Is a retirement event [EW]
JP
0035
2-1-60
01
checked 1/92
Bill therapy
JP
0036
2-11-60
01
Checked 1/92
Bill: there are many
EW: The bills look good.
I remember Babies used to look like this everyday, with the staff coming and going, all nice and professional.
JP
0037
2-11-60
01
checked 1/92
BLAHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH. blah blah blah blah bal…
oops>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
again
JP
0039
2-11-60
01
checked 1/92
JP
0041
3-14-60