从行分隔文件制作列

时间:2017-09-20 01:11:12

标签: openrefine

我刚开始在20分钟前学习openrefine。我有一个文本文件,其数据在每个数据块的开头由一致的标题(“JP”)分隔。数据块的行数并不完全相同。我希望原始数据的每个块都在openrefine中的1行。我怎么能这样做?

编辑:这是一个示例。这是一个相当混乱的文件,但我可以依靠每个不同条目开头的JP ..

JP  
0034  
1-25-60  
01  
checked 1/92  

I am so happy to have taken these. The brown envelopes, blah blah. roll 1: Is a retirement event [EW]  
JP  
0035  
2-1-60  
01  
checked 1/92  

Bill therapy  

JP  
0036  
2-11-60  
01  
Checked 1/92  

Bill: there are many  

EW: The bills look good.  

I remember Babies used to look like this everyday, with the staff coming and going, all nice and professional.  
JP  
0037  
2-11-60  
01  

checked 1/92  
BLAHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH. blah blah blah blah bal… 
 oops>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>  

again  

JP  
0039  
2-11-60  
01  
checked 1/92  

JP  
0041  
3-14-60  

1 个答案:

答案 0 :(得分:0)

以下是解决方案的示例。

1通过选择"基于行的文本"在Open Refine中打开文本。选项并取消选中"存储空白行"复选框;

在项目的单个列中

2,使用文本过滤器隔离包含单词" JP";

的行

3根据此筛选列创建一个新列并将其移至开头;

4删除第一个中的单词JP(Transform - > null);

5使用"加入多值单元格"在原始列上指定空格作为分隔符。

通过截屏视频,所有这些内容都会更加清晰。

enter image description here