OpenRefine Multiply Header Rows

时间:2017-10-31 10:08:23

标签: openrefine

我有一个csv个文件,其中有一些数据存在多年。在数据提供者的最终智慧中,数据的结构实际上是多个标题行(每年一个)。

对于文件顶部的示例,我有:

All | 2004 | Team | Player then some other rows

然后,在2004年的所有数据之后,还有另一个标题行,如下所示:

All | 2005 | Team | Player

OpenRefine中有没有办法解决这个问题?

1 个答案:

答案 0 :(得分:3)

据我了解,您的数据是以这种方式构建的。

All,2004,Team,Player

1, data1,team1,Player1

2, data2,team2,Player2

3, data3,team3,Player3

All,2005,Team,Player

4, data4,team4,Player4

如果这是正确的,一种可能的解决方案是创建“年”列,然后删除标题。可以使用正则表达式^\d{4}$来隔离年份。

enter image description here