标签: openrefine
我有一个csv个文件,其中有一些数据存在多年。在数据提供者的最终智慧中,数据的结构实际上是多个标题行(每年一个)。
csv
对于文件顶部的示例,我有:
All | 2004 | Team | Player then some other rows
然后,在2004年的所有数据之后,还有另一个标题行,如下所示:
All | 2005 | Team | Player
OpenRefine中有没有办法解决这个问题?
OpenRefine
答案 0 :(得分:3)
据我了解,您的数据是以这种方式构建的。
All,2004,Team,Player 1, data1,team1,Player1 2, data2,team2,Player2 3, data3,team3,Player3 All,2005,Team,Player 4, data4,team4,Player4
如果这是正确的,一种可能的解决方案是创建“年”列,然后删除标题。可以使用正则表达式^\d{4}$来隔离年份。
^\d{4}$