OpenRefine拆分多值单元格中的字符

时间:2016-11-18 04:39:28

标签: openrefine

我是使用OpenRefine的新手,我无法弄清楚如何在单元格中的每个字符上拆分多值单元格。例如,我无法拆分具有值的单元格" mod"分为三行:一行带有" m"一行用" o",一张用" d"。

当数据存在分隔符时(例如," m,o,d"),分割很容易。但是,我处理了很多牙科数据,其中一个细胞中有一个牙齿编号(例如," 3"),牙齿表面表示为一个字符串(例如," mod&# 34)。在这种情况下," m"用于牙齿的近中表面," o"用于牙齿的咬合面," d"用于牙齿的远端表面。

在python中,我知道我可以使用list()获得单独的字符;例如,list(" mod")返回[" m"," o"," d"]。我可以在OpenRefine中做这样的事情吗?

1 个答案:

答案 0 :(得分:3)

我认为在OpenRefine中执行此操作的最简单方法是:

value.split(//)

在'split'函数中使用空正则表达式将字符串拆分为单个字符