单词之间的额外空白

时间:2015-10-02 20:59:34

标签: openrefine

请帮助我解决有关如何执行GREL表达式的2个问题:

  1. 如果一列中的两个单词之间有双重空格,我怎么能消除1个空格例如:罗伯特 - 史密斯到罗伯特 - 史密斯减号字符等于空白图示

  2. 如何在文本过滤器中查找确切的单词。

  3. 谢谢!

3 个答案:

答案 0 :(得分:2)

1°)尝试变换---> value.replace(“”,“”)

或者,简单的常见变换---->崩溃连续的白色空间

2°)柱--->文本过滤并输入单词

或者,做列--->面--->海关方面和类型:value.contains(“you_word”) 或value.contains(/(yourexactword)/) 这将返回一个真或假的方面

小时。

答案 1 :(得分:0)

@hpiedcoq是正确的答案,如果您需要在GREL中使用它们。如果没有,你可以使用点击界面:

对于第一个问题:选择您的列并选择编辑单元格&gt; <常见变换>折叠连续的空格

第二个问题:选择你的专栏&gt;文本过滤器&gt;进入你正在寻找的工作。如果要在搜索中考虑大小写,可以选择区分大小写。

答案 2 :(得分:0)

1.1转换 - &gt; value.replace(" "," ") 删除所有双空格。

1.2转换 - &gt; value.trim() 删除所有双空格并删除字符串前后的空格。

1.3转换 - &gt; value.replace(/\b \b/," ")    用正则表达式替换,只删除两个单词之间的双空格。

  1. 文字过滤器&gt;打开正则表达式并使用\b。 带有正则表达式的文本过滤器:\bWord\b =精确单词,单词之前和之后可能是也可能不是空格。