如何从openrefine的单元格中删除URL链接?

时间:2018-07-29 23:07:47

标签: openrefine

如何通过openrefine删除文本中的所有URL?是否有任何转换代码?我的数据在文本中有许多彼此不同的URL链接。我想删除这些链接。

例如,我的数据在单元格中具有类似的文字

“换行符在段落之间的输入返回在末段斜体粗体缩进代码前添加2个空格,并在开始处放置>,以4个空格反引号like _so_ http://foo.com/

我只想删除单元格中的URL链接。取出后应; “换行符在段落之间的返回返回值在斜体粗体缩进代码的末尾添加2个空格,并以4个空格反引号like _so_引号,并在行首添加> “

1 个答案:

答案 0 :(得分:0)

此转换应该可以解决问题:

value.replace(/(http:\/\/www\.|https:\/\/www\.|http:\/\/|https:\/\/)?[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(:[0-9]{1,5})?(\/.*)?/, '')