如何通过openrefine删除文本中的所有URL?是否有任何转换代码?我的数据在文本中有许多彼此不同的URL链接。我想删除这些链接。
例如,我的数据在单元格中具有类似的文字
“换行符在段落之间的输入返回在末段斜体或粗体缩进代码前添加2个空格,并在开始处放置>,以4个空格反引号like _so_
到 http://foo.com/ ”
我只想删除单元格中的URL链接。取出后应;
“换行符在段落之间的返回返回值在斜体或粗体缩进代码的末尾添加2个空格,并以4个空格反引号like _so_
引号,并在行首添加> “
答案 0 :(得分:0)
此转换应该可以解决问题:
value.replace(/(http:\/\/www\.|https:\/\/www\.|http:\/\/|https:\/\/)?[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(:[0-9]{1,5})?(\/.*)?/, '')