需要从CSV文件中提取URL - 仅限GREP或FINDSTR

时间:2014-09-19 15:12:09

标签: bash csv grep findstr

我正在寻找一行GREP或FINDSTR脚本,它将扫描一个包含4列CSV文件的文件夹并仅提取URL并将其输出到文本文件中,每行一个URL。网址格式为" http://example.com/"我一直在玩这个剧本,但我似乎无法输出任何东西

cat filename | grep http | grep -shoP 'http.*?[" >]' > outfilename

1 个答案:

答案 0 :(得分:0)

你可以尝试这个:

find BASEDIR -type f -exec grep -oP "\bhttp://[^/]*/" {} \; > OUTFILE

不需要BASEDIR下的文件是CSV文件。

修改

如果您想要完整的网址(不是格式为' http://example.com/'而是' http://example.com/path')并假设CSV分隔符为&# 39 ;;',然后

find BASEDIR -type f -exec grep -oP "\bhttp://[^;]*" {} \; > OUTFILE