我正在寻找一行GREP或FINDSTR脚本,它将扫描一个包含4列CSV文件的文件夹并仅提取URL并将其输出到文本文件中,每行一个URL。网址格式为" http://example.com/"我一直在玩这个剧本,但我似乎无法输出任何东西
cat filename | grep http | grep -shoP 'http.*?[" >]' > outfilename
答案 0 :(得分:0)
你可以尝试这个:
find BASEDIR -type f -exec grep -oP "\bhttp://[^/]*/" {} \; > OUTFILE
不需要BASEDIR下的文件是CSV文件。
修改强>
如果您想要完整的网址(不是格式为' http://example.com/'而是' http://example.com/path')并假设CSV分隔符为&# 39 ;;',然后
find BASEDIR -type f -exec grep -oP "\bhttp://[^;]*" {} \; > OUTFILE