我有一个包含大约数千行的文件。每行的格式如下:
02:17:15.204 1.217 890 322 GET 200 text/html http://stage.youbeauty.com/body-fitness/galleries/gluten-free-bodycare
02:17:16.530 0.304 313 (7592) GET (Cache) text/javascript http://use.typekit.com/lqi6pyj.js
02:17:16.534 0.769 463 (8631) GET 304 text/css http://stage.assets0.youbeauty.com/rel-20120404171521/assets/vendor.css
02:17:16.537 1.514 419 32963 GET 200 text/css http://stage.assets0.youbeauty.com/rel-20120404171521/assets/application1.css
我希望在NOtepad ++中使用“查找和替换”功能来获取URL。
(如果我们使用像java脚本这样的任何脚本也没关系)
答案 0 :(得分:2)
使用正则表达式选项和此搜索词:
http.*
这将选择从http
到行尾的所有内容。
如果要删除除每行上的URL之外的所有内容,请使用:
Find what: .*(http.*)
Replace with: \1
答案 1 :(得分:2)
我写了一个python脚本。这是http://ideone.com/TkK5e。希望它有所帮助。