Question

我有一个包含大约数千行的文件。每行的格式如下：

02:17:15.204    1.217   890 322 GET 200 text/html   http://stage.youbeauty.com/body-fitness/galleries/gluten-free-bodycare
02:17:16.530    0.304   313 (7592)  GET (Cache) text/javascript http://use.typekit.com/lqi6pyj.js
02:17:16.534    0.769   463 (8631)  GET 304 text/css    http://stage.assets0.youbeauty.com/rel-20120404171521/assets/vendor.css
02:17:16.537    1.514   419 32963   GET 200 text/css    http://stage.assets0.youbeauty.com/rel-20120404171521/assets/application1.css

我希望在NOtepad ++中使用“查找和替换”功能来获取URL。

（如果我们使用像java脚本这样的任何脚本也没关系）

Answer 1

使用正则表达式选项和此搜索词：

http.*

这将选择从http到行尾的所有内容。

如果要删除除每行上的URL之外的所有内容，请使用：

Find what: .*(http.*)
Replace with: \1

Answer 2

我写了一个python脚本。这是http://ideone.com/TkK5e。希望它有所帮助。

查找和替换以跟踪Notepad ++中的URL

2 个答案: