程序可以轻松生成正则表达式?

时间:2012-02-19 07:52:51

标签: regex string url scrape

假设我有一个网址,例如......

http://www.example.com/ 的随机垃圾这里-I-不要想学12392的 /视频 2983439

是否有一个程序,我可以把这个测试字符串放入,突出显示/选择我想要保留的部分,然后摆脱其余部分并将其转换为正则表达式使用?我只是无法弄清楚我的生活中的正则表达式。

我正在尝试在网站上抓取网址,但除了一些一致的特征外,它们都是唯一的。一致的特征在上面以粗体突出显示我想要保留,而忽略所有非粗体...当我抓取网站时,它将遵循类似于粗体部分的URL。

1 个答案:

答案 0 :(得分:1)

以下代码在TCL中为我工作

%  regexp -- {http://www.example.com/[a-zA-Z0-9-]*/video[0-9]*} http://www.example.com/random-garbage-here-i-dont-want-1
2392/video2983439
1
%