假设我有一个网址,例如......
http://www.example.com/ 的随机垃圾这里-I-不要想学12392的 /视频 2983439
是否有一个程序,我可以把这个测试字符串放入,突出显示/选择我想要保留的部分,然后摆脱其余部分并将其转换为正则表达式使用?我只是无法弄清楚我的生活中的正则表达式。
我正在尝试在网站上抓取网址,但除了一些一致的特征外,它们都是唯一的。一致的特征在上面以粗体突出显示我想要保留,而忽略所有非粗体...当我抓取网站时,它将遵循类似于粗体部分的URL。
答案 0 :(得分:1)
以下代码在TCL中为我工作
% regexp -- {http://www.example.com/[a-zA-Z0-9-]*/video[0-9]*} http://www.example.com/random-garbage-here-i-dont-want-1
2392/video2983439
1
%