带有斜杠和文件路径的正则表达式

时间:2013-01-31 07:12:11

标签: regex bash parsing logging

想要解析一些日志,有点难。 日志看起来像这样:

/ajax/foto.php?whatever-session-info-here
/edit.php?path=blahblah-imgage-url.jpg
/catalog/whetaever-text-here
/item/whetaever-text-here
/gallery (without slash at the end)

所以

  

/ [A-ZA-Z - ] {0,} /

适用于斜杠之间的文本,我有

/catalog/
/item/
在正则表达式工作之后

所以问题是如何获得这个示例的输出,如下所示:

/ajax/foto.php
/edit.php
/catalog/
/item/
/gallery

添加: 发现这个,只需要前两个斜杠的文字:

/foto/300/b/5/4/19123312.jpg

获取/ foto /

2 个答案:

答案 0 :(得分:0)

/ [A-ZA-Z]的(/?)([A-ZA-Z] [A-ZA-Z] *)?

经过测试

http://gskinner.com/RegExr/

答案 1 :(得分:0)

  s = '/foto/300/b/5/4/19123312.jpg'
    s.split('/')[1]
     => "foto"