正则表达式从图像alt标签创建文件名

时间:2012-01-11 18:55:34

标签: regex

将此视为输入:

<IMG alt="Just do it." src="http://25.media.moo.com/moo_kjasdf0nd_500.jpg">

我如何得到输出:

Just-do-it.jpg

2 个答案:

答案 0 :(得分:1)

我认为正则表达式不是必需的。

以正确的方式解析字符串。

  1. 首先,剥离'&lt;','&gt;'和标签名称。
  2. 然后用空格分割剩余部分。
  3. 按'='拆分每个部分以获取属性名称和值。
  4. 然后找出属性名称为'alt'和'src'的那些,然后结合它们的值来获取文件名。

答案 1 :(得分:1)

这是一个使用Python的解决方案:

>>> import re
>>> input = '''<IMG alt="Just do it." src="http://25.media.moo.com/moo_kjasdf0nd_500.jpg">'''
>>> pattern =  '''.*alt="([^"]*).*src=".*([.][^.]+)"'''
>>> re.match(pattern,input).groups() 
('Just do it.', '.jpg')
>>>

我将把这些部件组装成一个练习:)