preg_match( '/<title>(.*)<\/title>/',.....)
preg_match("/src=[\"']?([^\"']?.*(png|jpg|gif))[\"']?/i",....)
答案 0 :(得分:6)
第一种是从HTML title
标记中提取内容。
第二种是从HTML文档中提取图像'src
属性,但是非常不完美(它不会捕获以.jpeg
结尾或根本没有扩展名的图像资源的引用)
正则表达式not a good idea用于解析HTML!一个应该use a HTML parser instead。它们远非防火。
答案 1 :(得分:0)
1)匹配HTML页面标题的<title>
和</title>
之间的任何内容,因此针对<title>foo</title>
运行会导致匹配为foo
。
2)匹配以src=
,png
或jpg
结尾的gif
后面的任何字符串。用于以HTML代码提取图像的URL。
Per @Pekka的回答:不要在现实代码中这样做。