使用正则表达式获取数据

时间:2011-01-12 17:56:32

标签: regex

您好 我想使用正则表达式从网站获取数据 http://helwa.maktoob.com/sec8180/art97048/pno1/title_%D8%B7%D8%A8%D9%82-%D9%81%D9%8A%D8%AA%D9%88%D8%AA%D8%B4%D9%8A%D9%86%D9%8A-%D8%A8%D8%A7%D9%84%D8%AE%D8%B6%D8%A7%D8%B1/index.htm

我使用了正则表达式/<div class="txtblk"(.*)?<div class="imgv cls">/is

但是我给了我无效的RegExp 为什么?

我想在<div class="txtblk"></div>

中获取数据

3 个答案:

答案 0 :(得分:1)

尝试转义双引号。根据您的正则表达式解释器,这些可能会给您带来问题。

答案 1 :(得分:1)

正则表达式本身看起来有效。

这取决于你在哪里/如何使用它;例如,JavaScript不知道/s修饰符。要在JavaScript中模拟点匹配全部模式,请使用[\s\S]代替.

然后,您可能会遇到引号问题,具体取决于您的语言的引用规则。

此外,您可能希望使用(.*?)代替(.*)?。 (或者,如果它是JavaScript,([\s\S]*?))。

最后,建议不要使用正则表达式匹配HTML。使用DOM解析器。

答案 2 :(得分:0)