我想写一个正则表达式来解析这个网页(view-source:http://www.imdb.com/search/title?title = spiderman&amp; title_type = feature)。基本上我想提取<tr class=".+">
和</tr>
之间的所有部分。此网页是来自imdb(http://www.imdb.com/search/title?title=spiderman&title_type=feature)的电影列表,此处的每个部分都表示一部电影。我尝试了正则表达式
<tr class=".+">(.+\n)+</tr>
然而,它不起作用。另外,我不允许使用DOM。有没有人有什么建议?谢谢!
答案 0 :(得分:0)
我强烈建议您使用正确的解析器。但这是你的案例的正则表达式。
<tr class="(.+)">([\s\S]+?)</tr>