Question

preg_match_all（ “/\(.*?)\& LT; / A＆GT; /”，$这 - ＆gt;页面[ “标题”]，$匹配）;

伙计们，$ this-＆gt; page [“标题”]是http://uk.imdb.com/title/tt1285016/这样的网页内容。我需要获得与电影相关的类型列表，即[Action |戏剧|科幻]

我不知道任何关于正则表达式的PHP或任何东西。我总是讨厌模式匹配

这里的帮助将非常感谢。 THX。

点：这是我需要修改的现有代码。这是在php。

Answer 1

这应该更好：

preg_match_all("@<a href\=\"/genre/[\w\-]+\"[^>]*\>(.*?)\</a>@",$this->page["Title"],$matches)

Answer 2

试试这个

preg_match_all('#/genre/[^>]+>([^<]+)<#',$this->page["Title"],$matches);

Answer 3

您应该尝试使用其中一个many PHP HTML parsers。

特别要看看PHP原生DOMDocument documentation。

<小时/> 最后 - 正如我在上面的评论中发布的那样 - 使用正则表达式解析HTML是一个棘手的主题 - 请点击链接了解更多信息：）