用PHP获取主要文章图像

时间:2011-01-13 12:44:12

标签: php regex image

我想获得一篇文章的主要图片,就像Facebook发布链接时所做的那样(但没有选择图像部分)。我们必须处理的数据是整个页面HTML作为变量。页面&每次运行此功能时,URL都会有所不同。

是否有任何图书馆或课程特别擅长获取主要内容,就像Instapaper会有什么帮助?

1 个答案:

答案 0 :(得分:2)

您可以使用PHP DOM类来解析HTML页面。它很容易让你抓住第一张图片和h1文本。

你也可以用它来获得更高级的功能,比如在p标签中循环找到第一个包含超过X个字符的p标签,并将其用于主文本。或者你可以抓住meta标签并获得描述。

有大约一百万种不同的方法可以用,但PHP DOM可能是你最初想要的。

http://us.php.net/manual/en/book.dom.php