使用PHP中的URL获取网站标题(并验证URL)

时间:2011-08-05 17:53:26

标签: regex curl url-validation

我需要验证网址并获取标题。为此,我卷曲URL然后使用正则表达式提取标题。但是,有时网站可能会关闭或可能不会“卷曲”。例如,如果您卷曲http://arsenal.com,则会返回This site has permanently moved to http://www.arsenal.com

我可以编写一个正则表达式来检查返回的文本是否包含“site”,“moved”,url等内容。但这听起来很愚蠢而且过于复杂。

但是,如果我在网络浏览器中输入http://arsenal.com,它会自动重定向到www.arsenal.com。他们如何做到这一点?什么建议你的互联网人?

1 个答案:

答案 0 :(得分:0)

试试curl -L。如果服务器响应该位置已移动,则-L开关会导致curl遵循重定向。浏览器通过查看响应代码(在本例中为3XX)自动完成此操作,然后查找以下标头并重定向到该值:

Location: newsite.com

我不知道如何使用PHP包装器中的那个开关进行卷曲,但我不是一个PHP人。我认为这是一种直截了当的方式。