Facebook刮刀读取内容错误

时间:2012-04-24 09:25:36

标签: facebook scraper

在阅读我的页面内容时,Facebook刮刀会抛出一些奇怪的东西......

网页网址: http://www.protagora.hr/Stranica/O-nama/9/

Scrape调试输出: https://developers.facebook.com/tools/debug/og/object?q=http%3A%2F%2Fwww.protagora.hr%2FStranica%2FO-nama%2F9%2F

为什么当我使用浏览器访问页面时一切正常,但是刮刀无法访问相同的数据?

请帮助。

1 个答案:

答案 0 :(得分:1)

当我第一次尝试访问你的页面时,我得到了一个php错误而不是页面,然后我刷新了浏览器,错误消失了,页面被加载了。

然后我试着看看调试器说了什么,你是对的,它抱怨(警告没有错误)关于没有以下标签:标题,网址和描述,即使在查看你的来源时很明显所有标签存在。

在调试器结果页面的底部有一个链接“Scraped URL:确切了解我们的刮刀看到的URL”,当点击facebook刮板获取的内容时:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
<br><b>Fatal error</b>
</head>
<body><p>:  Call to a member function LoadContentData() on a non-object in <b>/home/protagor/public_html/WebSuite/Modules/WebCMS/Classes/Content.php</b> on line <b>65</b><br></p></body>
</html>

这是我最初看到的错误。

我不确定他们是否只是缓存了这个错误,或者只有当facebook bot报废您的页面时才会出现此错误。 通常使用调试器“强制”清除facebook缓存,新结果将替换缓存中的旧缓存。

您应该检查此错误发生的原因。