如何确定页面是否是域名持有页面

时间:2011-10-13 11:28:58

标签: php http dns domain-name

有没有办法确定网页上的网页是否是抓页?这是因为我需要确定由于域名在我的错误处理过程中到期而导致卷曲收到的页面是否不可用。

我认为在这种情况下会给出一个独特的HTTP代码,但是我给了200 OK,这让事情变得困难。

在PHP中使用strpos()搜索特定短语的唯一方法是什么?

任何帮助将不胜感激!

3 个答案:

答案 0 :(得分:3)

没有可靠的方法来做到这一点。有数百个不同的“域名保持页面”,并没有任何标准。

在一天结束时,域名持有页面只是一个与其他网页一样的网页,它们只是为了人类可读。有些主人根本不会使用。

如果您收到域名持有页面,状态代码可能是2xx代码,但可能不是。某些主机可能会选择使用5xx代码。再一次,没有真正的方法可以知道。

答案 1 :(得分:2)

  

在PHP中使用strpos()搜索特定短语的唯一方法是什么?

烨。域名持有页面与普通网站没有区别。

您可以搜索

  • 某些关键字(“待售”,“为客户预留”......)
  • 某些页面结构(同一公司持有的许多域名共享相同的基本保留页面结构,如“金色域名停放女性”页面)

虽然可能无法达到100%的可靠性。

答案 2 :(得分:1)

  

有没有办法确定网页上的网页是否是抓页?

从技术上讲,持有页面只是一个页面。所以你在技术上寻找一个页面。但是之后?你能给出一个特定的参数是什么?这很难做到。

所以反转这个问题也许有帮助:

  

有没有办法确定网页上的某个网页是一个抓页?

如果您更容易回答这个问题,那么您可能找到了一种方法。如果没有,请在已经回答的内容旁边:

  • 抓页通常看起来一样,结构相同。您可以使用统计信息并在所有页面中确定哪些页面相似。
  • 保留页面可能具有相同的远程IP地址。

但具体而言,如果您无法定义保留页面的特定特征,则无法通过编程方式确定是否有一个页面。