几个月来,我们的IIS / ColdFusion服务器在Google抓取工具扫描期间抛出了404错误。通常很容易跟踪这些,但在这种情况下,谷歌正在尝试扫描我们的CFC文件。这些文件确实存在,但它们不会暴露给Internet - 仅暴露给ColdFusion服务器。尽管如此,谷歌正在我们网站的某个地方看到与CFC的链接,并且正在努力关注它们。
以下是我们在其中一个404中的CGI结构转储。 baseCFC
是D:\Domains\[domain]\cfc
的CF映射。我们源代码中对baseCFC
的所有引用都在<cfajaxproxy>
标记或Application.CFC中的CreateObject()
调用中(以下示例)。
也许这是一个重要线索:baseCFC
指的是D:\Domains\[domain]\cfc
,但Google正试图访问D:\Domains\[domain]\www\baseCFC
,这是我们网站的主目录。显然,Google将baseCFC
视为服务器上的普通(未映射)目录,并希望对其进行扫描。
以下是我们代码中两种baseCFC
引用的示例:
&LT; cfajaxproxy&GT;:
<cfajaxproxy cfc="baseCFC.Misc" jsclassname="ajxMisc">
的CreateObject():
<cfscript>
request.Misc = CreateObject( "component", "baseCFC.Misc" );
</cfscript>
我们如何解决这些与CFC相关的404错误?谢谢!
答案 0 :(得分:12)
cfajaxproxy
创建的javascript包含cfc的位置。查看页面来源,您应该能够找到字符串'/baseCFC/Statement.cfc'
。这就是谷歌找到它们的方式。
让Google忽略它们的一种快捷方法是修改您的robots.txt
文件以排除baseCFC
“目录”。
User-Agent: *
Disallow: /baseCFC/