我的网站根据以下规范提供动态创建的内容,以便抓取工具可见: https://developers.google.com/webmasters/ajax-crawling/docs/specification。 这样,Google抓取工具使用以下语法索引大约5000个网址: http://www.unclestock.com//app.jsp?_escaped_fragment_=s=AAPL http://www.unclestock.com//app.jsp?_escaped_fragment_=s=GOOG
通过Google的网站管理员工具查看我的抓取报告,我确定这些网页已成功抓取。但是,在通过Google搜索时,它们不会显示为结果。 请注意我找到了我的常规网站,在“更多结果”下,我发现了大约40个动态生成的网页,但显然这不是我想要的。我想根据他们的内容找回页面(AAPL,GOOG,...) 也许,爬虫会认为我的页面大致相同......但它们不是。
答案 0 :(得分:0)
如果Google看到带#的网址,Google通常只会请求带有?_escaped_fragment_ =的网页!在里面。这些页面将被编入索引#! (以便点击Google搜索结果中的链接将转到带有#!的网址),而不是索引为... escaped_fragment ...
你说谷歌索引了有“escaped_fragment”的网址 - 但如果你准确引用它们,谷歌从来没有看到过网址“http://www.unclestock.com/app.jsp?#!s=AAPL” - 如果有的话,会有两个?在app.jsp之后#!被替换为?#!_ escaped_fragment _ =
我的印象是jsp代码需要有?在#之前的URL!所以该网站将无法正常工作
... / app.jsp#!S = AAPL