为什么Bing抓取工具无法获取我的角度网页的动态内容?

时间:2018-05-11 20:10:26

标签: web-crawler single-page-application

我的SPA网站(基于Node / Express / Mongo / Angular X)启动并运行。我创建了一个sitemap.xml并提交给了Microsoft Bing,从服务器日志中,我看到他们开始抓取。但是,我注意到调用了页面URL,但没有调用该页面的关联API。所以,基本上它只是索引每个页面的静态骨架,而不是动态真实内容。

我用谷歌搜索并看到人们说“谷歌无法索引动态内容”,如article所述。但是,我也看到其他人说爬虫只是一个浏览的人,它应该得到它的动态内容。

我很困惑。有人可以澄清一下吗?怎么解决?

1 个答案:

答案 0 :(得分:-2)

网络抓取工具不会执行JavaScript。谷歌可能有一个更复杂的爬虫,但大多数没有。对于数万亿页面来说,它只是计算密集型。为要跟踪的抓取工具添加静态链接。见https://stackoverflow.com/a/28075506/148844

Bing不会为JavaScript生成的内容编制索引。

https://www.bing.com/webmaster/help/webmaster-guidelines-30fba23a

  

网站技术   您网站上使用的技术有时可能会阻止Bingbot找到您的内容。富媒体(Flash,JavaScript等)可能导致Bing无法通过导航进行抓取,或者看不到嵌入在网页中的内容。为了避免任何问题,您应该考虑实现一个低级体验,其中包含与您的富版本相同的内容元素和链接。这将允许任何没有启用富媒体的人(Bingbot)查看您的网站并与之互动。

     

富媒体警告 - 不要将链接隐藏到JavaScript内的内容

     

富媒体警告 - 请勿在Javascript / flash / Silverlight中隐藏链接;同时保留内容

     

低级体验增强了可发现性 - 避免在Flash或JavaScript中容纳内容 - 这些块抓取工具可以找到内容