有没有办法在JAVA过滤器中访问完整的角度URL(#!)?

时间:2016-01-05 23:38:38

标签: java angularjs url servlets endeca

我们使用angular JS实现了许多页面。我们创建了离线快照html并将其存储为网络抓取工具。

现在,当Web爬网程序根据用户代理值请求特定页面时,我们将请求重定向到JAVA servlet,该servlet将适当的快照页面返回给爬网程序。

当请求从爬虫(如Endeca)进入servlet时,我只是获取url直到#..并且url中的#之后的所有内容都将丢失,因此servlet无法返回相应的快照。

我知道不可能通过http请求发送完整的URL(以及#),但我想知道是否有办法克服这个问题。

curl -A "endeca webcrawler" "http://test.com/test#!/test1/id"

在JAVA servlet过滤器中,我得到http://test.com/test

注意:谷歌和bing位转换#!到_escaped_fragment因此我没有看到这些抓取工具的问题。

0 个答案:

没有答案