标签: url solr web-crawler nutch
我正在尝试使用如下所示的Apache Nutch抓取网页:
y
但是Nutch似乎忽略了以下部分:/#/ details / interview,只是抓取了网址:
https://<WEBSITE_URL>/#/details/interview
如何让Nutch正确抓取网页?
谢谢!