我希望我的网站可以抓取,这是在AngularJS上。我决定使用phantomjs并试用这两种方法但没有成功。
方法1:我按照blog进行了操作。当我在任何页面上发出curl请求时,我正确地设置了所有内容
curl "www.mywebsite.com/?_escaped_fragment_=/path/to/page" > output.html
我在output.html文件中获取了www.mywebsite.com/path/to/page的内容,其中包含正确的描述和标签。我向谷歌网站管理员提交了相同的网址(正确获取并呈现)并提交给索引。谷歌在几个小时内将我的页面编入索引。但我没有得到我的网址描述和标签。你能说出我在做什么错吗?
附上一个这样的网址的屏幕截图: www.ketchupp.in/gurgaon/sohna-road
方法2:我也跟着这个blog并尝试使用命令为我的页面创建快照:
./ make-snapshot.sh' http://www.ketchupp.in/#/gurgaon/sohna-road'
我在/ snapshot / gurgaon文件夹中获得了该页面的快照。我的重写规则是:
RewriteEngine on
RewriteCond %{REQUEST_URI} ^/$
RewriteCond %{QUERY_STRING} ^_escaped_fragment_=/?(.*)$
RewriteRule ^(.*)$ /snapshots/%1.html? [NC,L]
当我做的时候
curl' www.ketchupp.in /?_ escaped_fragment _ = / gurgaon / sohna-road'
我正在获得正确的html快照,包含正确的图块,标签和说明。但是当我在谷歌上搜索它时,它显示主页的标题和描述以及标签。任何人都可以帮我找到可能的原因。