我正在研究从中文学术文章数据库中获取一些链接。
当我将页面刷新为正在查看的文章,或者简单地复制并粘贴一个URL时,该URL重定向到数据库的首页而不是文章。
例如,以下链接指向我的搜索结果: http://search.cnki.net/search.aspx?q=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD
第一篇文章的个人网址是: http://www.cnki.net/kcms/detail/detail.aspx?dbcode=CJFQ&dbName=CJFQ2016&FileName=KJDB201615009&v=&uid=
但是,如果尝试直接单击文章链接或刷新文章页面,它将重定向到数据库主页。为什么会这样呢?有什么方法可以获取这些文章的“稳定”网址?
尽管我不确定,但可能很重要的一个细节是各个文章的HTML代码中的url也不同。
<a href="http://epub.cnki.net/grid2008/brief/detailj.aspx?filename=KJDB201615009&dbname=CJFDLAST2016" target="_blank">