使用python查找唯一的Web链接

时间:2016-04-20 05:36:23

标签: python python-2.7

我正在编写一个程序来从www.stevens.edu中提取独特的网络链接(这是一项任务),但有一个问题。我的程序正在工作并提取除www.stevens.edu以外的所有网站的链接,我的输出为“无”#39;。我对此感到非常沮丧,需要帮助。我正在使用此网址进行测试 - http://www.stevens.edu/

<ion-view title="Dashboard">
  <ion-content class="has-header padding">
      <dynamic-accordion content="accordionbutton.html"></dynamic-accordion>
      <dynamic-accordion content="accordionform.html"></dynamic-accordion>
  </ion-content>
</ion-view>

请在这里指导我,让我知道为什么它不与www.stevens.edu合作?

1 个答案:

答案 0 :(得分:3)

网站检查j标题,并在其上返回不同的html基础。

您需要设置User-Agent标头才能获得正确的html:

User-Agent