我不知道是否有人能够解决这个问题。在AWS服务器中,我们正在运行我们的应用程序。我们提取在网页上发布的文章的内容。几乎所有东西都可以,但是Linkedin脉冲文章返回999 Request Denied。
我知道Linkedin已将AWS ip列入黑名单,而且我还指定使用哪个用户代理。
但是有一种方法可以避免使用该终点或任何终点api来查询脉冲文章吗?
这是我目前的代码
var httpWebRquest = (HttpWebRequest)WebRequest.Create(new Uri("https://www.linkedin.com/pulse/time-c-suite-social-network-damian-corbet?trk=prof-post"));
httpWebRquest.UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.134 Safari/537.36";
var httpWebResponse = (HttpWebResponse)httpWebRquest.GetResponse();
...
和GetResponse抛出
远程服务器返回错误:(999)拒绝请求
答案 0 :(得分:2)
LinkedIn没有为访问Pulse文章提供任何API端点。此外,您应该知道,根据其服务条款第8节明确禁止抓取该信息:https://www.linkedin.com/legal/user-agreement