我正试图访问,说一组8,000个LinkedIn个人资料属于拥有某个名字的人(例如,让我们说“拉里”),然后想要提取各种工作用户已经过去了。有没有一种有效的方法来做到这一点?我需要每个拉里独立挑选;基本上,遍历某人的网络并不是一个好方法。有没有办法完全随机化Larry的选择方式?
甚至不知道从哪里开始。感谢。
答案 0 :(得分:0)
开始:
尝试抓取响应,在您的浏览器上提供的内容几乎是自杀。
检查他们的APIs(特别是People's API)及其code samples。
人员API中的重要免责声明:
People Search API是我们的Vetted API访问计划的一部分。你必须 在此处申请并在使用此API之前获得LinkedIn的批准。
考虑到这一点,您将能够编写一个查询和解析这些API的脚本。例如,使用Larry作为名字http://api.linkedin.com/v1/people-search?first-name=Larry
检索用户一旦你获得Linkedin的批准,你已经从他们的API中检索了一些数据,并尝试了一些json或XML解析(无论API返回什么),你都会有更具体的问题。< / p>
如果您仍希望在点击https://www.linkedin.com/pub/dir/?first=Larry&last=&search=Search时抓取linkedin返回的html,请查看BeautifulSoup