使用Python提取LinkedIn信息

时间:2014-04-06 01:20:35

标签: python linkedin

我正试图访问,说一组8,000个LinkedIn个人资料属于拥有某个名字的人(例如,让我们说“拉里”),然后想要提取各种工作用户已经过去了。有没有一种有效的方法来做到这一点?我需要每个拉里独立挑选;基本上,遍历某人的网络并不是一个好方法。有没有办法完全随机化Larry的选择方式?

甚至不知道从哪里开始。感谢。

1 个答案:

答案 0 :(得分:0)

开始:

尝试抓取响应,在您的浏览器上提供的内容几乎是自杀。

检查他们的APIs(特别是People's API)及其code samples

人员API中的重要免责声明:

  

People Search API是我们的Vetted API访问计划的一部分。你必须   在此处申请并在使用此API之前获得LinkedIn的批准。

考虑到这一点,您将能够编写一个查询和解析这些API的脚本。例如,使用Larry作为名字http://api.linkedin.com/v1/people-search?first-name=Larry

检索用户

一旦你获得Linkedin的批准,你已经从他们的API中检索了一些数据,并尝试了一些jsonXML解析(无论API返回什么),你都会有更具体的问题。< / p>

如果您仍希望在点击https://www.linkedin.com/pub/dir/?first=Larry&last=&search=Search时抓取linkedin返回的html,请查看BeautifulSoup