我试图使用HTTParty和Nokogiri从他们的LinkedIn个人资料中获取某人的全名。出于某种原因,HTTParty没有返回实际的LinkedIn HTML页面。它完全不同(见我的终端输出)。我尝试使用其他URL的代码,它工作正常。有什么想法吗?
这是我的代码:
# Store the LinkedIn URL form command line.
linkedin_url = "https://www.linkedin.com/in/janedoe"
# Get the contents of the LinkedIn page.
page = HTTParty.get(linkedin_url)
p page.parsed_response
编辑:原来,我回来的HTML页面只包含一个创建重定向的脚本 - 有关如何到达最终页面的任何建议吗?
答案 0 :(得分:1)
那是页面。它是HTML,它执行重定向到另一个页面。转到浏览器中的指定链接,看看它是否重定向。如果是,请使用您给定URL重定向到的链接。那也是HTML。如果您需要帮助解析HTML,请勿使用REGEX 。