我正在为我的工作做一个项目,并试图从GA栏网站上获取律师的联系信息。我已经搜索了要执行此操作的程序,但我找不到任何我需要的内容。
我需要将所有律师信息都收集到excel中,并且我认为有一些批处理文本程序可以完成这项工作。列出了超过50,000个联系人,我真的不认为我需要点击每个链接来查看能够访问它的信息。
我在Chrome上打开了“inspect element”页面上的代码,发现每个律师在网站上都有一个唯一的ID。我觉得他们的信息很容易从网站上复制,但我的编程知识非常有限。
有什么建议吗?
答案 0 :(得分:1)
第一步是检查GA酒吧网站的服务条款/版权,并确保您可以这样做。
在开始编码之前,您可以考虑以数据库格式请求联系信息。这些信息可以免费获得,或者收取的费用低于您编写解决方案的费用。
如果你必须编程,一个非常强大的用于抓取网站内容的库是HTML Agility Pack。我建议你熟悉它,并在进入细节时在这里发布更详细的问题。
HTML Agility Pack确实需要编程。如果您正在寻找非编程解决方案,Stack Overflow不是正确的问题。