并提前致谢!我希望有人能够指出我如何抓一个可搜索的在线数据库。这是网址:https://hord.ca/projects/eow/。如果可能的话,我希望能够访问网站数据库中的所有数据,我只是不确定如何使用bs4访问它...也许bs4不是这里的答案。仍然是一个相对较新的Pythonista,非常感谢任何帮助!
答案 0 :(得分:2)
由于你是新手,你需要解决一些需要解决的问题,你需要很好地处理html的查看位置,确保你了解网站的工作原理,以及它对网站的影响。网址,为什么?您想要引用的网站重要部分的类名是什么?它如何处理多页显示(如果它完全如此)。 一旦您与您正在抓取的网站保持密切联系,您将需要在进行自动化时应用这些知识。
初学者ID高度推荐这本电子书:https://automatetheboringstuff.com/
它是一个很好的阅读,即使是python和html的初学者也很容易理解。更好的是它可以在网站上免费阅读!
第11章是您在webscraping上专门寻找的部分。这将为您提供您需要寻找的内容以及如何规划代码的简要说明。
但我强烈建议您在完成对当前项目的关注后阅读整篇文章。