当我在浏览器中查看网站时(例如https://www.homedepot.ca/en/home/p.725-inch-miter-saw-with-laser.1000748698.html),它包含的信息不在源代码中。
例如,此页面的源代码没有指定产品价格:
<span itemprop="price">-</span>
<small>/
each</small>
但是,在浏览器中查看时,标签确实包含价格。
如何从源代码中检索产品的价格?
答案 0 :(得分:0)
简短的回答:只是通过阅读消息来源,你就无法做到。在页面加载后,价格从他们的服务器(使用javascript)动态加载。
使用适当的工具(例如Chrome / Firefox的开发者控制台中的网络标签),您可以找出他们从哪里检索价格(在这种情况下是他们服务器上的JSON文档)。但是,即使您使用了它,也无法保证它明天仍然有用 - 它们可以随时收取链接或数据格式。
开始使用他们所使用的技术的好地方是阅读
如果您有兴趣以编程方式从他们的页面检索信息,那么一个好的开始就是联系他们,看看他们是否有可以使用的公共界面(API)。这些通常更稳定。