我有2个有关网页抓取的一般问题。 第一个: 我试图从www.aliexpress.com上获取一些信息,但发现直到向下滚动页面,HTML代码才可见,那么如何自动向下滚动页面?
第二个: 我正在尝试使用pycharm在www.shein.com中的希伯来语(搜索行在希伯来语)中自动搜索某些产品,因此我得到了部分网址。 我的意思是,当我在希伯来语中搜索某些内容时,搜索词就不是URL的一部分(即使在网站上,URL也在希伯来语中包含了该词。
真实网址是:https://il.shein.com/pdsearch/שמלה/ 我的结果是:https://il.shein.com/pdsearch/שמלה/但搜索词不是URL的一部分(当我用英语搜索时,它是URL的一部分) 任何想法为什么会发生?