Python:如何在网页的HTML作为文本(eBay)中查找显示在显示的网页中的文字文本

时间:2014-11-26 13:19:26

标签: python html parsing request

我一直在使用这个模块:

http://docs.python-requests.org/en/latest/

将eBay列表的HTML作为文本(并将其存储在字符串中)。

然后,我想在此字符串中搜索某些关键字。

问题是列表描述中显示的文字在该列表的HTML中没有显示。

例如:

http://www.ebay.com/itm/Converse-All-Star-High-Double-Tongue-Size-5-/221617886213?pt=UK_Women_s_Shoes&hash=item3399749405

我希望能找到:

“舒适温暖”

在列表的HTML中的某处,因为该字符串出现在列表的描述中。

在我看过的其他网站中,页面上的所有文字都显示在HTML中。我想eBay设计得更好,但我对HTML的工作方式一无所知。

非常感谢任何输入

1 个答案:

答案 0 :(得分:2)

因为该数据位于iframe中。它就像一个内部网站。 如果您加载页面,则不会加载iframe。 你必须手动加载它。

这是iframe:

<iframe id="desc_ifr" class="" height="10000" width="99%" marginheight="0" marginwidth="0" frameborder="0" src="http://vi.vipr.ebaydesc.com/ws/eBayISAPI.dll?ViewItemDescV4&amp;item=221617886213&amp;t=1417007358000&amp;tid=310&amp;category=95672&amp;seller=punkyllama26&amp;excSoj=1&amp;excTrk=1&amp;lsite=3&amp;ittenable=false&amp;domain=ebay.com&amp;descgauge=1" title="Seller's description of item"></iframe>

这是带有数据的链接(在iframe中查看src):

http://vi.vipr.ebaydesc.com/ws/eBayISAPI.dll?ViewItemDescV4&item=221617886213&t=1417007358000&tid=310&category=95672&seller=punkyllama26&excSoj=1&excTrk=1&lsite=3&ittenable=false&domain=ebay.com&descgauge=1