使用mechanize进行xpaths和html解析

时间:2012-04-11 01:20:10

标签: ruby-on-rails parsing mechanize

我使用mechanize来解析http://www.hammacher.com/Category/Default.aspx?uq=Gifts-Under-30&all=True

我可以使用什么xpath来访问该页面上的每个href,以便可以传递每个产​​品页面?

这就是我现在正在尝试的,而不是一个完整的网址:

page = agent.get('http://www.hammacher.com/Category/Default.aspx?uq=Gifts-Under-30&all=True')    
page.parser.xpath('//*[contains(concat( " ", @class, " " ), concat( " ", "product_list_sub", " " ))]//a')[5].attributes['href'].to_s

另外,当使用Mechanize在同一语句中解析两个不同的xpath选择器时,是否可能?

提前致谢!

1 个答案:

答案 0 :(得分:0)

试试这个

page.links_with(:href => /Product\/Default.aspx\?sku/)