尝试从http://www.112.ru/services/wanted/people/index.shtml?roztype=1获取所有图书
使用 Yahoo Pipes Xfetch
模块。
我的查询//span[@class='uchbold']
成功选择 Firepath 中的所有标题。但是在 Yahoo Pipes 和 Hpple 中没有结果。
答案 0 :(得分:1)
这些类属性由JavaScript插入,而JavaScript不使用Yahoo Pipes和Hpple执行。
此外,内容由ajax加载,您必须跟踪ajax调用并针对此接口进行开发。
使用Firebug我可以追踪它加载
http://www.112.ru/publish/00/01/0508.01/2012/08//contents.xml
以及许多返回404错误的“contents.xml”文件。它包含元素形式的内容,如
<view file="0901156380089d71_0508.01_00_01.full.shtml" format="full" indexed="true"/>
似乎再次链接到包含实际数据的一些HTML代码段。