在Scrapy中选择Xpath

时间:2015-12-29 02:36:26

标签: xpath web-scraping scrapy

我正在使用Scapy从网站上抓取一些数据,我需要帮助使用Xpath从以下选择“数据”。

 #include <iostream>
 using namespace std;

 void ReturnSquare(int& Number, int Number2)
 {
     cout<< "do you wish to add number ?...(y/n) ";
     char CalcCircum = 'n';
     cin>> CalcCircum;


     Number *= Number;

     if (CalcCircum =='y')
     cout<< "addition of number is..." << Number2 + Number2 <<endl;
 }


 int main()
 {
     cout<< "enter a number you wish to square: ";
     int messaround = 0;
     cin>> messaround;

     ReturnSquare(messaround, messaround);
     cout<< "square is: " << messaround <<endl;

     cout<< "press enter to continue..." <<endl;
     cin.ignore(10, '\n');
     cin.get();
     return 0;
 }

我可以使用哪些陈述来选择必要的数据?我希望这不是一个愚蠢的问题。如果是,请指出我正确的方向。

1 个答案:

答案 0 :(得分:1)

在发布的html中有多个数据元素。假设<span class="result_item">是项目的父项,您可以尝试以下方法:

获取标题:

//span[@class='result_item']/span[@class='header_text3']/text()

获取锚链接数据:

//span[@class='result_item']/a/text()

另外,为了帮助使用xpath,请在Firefox中安装Firebug Addon,然后在Firebug上安装FirePath插件。指向元素将为您提供自动生成的xpath(适合初学者。有时需要xpath调整)