弹出表格的Amazon Create Wish List Link。表单包含以下方式的提交按钮:
<span class="a-button-inner"><input data-action="reg-create-submit" data-reg-create-submit="{"sid":"192-7611799-5529931"}" class="a-button-input a-declarative" type="submit" aria-labelledby="a-autoid-162-announce"><span class="a-button-text" aria-hidden="true" id="a-autoid-162-announce">
Create a Wish List
</span></span>
我正在使用以下代码,但它不是取形式:
require_once 'goutte.phar';
error_reporting(E_ALL);
use Goutte\Client;
$crawler = $client->request('GET',$url);
$status_code = $client->getResponse()->getStatus();
$form = $crawler->selectButton('Sign in')->form();
$crawler = $client->submit($form, array('email' => 'amazon@gmail.com', 'password' => 'amazonpasswd'));
//Create a Wish List
$crawler = $client->request('GET',"http://www.amazon.com/gp/registry/wishlist/ref=nav_wishlist_create?ie=UTF8&triggerElementID=createList");
sleep(5);
$form = $crawler->selectButton('
Create a Wish List
')->form();
print_r($form); //It returns Nothing
问题可能是selectButton()
匹配的确切文本在我的情况下不存在。请帮忙
答案 0 :(得分:1)
好吧,让我们直截了当。 你需要的是达到你的目标&#34;形式&#34;对于这个问题,你并不需要使用&#34; selectButton&#34;函数只需一个XPath表达式即可获得此元素。
我认为自从您发布此内容后,网络结构已发生变化,因为现在已经创建了愿望清单&#34;按钮显然有一个值&#34; createNew&#34;但是为了使用没有价值的按钮抓取网站,您可以这样做:
require_once 'goutte.phar';
use Goutte\Client;
$client = new Client();
$crawler = $client->request('GET', 'http://www.amazon.com/gp/registry/wishlist/ref=nav_wishlist_create?ie=UTF8&triggerElementID=createList');
$form = $crawler->filterXPath('//h1[@class="a-nowrap"]/form')->form();
print_r ($form);
这样你可以在没有selectButton函数的情况下访问表单,你可以用正常的方式输入表单:
$crawler = $client->submit($form, array('input_name1' => 'value1', 'input_name2' => 'value2'));
希望这有帮助。