使用Artoo,我正在尝试抓取具有不同字段的多个页面。
下面的代码将为每个页面创建一个对象。第一个将包含InfringementNo的数据和一个空字符串。另一个将有一个空字符串和FirstNames的数据。我想在没有空字符串的同一个对象中捕获它们。
var scraper = {
iterator: 'form',
data: {
InfringementNo: {sel: 'table > tbody > tr > td > span#NoticeInfo_lblInfringementNo'},
FirstNames: {sel: 'table>tbody>tr>td>table>tbody>tr>td>table>tbody>tr>td>table>tbody>tr>td>div>table>tbody>tr>td>div>table>tbody>tr>td>span#DebtorDetailsCtrl_firstnameTxt'}
}
}
artoo.ajaxSpider([
'https://d...Management/Noticedetails.aspx',
'https://d...armastrmes/DebtorDetails.aspx'], {
scrape: scraper,
concat: true,
done: function(data) {
console.log('Retrieved data:', data)
}
}
)