Nightmarejs - 我怎么能读取表行内容?

时间:2017-04-04 13:54:18

标签: javascript web-scraping bots nightmare

我正在编写一个小恶梦脚本,它在Web表单中键入名称并读取打印在表格中的结果。我已经输入了输入法并得到了如下表格结果:

{ jQuery110205953448106032428: 124 }

所以我不知道如何从这个元素中读取行。

我目前的脚本是:

const Nightmare = require('nightmare')
const nightmare = Nightmare({ show: true })

nightmare
  .goto('https://rnped.segob.gob.mx/')
  .click('small#leyendacomun')
  .wait(2000)
  .type('input#comun_c_nombre', 'María')
  .type('input#comun_c_apaterno', 'Hernández')
  .click('button#busca_comun')
  .wait(2000)
  .evaluate(function () {
      return document.querySelector('table#t_comun')
      // Here I select and return the <table>
  })
  .end()
  .then(function (result) {
      console.log(result)
      //  Here I get { jQuery110205953448106032428: 124 }
  })
  .catch(function (error) {
      console.error('Error:', error);
  });

如何从该查询选择器中获取表行?

1 个答案:

答案 0 :(得分:0)

evaluate的结果不能像代码中那样引用DOM元素。在evaluate()函数中进行所有数据提取,例如:

  // ...
  .wait(2000)
  .evaluate(function () {
      // get table and prepare result
      const table = document.querySelector('table#t_comun'),
            result = [];

      // get rows
      const rows = table.querySelectorAll( 'tr' );
      for( let i=0; i<rows.length; i++ ) {

        // get cells
        let cells = rows[i].querySelectorAll( 'td' );

        // get contents
        let row = [];
        for( j=0; j<cells.length; j++ ) {
          row.push( cells[i].innerHTML );
        }

        // add to result
        result.push( row );
      }

      // done, return result
      return result;
  })
  .end()
  // ...