刮擦-使用非恒定数据清理刮擦

时间:2019-01-22 16:20:35

标签: javascript scrape dataminer

我正在抓取网页。

我的输出数据在第1列:

提交日期:YYYY-MM-DD HH:MM

我只需要 YYYY-MM-DD

我添加了此脚本以删除“提交日期:”

var cleanup = function(results) {

  $.each(results, function(){                

   this.values[0] = this.values[0].replace("Submission date: ", "");
        this.values[1] = this.values[1].replace("Case number: ", "");

  });

  return results;                           
};

如何删除HH:MM? 请记住,数据每次都会更改

1 个答案:

答案 0 :(得分:0)

一种简单的方法可能是在分隔符上分割字符串。给定类似“ 2019-1-20 12:30”的字符串,请在定界符处进行分隔,在本例中为空格:

var value = "2019-1-20 12:30";
var parts = value.split(" "); // ["2019-1-20", "12:30"]
var dateOnly = parts[0];