我正在编写一个程序,以抓取包含在字符串变量中的HTML文本,并拾取所有文本实例,例如:h2和h3标头的示例。我想最好的方法是使用RegExp,但是我不确定这应该是什么语法。我正在Google Apps脚本中实现此功能,到目前为止,此功能具有以下代码(我省略了网址)。
function scraper(){
var mainSheet =
SpreadsheetApp.getActiveSpreadsheet().getSheetByName("Sheet1");
var url = "";
var xml = UrlFetchApp.fetch(url).getContentText();
var re = new RegExp();
}