我试图提取截至4月22日2018年的" TAX YEAR TOAL AMOUNTS DUE;"从网页上,无法使正则表达式匹配工作。
任何帮助都将受到高度赞赏。我需要匹配文本" TAX YEAR TOAL AMOUNTS DUE,截至4/22/20188"和此美元价值,因为此网页包含多个具有类似布局的表格。
谢谢。
这是html:
<TR ALIGN="LEFT">
<TD WIDTH="50" CLASS="CellData"> 2013</TD>
<!--TD CLASS="CellData"> INTPT </TD-->
<TD WIDTH="200" CLASS="CellData"> Property Tax Interest </TD>
<TD WIDTH="125" ALIGN="Right" CLASS="CellData"> $302.27</TD>
<!--TD ALIGN="Right"CLASS="CellData"> </TD-->
</TR>
<TR ALIGN="LEFT">
<TD WIDTH="50" CLASS="CellData"> 2013</TD>
<!--TD CLASS="CellData"> ADVFEE </TD-->
<TD WIDTH="200" CLASS="CellData"> Advertising Fee </TD>
<TD WIDTH="125" ALIGN="Right" CLASS="CellData"> $4.00</TD>
<!--TD ALIGN="Right"CLASS="CellData"> </TD-->
</TR>
<TR ALIGN="LEFT">
<TD WIDTH="50" CLASS="CellData"> 2013</TD>
<!--TD CLASS="CellData"> MF </TD-->
<TD WIDTH="200" CLASS="CellData"> MAILING FEE </TD>
<TD WIDTH="125" ALIGN="Right" CLASS="CellData"> $2.00</TD>
<!--TD ALIGN="Right"CLASS="CellData"> </TD-->
</TR>
<TR>
<TD COLSPAN="2" Class = "CellTags" ALIGN="LEFT" FONT SIZE= "+2"><B><U>TAX YEAR TOTAL AMOUNTS DUE
as of 4/22/2018</U></B></FONT></TD>
<TD WIDTH="125" CLASS="CellData" ALIGN="RIGHT"><U><FONT
FACE="Arial">$13,464.73</FONT></U></TD>
</TR>
答案 0 :(得分:0)
您可以尝试使用regex
找到您想要的内容,
(TAX YEAR[^<>]*)[^$]*([^<>]*)
Demo ,,,将Tax语句字符串捕获到group 1
(或$1
),并将相应的美元值捕获到group 2
(或$2
})
为您编辑。
因此,您可以通过extract
中的captured groups 1, 2
script
字符串。
var re = /(TAX YEAR[^<>]*)[^$]*([^<>]*)/g;
var match = re.exec(variable_for_your_html_text);
Logger.log(match[1] + ': ' + match[2]);