如何解析html代码以获取图像src

时间:2013-01-14 11:16:32

标签: html google-apps-script

我有使用图片标签的html代码..我想获得图片的src ..

一个想法是......我拆分了那段代码:

var temp=htmlContent.split("<img src='")[1];
var imageURL=temp.split("'")[0];

但是没有保证src会成为img标签的第一个属性....就像这个

 <img alt="image" src="url"/>

请为我提供一些可行的Google Apps脚本解决方案

1 个答案:

答案 0 :(得分:1)

// parses implicitly as "<html><body><img alt='alt' src='source!'></body></html>"
Xml.parse("<img alt='alt' src='source!'>", true).getElement() 
    .getElements()[0]  // descend into <html>
    .getElements()[0]  // descend into <body>
    .getAttribute('src').getValue();  // get the value of the 'src' attribute

要解释,Xml.parse第二个参数为true,将文本解析为宽松的HTML文档。它会隐式添加<html>标记和<body>标记,您需要通过.getElements()[0].getElements()[0]调用进入该标记。然后,您处于<img>标记,您可以检查其src属性,而无需担心标记中的位置。