Google Script:从锚标记获取属性

时间:2016-09-09 17:53:37

标签: google-apps-script

我将此文字附加到文件中:

<a target="_blank" class="title" href="http://www.dabcc.com/citrix-generating-images-for-xenserver-in-openstack/" h="ID=news,5175.2">Citrix: Generating Images for XenServer in OpenStack</a>
<a target="_blank" class="title" href="https://www.virtualizationpractice.com/citrix-acquires-norskale-39055/" h="ID=news,5184.1">Citrix Acquires Norskale</a>

我正在尝试获取链接网址,第一个网址为"http://www.dabcc.com/citrix-generating...

这就是我在a内获取所有内容的方式:

for (var i = 0; i < XmlService.parse(buffer).getDescendants().length; i++) {
    doc.appendParagraph(XmlService.parse(buffer).getDescendants()[i]);
  }

这告诉我这个:

[Element: <a/>]
Citrix: Generating Images for XenServer in OpenStack
[Element: <a/>]
Citrix Acquires Norskale

如何分隔文字和网址?如您所见,文本在上面的示例中是分开的。我怎样才能获得网址?是否有更安全/更好的方法来获取所有属性?

如果需要其他信息,请与我们联系。

1 个答案:

答案 0 :(得分:0)

我找到了方法:

var link = Xml.parse(buffer[i]).getElement().getAttribute('href').getValue());
var text = Xml.parse(buffer[i]).getElement().getText();

Element Class