我正在尝试从链接文本为“猫”的HTML文档(Gmail电子邮件)中获取href
例如我想从HTML文档中任何位置的链接下面提取URL
<a href="https://www.google.com/search?q=cats&oq=cats" target="_blank">cats</a>
or
<a href="https://www.google.com/search?q=cats&oq=cats" target="_blank">yay cats</a>
注意:我正在构建Gmail插件
答案 0 :(得分:1)
这是一个正则表达式测试仪,因此它可能比您期望的要多,但它将找到您正在寻找的链接以及您希望找到的任何其他链接。这将满足您当前的需求:<.*q=cats.*>
。当前正在使用的正则表达式函数为String.match,您可以找到它的解释here。页面底部有一个网址,它应指向包含以下内容的电子表格,该电子表格包含名为“默认”的页面。>
function buildAddOn(e) {
var accessToken = e.messageMetadata.accessToken;
GmailApp.setCurrentMessageAccessToken(accessToken);
var msg=GmailApp.getMessageById(e.messageMetadata.messageId).getPlainBody();
setDefaults({message:msg});
var cards = [];
cards.push(buildRegexTester(getDefaults()));
return cards;
}
function buildRegexTester(dfltObj){
var card=CardService.newCardBuilder();
card.setHeader(CardService.newCardHeader().setTitle('Regex Tester'));
var section=CardService.newCardSection().setHeader('Email Body Search');
var plainBodyText=CardService.newTextParagraph().setText(dfltObj.message);
section.addWidget(plainBodyText)
var saveRegexButton=CardService.newTextButton().setText('Save Regex').setOnClickAction(CardService.newAction().setFunctionName('saveRegex'));
section.addWidget(saveRegexButton);
var regexTextBox=CardService.newTextInput()
.setFieldName('Regex')
.setTitle('Regex')
.setMultiline(true)
.setValue(dfltObj.Regex);
section.addWidget(regexTextBox);
var searchButton=CardService.newTextButton().setText('Search').setOnClickAction(CardService.newAction().setFunctionName('search'));
section.addWidget(searchButton);
var regexResultBox=CardService.newTextInput()
.setFieldName('Results')
.setTitle('Results')
.setMultiline(true)
.setValue(dfltObj.results);
section.addWidget(regexResultBox);
var clearResultsButton=CardService.newTextButton().setText('Clear Results').setOnClickAction(CardService.newAction().setFunctionName('clearResults'));
section.addWidget(clearResultsButton)
var g_toggle=CardService.newKeyValue()
.setContent('global search')
.setSwitch(CardService.newSwitch()
.setSelected(dfltObj.g)
.setFieldName('g')
.setValue('g')
.setOnChangeAction(CardService.newAction().setFunctionName('saveFlags')));
section.addWidget(g_toggle);
var i_toggle=CardService.newKeyValue()
.setContent('ignore case')
.setSwitch(CardService.newSwitch()
.setSelected(dfltObj.i)
.setFieldName('i')
.setValue('i')
.setOnChangeAction(CardService.newAction().setFunctionName('saveFlags')));
section.addWidget(i_toggle);
var m_toggle=CardService.newKeyValue()
.setContent('multiline search')
.setSwitch(CardService.newSwitch()
.setSelected(dfltObj.m)
.setFieldName('m')
.setValue('m')
.setOnChangeAction(CardService.newAction().setFunctionName('saveFlags')));
section.addWidget(m_toggle);
card.addSection(section);
return card.build();
}
function getDefaults(){
var ss=SpreadsheetApp.openByUrl(RegexTesterAddon_URL);
var sh=ss.getSheetByName('Defaults');
var rg=sh.getDataRange();
var vA=rg.getValues();
var dfltObj={};
for(var i=0;i<vA.length;i++){
dfltObj[vA[i][0]]=vA[i][1];
}
return dfltObj;
}
function setDefaults(dfltObj){
var ss=SpreadsheetApp.openByUrl(RegexTesterAddon_URL);
var sh=ss.getSheetByName('Defaults');
var rg=sh.getDataRange();
var vA=rg.getValues();
for(var i=0;i<vA.length;i++){
if(typeof(dfltObj[vA[i][0]])!='undefined'){
vA[i][1]=dfltObj[vA[i][0]];
}
}
rg.setValues(vA);
}
function saveFlags(e){
Logger.log('\nsaveFlags():\n%s\n',e);
var g=(typeof(e.formInput.g)!='undefined')?true:false;
var i=(typeof(e.formInput.i)!='undefined')?true:false;
var m=(typeof(e.formInput.m)!='undefined')?true:false;
var flagObj={g:g,i:i,m:m};
setDefaults(flagObj);
}
function saveRegex(e){
Logger.log('\nsaveRegex():\n%s',e);
var regex=(typeof(e.formInput.Regex)!='undefined')?e.formInput.Regex:'';
if(regex){
var rObj={Regex:regex};
setDefaults(rObj);
}
}
function saveResults(rsltObj){
setDefaults(rsltObj);
}
function getFlags(){
var dfltObj=getDefaults();
var flagsA=[];
if(dfltObj.g){flagsA.push('g');}
if(dfltObj.i){flagsA.push('i');}
if(dfltObj.m){flagsA.push('m');}
var flags=flagsA.join('');
return flags;
}
function search(e){
Logger.log('\nSearch():\n%s',e);
if(typeof(e.formInput.Regex)!='undefined'){
saveFlags(e);
saveRegex(e);
var dfltObj=getDefaults();
var flags=getFlags();
var pattern=dfltObj.Regex;
Logger.log('\nflags: %s\npattern: %s',flags,pattern);
var re=new RegExp(pattern,flags);
//var result=re.exec(dfltObj.message);
var result=dfltObj.message.match(re);
if(result) {
Logger.log('\nresult: %s\nmessage:',result,dfltObj.message);
if(result){
var rsltLog='';
for(var i=0;i<result.length;i++){
if(i>0){rsltLog+='\n'};
rsltLog+='result[' + i + ']= ' + result[i];
}
}
console.log('module: %s pattern: %s regex: %s flags: %s result: %s length: %s',"findData()",pattern,re,flags,rsltLog,result.length);
}
if(result){
var results=rsltLog;
}else{
var results="No Results";
}
//var rsltObj={results:results};
var rsltObj={results:escapeHtml(results)};
saveResults(rsltObj);
return buildRegexTester(getDefaults());
}
}
function clearResults(e){
var dfltObj=getDefaults();
dfltObj.results='';
return buildRegexTester(dfltObj);
}
//Came From: @Kip https://stackoverflow.com/a/4835406/7215091
function escapeHtml(text) {
var map = {
'&': '&',
'<': '<',
'>': '>',
'"': '"',
"'": '''
};
return text.replace(/[&<>"']/g, function(m) { return map[m]; });
}
var RegexTesterAddon_URL='link to a spreadsheet that contain defaults';
电子表格必须有一个名为Defaults的页面,它看起来像这样:
该页面仅使用A列和B列,并且必须具有message,Regex,g,i,m和结果,如图所示。 g,i,m的典型设置为TRUE,FALSE,FALSE,这将使您入门。此Regex适用于您当前的需求<.*q=cats.*>