Google Apps脚本 - 在正则表达式中使用冒号

时间:2018-02-13 14:23:29

标签: javascript regex google-apps-script

我正在使用Google Apps脚本从Gmail电子邮件中导出表单数据。该脚本使用正则表达式匹配电子邮件中的字符。每当我发现任何未通过脚本成功导出的数据时,我都会寻找脚本无法匹配的任何异常字符(通常是变音符号)。这个策略运作良好,除了我无法弄清楚如何匹配像冒号一样简单的东西。包含冒号的任何表单数据都不会被我的脚本下载。有人可以帮忙吗?只需将冒号添加到应该匹配的字符列表中就不起作用了。这是完整的脚本。它查看了14个不同的表单字段。

function parseEmailMessages(start) {

start = start || 0;

var threads = GmailApp.getInboxThreads(start, 100);
var sheet = SpreadsheetApp.getActiveSheet();

for (var i = 0; i < threads.length; i++) {

// Get the first email message of a threads
var tmp,
  message = threads[i].getMessages()[0],
  subject = message.getSubject(),
  content = message.getPlainBody();

// Get the plain text body of the email message
// You may also use getRawContent() for parsing HTML

// Implement Parsing rules using regular expressions
if (content) {

  tmp = content.match(/First:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var first = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

  tmp = content.match(/Last:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var last = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

  tmp = content.match(/Title:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var title = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

  tmp = content.match(/Organization:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var organization = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

  tmp = content.match(/City:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var city = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

  tmp = content.match(/State:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var state = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

  tmp = content.match(/Country:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var country = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

  tmp = content.match(/Affiliation:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var affiliation = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

tmp = content.match(/Source:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var source = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

tmp = content.match(/Other:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var other = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

tmp = content.match(/Optout:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var optout = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

tmp = content.match(/Share:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var share = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

tmp = content.match(/Question:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@./\s\-]+)(\r?\n)/);
  var question = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

  tmp = content.match(/E-mail:\s*([A-Za-z0-9!"?`?|õüö’çëÅíšÃÉÁÇÃáéñãóú#&;()-,'@_.\-]+)/);
  var email = (tmp && tmp[1]) ? tmp[1].trim() : 'BLANK';

  tmp = content.match(/BLANK:\s*([\s\S]+)/);
  var blank = (tmp && tmp[1]) ? tmp[1] : 'BLANK';

  sheet.appendRow([first, last, title, organization, city, state, country, email, affiliation, source, other, optout, share, question]);

} // End if
} // End for loop
}

0 个答案:

没有答案