鉴于HTML电子邮件,我正在使用以下内容删除文本:
body = body.gsub(/\\r\\n?/, "\n");
body = body.gsub(/\\n\\n?/, "\n");
body = simple_format(body)
body = strip_tags(body)
但我现在看到一个标签通过了这个:
<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">
这样的输出如下:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
任何想法为什么?
答案 0 :(得分:1)
我想对于strip_tags,看起来它已被弃用,认为doctype语句既不是标记也不是注释。你可以单独剥离它:
string.gsub(/&LT;!?* $ /, '')
答案 1 :(得分:1)
我最终使用Hpricot发短信,工作得很好
答案 2 :(得分:1)