使用Nokogiri将全局可用图像替换为vml标记中的图像src

时间:2018-02-16 11:23:01

标签: ruby outlook capybara nokogiri vml

是否可以通过Capybara / Nokogiri找到特定于Outlook的标记?

鉴于以下标记(将<% %>标记处理为常规HTML)

...
<div>
<!--[if gte mso 9]>
    <v:rect
        xmlns:v="urn:schemas-microsoft-com:vml" fill="true" stroke="false"
        style="width:<%= card_width %>px;height:<%= card_header_height %>px;"
    >
        <v:fill type="tile"
            src="<%= avatar_background_url.split('?')[0] %>"
            color="<%= background_color %>" />
        <v:textbox inset="0,0,0,0">
<![endif]-->
<div>

如何获取<v:fill ../>代码列表? (或者如果在条件注释中找到标记是一个问题,我怎么能得到整个注释)

我试过以下

doc.xpath('//v:fill')
  

*** Nokogiri :: XML :: XPath :: SyntaxError Exception:ERROR:Undefined namespace prefix:// v:fill

我是否需要以某种方式注册vml名称空间?

编辑 - 遵循@ThomasWalpole方法

doc.xpath('//comment()').each do |comment_node|
  vml_node_match = /<v\:fill.*src=\"(?<url>http\:[^"]*)"[^>]*\/>/.match(comment_node)
  if vml_node_match
    original_image_uri = URI.parse(vml_node_match['url'])
    vml_tag = vml_node_match[0]
    handle_vml_image_replacement(original_image_uri, comment_node, vml_tag)
  end

我的handle_vml_image_replacement最终会调用以下replace_comment_image_src

def self.replace_comment_image_src(node:, comment:, old_url:, new_url:)
  new_url = new_url.split('?').first # VML does not support URL with query params
  puts "Replacing comment src URL in #{comment} by #{new_url}"
  node.content = node.content.gsub(old_url, new_url)
end

然而感觉评论实际上不再是评论&#34;我有时可以看到HTML好像被转义了...我很可能使用错误的方法来改变Nokogiri的评论文本?

1 个答案:

答案 0 :(得分:0)

这是我用于电子邮件拦截器的最终代码,感谢@Thomas Walpole和@sschmeck在此过程中获得的帮助。

我的目标是将VML标记中的图像(链接到localhost)替换为全局可用图像,以便使用MOA或Litmus等服务进行测试

doc.xpath('//comment()').each do |comment_node|
  # Note : cannot capture beginning of tag, since it might span across several lines
  src_attr_match = /.*src=\"(?<url>http\:[^"]*)"[^>]*\/>/.match(comment_node)
  next unless src_attr_match
  original_image_uri = URI.parse(src_attr_match['url'])
  handle_comment_image_replacement(original_image_uri, comment_node)
end

稍后调用(根据源图像类型选择网址替换策略后):

def self.replace_comment_image_src(node:, old_url:, new_url:)
  new_url = new_url.split('?').first
  node.native_content = node.content.gsub(old_url, new_url)
end