是否可以通过Capybara / Nokogiri找到特定于Outlook的标记?
鉴于以下标记(将<% %>
标记处理为常规HTML)
...
<div>
<!--[if gte mso 9]>
<v:rect
xmlns:v="urn:schemas-microsoft-com:vml" fill="true" stroke="false"
style="width:<%= card_width %>px;height:<%= card_header_height %>px;"
>
<v:fill type="tile"
src="<%= avatar_background_url.split('?')[0] %>"
color="<%= background_color %>" />
<v:textbox inset="0,0,0,0">
<![endif]-->
<div>
如何获取<v:fill ../>
代码列表? (或者如果在条件注释中找到标记是一个问题,我怎么能得到整个注释)
我试过以下
doc.xpath('//v:fill')
*** Nokogiri :: XML :: XPath :: SyntaxError Exception:ERROR:Undefined namespace prefix:// v:fill
我是否需要以某种方式注册vml名称空间?
编辑 - 遵循@ThomasWalpole方法
doc.xpath('//comment()').each do |comment_node|
vml_node_match = /<v\:fill.*src=\"(?<url>http\:[^"]*)"[^>]*\/>/.match(comment_node)
if vml_node_match
original_image_uri = URI.parse(vml_node_match['url'])
vml_tag = vml_node_match[0]
handle_vml_image_replacement(original_image_uri, comment_node, vml_tag)
end
我的handle_vml_image_replacement
最终会调用以下replace_comment_image_src
def self.replace_comment_image_src(node:, comment:, old_url:, new_url:)
new_url = new_url.split('?').first # VML does not support URL with query params
puts "Replacing comment src URL in #{comment} by #{new_url}"
node.content = node.content.gsub(old_url, new_url)
end
然而感觉评论实际上不再是评论&#34;我有时可以看到HTML好像被转义了...我很可能使用错误的方法来改变Nokogiri的评论文本?
答案 0 :(得分:0)
这是我用于电子邮件拦截器的最终代码,感谢@Thomas Walpole和@sschmeck在此过程中获得的帮助。
我的目标是将VML标记中的图像(链接到localhost)替换为全局可用图像,以便使用MOA或Litmus等服务进行测试
doc.xpath('//comment()').each do |comment_node|
# Note : cannot capture beginning of tag, since it might span across several lines
src_attr_match = /.*src=\"(?<url>http\:[^"]*)"[^>]*\/>/.match(comment_node)
next unless src_attr_match
original_image_uri = URI.parse(src_attr_match['url'])
handle_comment_image_replacement(original_image_uri, comment_node)
end
稍后调用(根据源图像类型选择网址替换策略后):
def self.replace_comment_image_src(node:, old_url:, new_url:)
new_url = new_url.split('?').first
node.native_content = node.content.gsub(old_url, new_url)
end