我正在使用Ruby on Rails,有没有办法使用sanitize或equal方法从字符串中去除html
并且只在输入标记的value属性中保留文本?
答案 0 :(得分:166)
如果我们想在模型中使用它
ActionView::Base.full_sanitizer.sanitize(html_string)
这是“strip_tags”方法中的代码
答案 1 :(得分:131)
strip_tags
中有一个ActionView::Helpers::SanitizeHelper
方法:
http://api.rubyonrails.org/classes/ActionView/Helpers/SanitizeHelper.html#method-i-strip_tags
编辑:为了获取value属性中的文本,你可以使用带有Xpath表达式的Nokogiri之类的东西来获取字符串。
答案 2 :(得分:20)
是的,请致电:sanitize(html_string, tags:[])
答案 3 :(得分:15)
ActionView::Base.full_sanitizer.sanitize(html_string)
标签和属性的白名单可以指定为下面的
ActionView::Base.full_sanitizer.sanitize(html_string, :tags => %w(img br p), :attributes => %w(src style))
以上语句允许标记 img , br 和 p 以及属性 src 和样式强>
答案 4 :(得分:4)
我使用了Loofah库,因为它适用于HTML和XML(包括文档和字符串片段)。它是html清洁剂宝石背后的引擎。我只是简单地粘贴代码示例来说明使用它是多么简单。
unsafe_html = "ohai! <div>div is safe</div> <script>but script is not</script>"
doc = Loofah.fragment(unsafe_html).scrub!(:strip)
doc.to_s # => "ohai! <div>div is safe</div> "
doc.text # => "ohai! div is safe "
答案 5 :(得分:1)
这个怎么样?
white_list_sanitizer = Rails::Html::WhiteListSanitizer.new
WHITELIST = ['p','b','h1','h2','h3','h4','h5','h6','li','ul','ol','small','i','u']
[Your, Models, Here].each do |klass|
klass.all.each do |ob|
klass.attribute_names.each do |attrs|
if ob.send(attrs).is_a? String
ob.send("#{attrs}=", white_list_sanitizer.sanitize(ob.send(attrs), tags: WHITELIST, attributes: %w(id style)).gsub(/<p>\s*<\/p>\r\n/im, ''))
ob.save
end
end
end
end
答案 6 :(得分:0)
这在 Rails 6.1.3 中对我有用:
.errors-description
= sanitize(message, tags: %w[div span strong], attributes: %w[class])