我需要将HTML 5视频标记插入到HTML文档的某些位置,并使用Nokogiri进行解析。
由于它不支持HTML 5(afaik),因此它会引发异常,因为该文档在HTML 4.0方面无效。
是否可以关闭验证?
答案 0 :(得分:4)
如果您要显示一些示例代码以及您看到的错误,那将会有所帮助。
Nokogiri应该解析HTML,因为它使用HTML的宽松模式。几年前我转向Nokogiri,因为我有一些HTML和RSS源导致Hpricot爆炸。 Nokogiri偶尔会生气,因为一个页面充满了错误,但至少有办法解决它。拯救异常,然后检查你的doc.errors
,看看Nokogiri认为问题是什么。
这样的事情应该会有所帮助:
require 'nokogiri'
doc = Nokogiri::HTML('<html><body>...</body></html>')
puts doc.errors if (doc.errors.any?)
...