我正在使用OWSP Java编码器库上的Clojure's wrapper清理第三方HTML内容。我准备了一个策略,如果它与某些正则表达式模板匹配,则在MaterialDesign
元素上保留src
属性。 YouTube或Vkontakte嵌入式iframe。
但是,最终的iframe
值已被转义,因此该URL不起作用。这是一个例子。源HTML:
src
结果:
<iframe src='https://vk.com/video_ext.php?oid=-30493961&id=456241043&hash=a3148de1cd04c77b' width='640' height='360' frameborder='0' allowfullscreen></iframe>
我没有找到任何有关如何防止返回的<iframe src="https://vk.com/video_ext.php?oid=-30493961&id=456241043&hash=a3148de1cd04c77b"></iframe>
值被转义的文档。我该怎么办?
PS我的源代码:
src