我有一条新闻文字,其中我获得了我不需要的HTML属性。如何删除红宝石中的短语,如
img width =" 750" ALT =" 4.jg" C =" /unload/medialiy/df6/4.jg"高度=" 499" 标题= 4.jg"
img width =" 770" ALT =" 5.jg" C =" /unload/medialiy/ty6/5.jg" 高度=" 499"标题= 5.jg"
所以我需要一些像news.sub('/img*jg"/, '')
这样的正则表达式。但它没有用。
答案 0 :(得分:1)
我会用:
img .*\.jg"
如果你想在正则表达式中说“任意数量的任何符号”,请使用.*
点表示任何符号,星号表示任何数量。
但你确定你不想包括角撑吗?
<img .*\.jg">
顺便说一句,如果属性的顺序会改变怎么办?然后你将无法匹配img标签。我们真的需要带有.jg"
子字符串的img标记。
<img [^>]*\.jg"[^>]*>
答案 1 :(得分:0)