正则表达式HTML属性的值

时间:2013-11-29 00:28:45

标签: regex sublimetext2 sublimetext

我有大量的链接看起来像这样:

        <A HREF="http://www.taboola.com/" ADD_DATE="1385139696" ICON="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAABAAAAAQCAYAAAAf8/9hAAACx0lEQVQ4jXWTTWhdZRCGn5nvu+ee5CaxiTGtqUaKiJjYRRFNukhBIgUlCzeuFCy0lZaCUCiuBI8LQXcWRURFUXAjbq0i3fgTaFGktaVmowuRGhqsNya59557zjfjIkosxHc18MAsnplX2I7AJ7o1XnMoHPBtVghMyw4MoFB2TKHg8v8MtuHM2alsfOghsFws3CyXf11itdgAYKwYyWfuetiwXeZxrb764/e0X28DKgDNQ++eamTNlyWE2wkZ1B3MwrXNtc7TUA22bhv5QNXuI+RC6pFMfi675fNp6fg5Ye6dx4eG83MawOp6VdBl9/qgZgPRqv4K7lGz5rhV3b4QL5un6dDIW1ZXGxtrm/PazPWoCm5GKsv6hfXzRw7VST7EJYnYhCijuFtV+dn180fmyiq96p5MQhhqNuMzqrGxFxy3qq666fI/4r5BJAA1buaG1CZfURQEkYuYieAWGuxTr+q/UHGRRiCGPVCYO9M4vuVYEFVikLspCjO3SSSAI2a0g0wuZiFvPqkkCSoPxn2LMzGGZ0V80JI7IlEEFH8gm3pit8Z4LCjjjkjZqV4K9tv6Fd87MxqygdnQHNwTmyOzojKYzDu9bv9oEi6EkB3WbGBMB0fnVeMd7iplr/9avXT8LQECkJh7fzbP02Nissvxdq/b/4zvTl0CiAffXmhketiRYdz/6PXTF1w4uQSIAJI9+tErkbrX6fQ/5eKJZcB2/r4zLWbv3z8wkj2VyvKH/tfPfRwB1+CPZK2JBQ03XvSF91ZdGr8grIh7BwwnDIFPiqV7Nei4tiakX10/DRAB6uRf1t32AYn5WNAwCT65dQHH3QFFZKs9bjX15s3rnvzKrV048OY9zeGBxdiI8yK2H6/HQXLAEN109IYnu1Ql+7ZaXf+cn07/DmT/LpBb6rn7TIupO8fQxjApJnp/trm60oY3yv8IEYC/AVWrRrXbUwqeAAAAAElFTkSuQmCC">Taboola - Content you may like</A>

我想删除整个ICONADD_DATE属性及其值。

我正在使用带有正则表达式查找/替换的sublime但我不确定如何编写正则表达式来抓取ICON=""之间的所有内容

任何帮助将不胜感激!

1 个答案:

答案 0 :(得分:0)

这应该有效(必要时转义引号):

ICON="[^"]*"

ICON=\"(.*)"无效的原因是正则表达式可以“贪婪”。这意味着如果它可以匹配更多的字符串以满足它的模式。

您可以指定非贪婪搜索,例如ICON=".*?",也可以在上述答案中明确声明非引号原子上的匹配。