正则表达式删除<! - [CDATA [

时间:2016-10-09 00:59:58

标签: python html regex cdata

我有这个正则表达式:

</title>[\s]*<description[^>]*>(.*?)<img

采用字符串:

<title>Insane price of last Ford Falcon V8s</title>
        <description><![CDATA[FORD dealers are charging a staggering $30,000 more than the recommended retail price — up from $60,000 to $90,000 — for the final Falcon V8 sedans as buyers try to secure a future classic.<img alt="" border="0" src="https://pixel.wp.com/b.gif?host=www.couriermail.com.au&#038;blog=87782261&#038;post=1205849&#038;subd=couriermailatnewscorpau&#038;ref=&#038;feed=1" width="1" height="1" />]]></description>

如何编辑此正则表达式以删除<![CDATA[

1 个答案:

答案 0 :(得分:0)

正则表达式是非常强大的工具。这包括在代码中出现错误的高风险,特别是当您不知道如何正确处理它们时(这似乎就是这种情况)。

如果有必要,您应该首先使用Python的内置字符串类,而使用RegEx。

如果您有字符串my_str,则以下代码替换my_str中的子字符串:

my_str = "hello world"
my_str.replace("lo", "")
>>> "hel world"

str.replace搜索&#34; lo&#34;在这种情况下,将其替换为&#34;&#34; (没有,因此删除它)。当然,您可以根据需要更改此值。

看看Python's documention for Strings