在HTML标记之外查找直接双引号

时间:2014-05-25 03:46:41

标签: python html regex

我正在编辑一个电子书,其中散布在文本中的多个直双引号中没有明显的规则。是否有正则表达式可以:

1)找到HTML标签的直接双引号 仅限外部
2)可能用卷曲的替换它们?

已经发布了类似的问题,但答案对我没有用。

修改即可。示例:

<?xml version="1.0" encoding="utf-8" standalone="no"?>
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en">

<head>
<title>PART II</title>
<link href="../Styles/template.css" rel="stylesheet" type="text/css" />
</head>

<body>
<p class="centertop2"><span class="big171">CHAPTER 20</span></p>

<p class="para">“Blah blah blah," said A, "blah blah?” (description) “Blah blah.” To which B replied: "Blah blah."</p>  

如果您查看对话框,您会看到与直线引号混合的曲线引号。我只想在文本中找到直引号,并避免使用HTML标记中的引号。这可能吗?

0 个答案:

没有答案