您好我正在尝试使用从Indesign中提取的html代码编译EPUB v2.0。我注意到有很多"特殊字符"无论是在段落的开头还是在段落的末尾。例如
<p class="text_indent0px font_size0_8em line_height1_325 margin_bottom1px margin_left0px margin_right0px sans_serif floatleft">E<span class="small_caps">VELYNE</span>	</p>
这是什么
	
我是否可以摆脱它或用&#34;&#34;替换它?
答案 0 :(得分:0)
	
是标签的ascii代码。所以我猜这些段落都是缩进的。
如果您想用
替换它们,请使用其中的4个
答案 1 :(得分:0)
这将是一个水平标签(即与使用标签键相同)。
如果你想替换它,我建议使用像Sigil(http://sigil-ebook.com/)这样的ePub编辑器进行查找/替换。
答案 2 :(得分:0)
答案 3 :(得分:0)
是用于表示不间断空格的实体
 
空格十进制字符代码
	
水平制表符的十进制字符代码
和	
都代表空格,但
是非破坏意味着多个连续出现不会折叠成一个对于同一个案例,`将折叠到一个空格
	
=约。 4
个空格和约。 8  
个空格
答案 4 :(得分:0)
在HTML编码&#{number}
中,{number}
是ascii代码。因此,	
是一个标签,通常会缩减为HTML中的一个空格,除非您使用CSS(或<pre>
标记)将其视为预格式化文本。
因此,将它替换为非破坏或常规空间是不安全的,除非您可以保证它不会在任何地方显示为标签。
div:first-child {
white-space: pre;
}
<div>	 Test</div>
<div>	 Test</div>
<pre>	 Test</pre>
请参阅https://developer.mozilla.org/en-US/docs/Web/CSS/white-space和http://ascii.cl/
答案 5 :(得分:0)
使用了四种类型的字符参考方案。
&#[0-9]+;
),&#x[a-f0-9]+;
),&[a-z]+;
),.
)。这些转换以相同的方式呈现。但是,编码风格是不同的。例如,如果您需要显示a latin small letter E with diaeresis
,那么您可以使用以下任何约定:
ë
(十进制表示法),ë
(十六进制表示法),ë
(html表示法),ë
(实际角色),同样,如你所说,应该使用什么(a)	
(十进制表示法)或(b)
(html表示法)或(c) 
(十进制表示法) )。
因此,从上面的类比来看,可以说(a),(b)和(c)是三种不同的三种不同字符的符号。
并且,这是为了您的信息,(a)是Horizontal Tab
,(b)一个是non-breaking space
,实际上是 
的十进制表示法和(c) )是普通空格字符的十进制表示法。
现在,在段落末尾的技术space
,只不过是毫无意义的。更好,你可以丢弃所有这些。如果您仍然需要在space
元素中使用<pre>
,而不是<p>
或<div>
。
希望这会有所帮助......