如何使用正则表达式从字符串中提取某个数字?

时间:2015-09-25 18:06:09

标签: regex epub adobe-indesign calibre

我认为这可能很容易,但我没有时间学习如何去做。

在html文件中,我有一段特定的段落,请说:

<p class="footnote"></p>

“p”标记后面跟着数字,每个实例都会增加一个数字。假设第一个数字是“43”。我希望这一系列数字从1开始,所以我需要从所有段落中减去42。

例如,我想从:

<p class="footnote">43. Lorem</p>
<p class="footnote">44. Ipsum</p>. 
<p class="footnote">45. Dolor</p>. 

<p class="footnote">1. Lorem</p>
<p class="footnote">2. Ipsum</p>. 
<p class="footnote">3. Dolor</p>. 

我该怎么办?

2 个答案:

答案 0 :(得分:0)

使用javascript获取文本(虽然我将使用jQuery),拆分文本,获取第一个元素,然后转换为整数。

sudo apachectl stop

答案 1 :(得分:0)

如果您正在寻找能够处理<p class="footnote">43. Lorem</p>的正则表达式,答案是don't parse HTML with regex

假设您从标签中提取了字符串43. Lorem,并且想要输出一个数字,那么这取决于您的要求:

要查找任何数字:\d+

要在开头找到任何数字:^\d+

要查找任意数字,后跟句点:\d+\.

更完整的解决方案需要有关该问题的更多详细信息,包括您要使用的编程语言。