正则表达式:根据各种数字范围添加书签html标签

时间:2013-01-09 23:48:27

标签: html regex numbers notepad++ replace

我有一些html页面,其中包含以下几个经文:

verses 2-5
verses 11-15
verses 21-23

我需要在“verses”之前为每个数字添加代码 是

<a name="2"></a><a name="3"></a><a name="4"></a><a name="5"></a>verses 2-5

所以需要给出数字的范围,并在开始之前添加:

<a name=""></a>

对于范围内的每个数字..

我使用notepad ++来搜索和替换。

2 个答案:

答案 0 :(得分:0)

你可以用2位数的10到99节这样做:

Search: verses (\d)(\d)-
Replace: <a name="$1">verses $1$2-</a>

对于3位以上的数字,请为额外数字添加另一个组并进行类似处理。

这种额外的复杂性是必需的,因为notepad ++不支持预测AFAIK。

答案 1 :(得分:0)

您需要一个脚本才能执行此操作。我掀起了一个简单的Ruby脚本来做它。在示例文本中使用它,得到您的输出。只需下载Ruby,将其粘贴到该文本目录中的文件中,并将verses.txt行替换为您的文件名。然后从命令行运行它,如:ruby ./script.rb

d = File.read('./verses.txt')
c = d[0..d.length]
c.scan(/(verses\s+\d+-\d+)/) do |n|
  n.each do |a|
    a.scan(/(\d+-\d+)/) do |nums|
      z = nums.to_s.split(/-/)
      st=''
      in1 = z[0].gsub(/\["/, '').to_i
      in2 = z[1].chomp("\"]").to_i
      (in1..in2).each do |index|
        st += "<a name=\"#{index}\"></a>"
      end
      b = st + a;
      d.gsub!(a, b)
    end
  end
end
puts d
f = File.new('verses2.txt', "w")
f.write(d)

根据您的请求,这是一个修改,它将覆盖打开的文件并在目录中的所有文件上运行。为方便起见,我不会进行目录输入,因此将脚本放在所有文件的目录中以运行它。这是:

Dir.entries('.').each do |entry|
    entry.scan(/.*.html/) do
        |fn|
        d = File.read('./' + fn.to_s)
        c = d[0..d.length]
        c.scan(/(verses\s+\d+-\d+)/) do |n|
          n.each do |a|
            a.scan(/(\d+-\d+)/) do |nums|
              z = nums.to_s.split(/-/)
              st=''
              in1 = z[0].gsub(/\["/, '').to_i
              in2 = z[1].chomp("\"]").to_i
              (in1..in2).each do |index|
                st += "<a name=\"#{index}\"></a>"
              end
              b = st + a;
              d.gsub!(a, b)
            end
          end
        end
        puts d
        f = File.new('./' + fn.to_s, "w")
        f.write(d)
    end
end

我会考虑如何进行阿拉伯语编码。这将在所有文本文件上运行,如果它们具有不同的扩展名或具有相似的名称,请告诉我,我将更新脚本。

这应该完全有效,只是测试它。如果有问题,请告诉我。