正则表达式建议

时间:2016-08-19 09:27:53

标签: regex string pdf

我想解析PDF文件并按如下所示进行更改。我必须使用哪种正则表达式模式将其作为问题和答案单独捕获?

实际模板

  1. 以下是哪一个......?
  2. 一个。超文本标记语言(HTML)

    湾联合摄影专家组(JPEG)

    ℃。超文本预处理器(PHP)

    d。可扩展样式语言(XSL)

    1. ℃。超文本预处理器(PHP)用于cre ..........
    2. 答案“c”出现在问题编号之后。我想将它们更改为下面的模板。

      所需模板

      问题:155

      以下是哪一个......?

      答案:C

      说明:超文本预处理器(PHP)用于cre ..........

      感谢。

1 个答案:

答案 0 :(得分:1)

这样的事情可能适合您,具体取决于您的软件使用的正则表达式的风格。 发现:

(\d+)\.\s(.*?)\r\n\r\na\..*?\r\nb\..*?\r\nc\..*?\r\nd\..*?\r\n([abcd])\.\s(.*?)\r\n

替换:

Question: $1\r\n\r\n$2\r\n\r\nAnswer: $3\r\n\r\nExplanation: $4

所有问题必须完全相同,格式为4个答案等。