我想解析PDF文件并按如下所示进行更改。我必须使用哪种正则表达式模式将其作为问题和答案单独捕获?
实际模板
一个。超文本标记语言(HTML)
湾联合摄影专家组(JPEG)
℃。超文本预处理器(PHP)
d。可扩展样式语言(XSL)
答案“c”出现在问题编号之后。我想将它们更改为下面的模板。
所需模板
问题:155
以下是哪一个......?
答案:C
说明:超文本预处理器(PHP)用于cre ..........
感谢。
答案 0 :(得分:1)
这样的事情可能适合您,具体取决于您的软件使用的正则表达式的风格。 发现:
(\d+)\.\s(.*?)\r\n\r\na\..*?\r\nb\..*?\r\nc\..*?\r\nd\..*?\r\n([abcd])\.\s(.*?)\r\n
替换:
Question: $1\r\n\r\n$2\r\n\r\nAnswer: $3\r\n\r\nExplanation: $4
所有问题必须完全相同,格式为4个答案等。