我从word文档中提取问题。 word文档中的问题编号如下:
1.) Gauri Khanna, who was born on September ........
2.) Rohit Arora was born on October 10, 1987.......
答案选项的子弹编号如下:
a) First option
b) Second option
b) Third option
c) Forth option
我想要两个正则表达式来提取问题及其可能的选项。
到目前为止,我对这些问题进行了尝试。
(\d\.\))+ #this only matches the first occurrence
当谈到正则表达式并且谷歌和堆栈溢出的搜索对我没有帮助时,我是个假人。谢谢
答案 0 :(得分:1)
尝试此提取问题。
r'[0-9]\..+'
对于答案。
r'[a-z].+'