Mistune Inline Lexar re.compile help

时间:2016-02-22 02:00:10

标签: python regex parsing

我正在使用mistune来解析一些文本,将文档编号超链接到内部站点上的文档管理系统。在https://github.com/lepture/mistune使用wiki_link示例我发现任何用双方括号包围的东西并创建一个iwl锚(来自HP / iManage / Autonomy的交织链接协议)。这很好用,但是,我试图用doc#前缀来识别数字(在#和数字之间有或没有一些空格)。因此,如果文本说dict = {k: foo(v) for k, v in dict.items()} ,则re.compile参数将基于前面的'doc#'识别该数字(范围从低1000到数十亿)。我可以处理在output_interwoven_link方法中拆分#,但是一直在努力使用正则表达式。

总是依靠搜索引擎让我得到一个正则表达式的例子来解决我的正则表达式问题,我自己没有能力制作表达式。我现在如何使用双方括号看起来像:

looking at doc# 25487657 as a sample...

我可以使用的任何指针?

1 个答案:

答案 0 :(得分:2)

如果您想匹配字符串“doc#”后的任何数字,则正则表达式为doc# (\d+)