格式化正则表达式以匹配目录

时间:2018-11-12 22:44:00

标签: regex python-3.x

我需要从Github存储库中的自述文件中提取目录。我使用python中的“请求”模块从自述文件中提取文本,现在我正尝试使用正则表达式匹配目录。这是我提出问题的代码:

import requests
import os
import sys
import re

# Get readme page info via Github API.
rm_pg_url = ('https://api.github.com/repos/PillarOfSand/Projects/readme')
rm_pg = requests.get(rm_pg_url, timeout = 10)
rm_pg_content = rm_pg.json()

# Isolate download page. Get actual text from readme file.
download_url = rm_pg_content['download_url']
real_rm = requests.get(download_url, timeout = 10)
all_text = real_rm.text

toc_regex = re.compile(r'(?s)^## Table of Contents.*security\)$')
table_of_contents = toc_regex.search(all_text)

最后两行是我要特别说明的内容。 table_of_contents变量的类型为None,因此我正在使用的正则表达式不匹配任何内容。我正在搜索的文本字符串可以在以下URL中找到:

ReadME Text

所以,我的实际问题是,我哪里出问题了?如何调整我的正则表达式以匹配整个目录?

谢谢。

0 个答案:

没有答案