这可能是一个奇怪的问题,但让我详细说明。我有一个域列表,我需要检查并获取其父域。例如:来自configuration.apple.com和help.apple.com,我只想保留apple.com。有没有办法用正则表达式做到这一点?我有数百个领域需要操纵,因此这将使生活变得更加轻松。
由于子域的不同性质,我无法使用静态索引。任何建议/帮助表示赞赏。我尝试使用的逻辑基本上是遍历每个字符串以及第一个“。”时。找到后,删除所有以前的字符和“。”但我不知道该如何做。提前致谢。
答案 0 :(得分:3)
您实际上不需要在这里使用正则表达式。您可以在字符串上使用.find(".")
以获取“。”的第一个位置。字符,然后从该字符之后的字符串开始索引。
domains = ["help.apple.com", "info.microsoft.com", "configuration.apple.com"]
parents = []
for domain in domains:
parents.append(domain[domain.find(".") + 1:])
print(parents)