Question

我正在开发一个个人项目，旨在打开用户指定的文件，然后接收用户输入并将该输入用作正则表达式来搜索文件。这样做的目的是更深入地了解正则表达式如何工作，以及如何将它们合并到程序中。

我的问题在于用户给我的所有输入都被格式化为字符串。所以（纠正我，如果我错了），[a-z] +的输入将导致搜索表达式“[a-z] +”。如果我想将r“[a-z] +”作为我的搜索表达式，这是一个问题，因为将其作为用户输入将给我“r”[a-z] +“”（再次，如果我错了，请纠正我）。这显然不适用于正则表达式。如何格式化输入以使r“[a-z] +”的输入保持r“[a-z] +”？

这是有问题的代码部分。函数参数中的textFile是从程序的另一部分导入的，用于正则表达式搜索：

def new_search_regex(textFile):
    """Query for input, then performs RegEx() with user's input"""
    global totalSearches
    global allSearchResults

    # ask user for regular expression to be searched
    expression = raw_input("Please enter the Regular Expression to be searched: ")

    # perform initial regex search
    foundRegex = re.search(expression, textFile)

    # if Regex search successful
    if foundRegex != None:

        # Do complete regex search
        foundRegex = re.findall(expression, textFile)

        # Print result
        print "Result: " + str(foundRegex)

        # Increment global total
        totalSearches += 1

        # create object for result, store in global array
        reg_object = Reg_Search(totalSearches, expression, foundRegex)
        allSearchResults.append(reg_object)
        print "You're search number for this search is " + str(totalSearches)        # Inform user of storage location

    # if Regex search unsuccessful
    else:
        print "Search did not have any results."

    return

注意：最后，我为结果创建了一个对象，并将其存储在全局数组中。

现在也假设用户正在进入非系统销毁正则表达式。我很快就会开始添加错误检查，例如在用户输入上使用.escape。这将如何影响我的情况？它是否会对用户造成严重破坏，包括“在输入中？”

Answer 1

r"..."语法仅用于防止python编译器解释转义序列（例如，\n转换为换行符）。一旦被编译器解析，它就会成为常规字符串。

我们使用`raw_input读取用户的输入，编译器不执行任何转义序列解释。您无需执行任何操作，字符串已正确解释。

您可以自己测试一下：

>>> x = r"[a-z]+\n"
>>> y = raw_input("")
[a-z]+\n
>>> x == y
True

Answer 2

直接来自Python http://docs.python.org/2/library/re.html：

import re
m = re.search(regexp_as_string, payload)
m.group(0) #first occurence of the pattern

使用用户输入作为正则表达式搜索表达式

2 个答案: