将字符串传递到包含特定字符以进行词法分析的“字母”

时间:2018-09-15 12:01:13

标签: python-3.x token lexical-analysis dfa

在python中,我想知道如何传递检查字符串:

  
      
  1. 如果某些内容仅包含字母数字字符
  2.   
  3. 如果某些内容仅包含数字
  4.   
  5. 如果某些内容既不包含字母数字字符也不包含数字。
  6.   

我很难弄清楚语法,我特别需要像这样的字符串,而不是使用内置函数进行词法分析。以下内容将清除我要执行的操作的想法:

alphanumeric=r'[a-zA-Z]+'
digit=r'[0-9]'
other=r'![a-zA-Z_0-9]'
alphabet = {alphanumeric ,digit,other}

该字母以及其他DFA属性将通过用户定义的字符串输入到dfa对象的函数run_with_input_list()中。 dfa类的结构如下:

class DFA:
    current_state = None

    def __init__(self, states, alphabet, transition_function, start_state, accept_states):  #5-tupple
        self.states = states
        self.alphabet = alphabet
        self.transition_function = transition_function
        self.start_state = start_state
        self.accept_states = accept_states
        self.current_state = start_state
        return

    def transition_to_state_with_input(self, input_value):
        if ((self.current_state, input_value) not in self.transition_function.keys()):
            self.current_state = None
            return
        self.current_state = self.transition_function[(self.current_state, input_value)]
        return

    def in_accept_state(self):
        if self.current_state in self.accept_states:
            print("String Accepted")
        else:
            print("String Rejected")

    def go_to_initial_state(self):
        self.current_state = self.start_state
        return

    def run_with_input_list(self, input_list):
        self.go_to_initial_state()
        for inp in input_list:
            self.transition_to_state_with_input(inp)
            continue
        return self.in_accept_state()

    pass

    def validity(self,input_list):   #checking whether the input string is valid
        for a in input_list:
            if a in self.alphabet:
                continue
            else:
                print("Invalid String")
                return 0
        return 1

3 个答案:

答案 0 :(得分:1)

我不太了解“假冒”的含义,但是可以使用以下方法:

1)检查它是否仅包含字母

print("abcd".isalpha()) #True
print("abcd123".isalpha()) #False
print("123".isalpha()) #False

2)检查是否仅包含数字

print("123".isnumeric()) #True
print("abcd".isnumeric()) #False
print("abcd123".isnumeric()) #False

3)检查是否仅包含字母/数字

print("abc123".isalnum()) #True
print("abc???".isalnum()) #False

答案 1 :(得分:0)

Python正则表达式已经对此具有特殊字符-数字包含\d字母数字包含\w,非字母数字字符具有\W

参考:https://docs.python.org/3/howto/regex.html

答案 2 :(得分:0)

Python为此类操作提供了标准帮助器,请看以下示例:

def what_is(s):
    is_num = s.isnumeric()
    is_alpha = s.isalpha()
    is_other = not is_num and not is_alpha
    return is_num, is_alpha, is_other


def main():
    alpha = "Ciao"
    num = "0102"
    other = "£*+]"
    print(what_is(alpha))
    print(what_is(num))
    print(what_is(other))