我正在处理一项作业,我需要使用正则表达式标记数学表达式。 例如,给定输入是 (2-1),分词器应该能够分词为 ['(', '2', '-', '1', ')']。但是如果表达式是 (2--1),分词器应该能够分词为 ['(', '2', '-', '-1', ')']。 截至目前,我的代码只能处理 (2--1) 的第二种情况。 这是我的代码:
def Tokenizer(self, untokenizedExpression):
import re
tokenize = re.compile('-?\d+\.?\d*|[**//]?[^0-9])')
tokenizedExpression = re.findall(tokenize, untokenizedExpression)
print(tokenizedExpression)
print()
有人知道我如何解决这个问题吗?