Question

我尝试使用正则表达式删除与我的数据集中的类型名称绑定的特定键代码。然而，到目前为止，我已经摆脱了大部分的密码，但留下了一些字母，我不知道为什么。在检查时，似乎主要是在其后面有一个字母为0的情况下遇到麻烦，例如＆＃34; / m / 0lxr＆＃34;留下lxr。

如果有人知道我将如何解决这个问题，请告诉我！

这是我到目前为止的代码。

def prepare(self, word): 
    word = re.sub(r'//', "", word)
    word = re.sub(r'/\u[0-9][a-z]', "", word)

    word = re.sub(r'/.', "", word) 
    word = re.sub(r'/,', "", word) 
    word = re.sub(r'/!', "", word) 
    word = re.sub(r'/?', "", word) 
    word = re.sub(r'/{', "", word)

    word = re.sub(r"'", "", word)
    word = re.sub(r"//m//[0-9][a-z]+", "", word) 
    word = re.sub(r'[0-9][a-z]+', "", word)
    word = re.sub(r'[a-z][0-9]+', "", word)

    return word

Answer 1

您可以使用ast.literal_eval：

import ast
s = '{"/m/0lsxr":"Crime Fiction"}'
final_output = ast.literal_eval(s).values()
print(final_output)

输出：

['Crime Fiction']

Answer 2

试试这个

word="/m/0lsxr:Crime Fiction"
re.sub(r'.*:(\w*)',r'\1',word)

Python正则表达式 - 删除特定模式

2 个答案: