Question

我对编程非常陌生。我搜索过这个网站和谷歌，但似乎无法解决这个问题。我找到了类似的主题，但仍然无法解决这个问题......

我有一个包含非常大的单词列表的文本文件。这些单词都已编号，并且还按名词＆＃39;，＆＃39;形容词＆＃39;进行了分类。或者＆＃39;动词＆＃39;。

我想从此列表中提取单词，但排除数字和以下三个单词，＆＃39;名词＆＃39;，＆＃39;形容词＆＃39;和＆＃39;动词。＆＃39;

我知道我需要使用插入符号字符，但似乎无法使其正常工作。

import re
import os

textFile = open('/Users/MyComputer/wordList.txt')

textFileContent = textFile.read()

wordFinder = re.compile(r"""
[a-z]+ # finds words
[^noun|adjective|verb] # THIS IS WRONG
""", re.VERBOSE | re.I)

regexResults = wordFinder.findall(textFileContent)

Answer 1

import re

with open('wordList.txt') as f:
    for line in f:
        if re.search("^(?!noun|adjective|verb|\d)", line):
            print(line)

Answer 2

我建议您使用negative look-ahead，这可以提供此正则表达式：

[^a-z](?!noun|adjective|verb)([a-z]+)

Python正则表达式用于查找单词，也排除了特定单词

2 个答案: