Question

我有一个类似于

的文本文件

alpha alphabet alphameric

我想只匹配第一个字符串'alpha＆＃39;，没有别的

我有以下代码尝试仅匹配alpha字符串并获取其行号

findWord = re.findall('\\ba\\b', "alpha")

with open(file) as myFile:
for num, line in enumerate(myFile, 1):
    if findWord in line:

        print 'Found at line: ', num

但是我收到以下错误：

TypeError：＆＃39; in＆＃39;需要字符串作为左操作数，而不是列表

Answer 1

您可以稍微修改一下代码

with open(file, 'r') as myFile:
    for num, line in enumerate(myFile, 1):
        if 'alpha' in line.split():
            print 'Found at line', num

输出：

在第1行找到

Answer 2

代码中的问题

re.findall('\\ba\\b', "alpha")提供了匹配的列表，但您在if findWord in line中使用的意思是使用list代替字符串。这就是你得到的错误
通过提供findWord = re.findall('\\ba\\b', "alpha")，您正在搜索不存在的字母字符串中的字符串a

试试这个

import re
#findWord = re.findall('\\ba\\b', "alpha")
#print findWord
with open("data.txt") as myFile:
    for num,line in enumerate(myFile):
        if re.findall('\\balpha\\b', line):

            print 'Found at line: ', num+1

Answer 3

你可以试试这个：

import re
s = "alpha alphabet alphameric"
data = re.findall("alpha(?=\s)", s)[0]

输出：

"alpha"

Python正则表达式字符串匹配文件

3 个答案: