从python中的日志文件中读取特定列

时间:2014-04-23 10:52:05

标签: python readfile

我正在尝试使用Python读取此文件,但我不断获取ValueError: Need more than 0 values to unpack。想知道是否有人可以提供帮助?

我需要读入此文件并选择特定的列,以便稍后我可以将这些值放到高图上。

在文件中,第一行是空的,这是我认为可能导致此错误,但我不知道如何解决这个问题。这就是文件的样子:

  

Wed Apr 23 00:00:13 GMT 2014
  ID USER PR NUM VIR RE MEH S CPU MM TIMESTA INFO
  1555 root 19 0 3162m 1.7g 8192 S 34.6 22.1 955:04.48资源
  1566 nobody 19 0 2172m 2.9g 8192 S 22.6 33.1 955:04.48 resource2

这是我现在使用的代码:

import csv

r = csv.reader(open("C:/test.log"))

ID = []
user = []
PR =[]
NUM = []
VIR = []
RE = []
MEH = []
S = []
CPU = []
MM = []
TIMESTA = []
INFO = []

for ID, user, PR, NUM, VIR, RE, MEH, S, CPU, MM, TIMESTA, INFO in r:
    ID.append(ID)
    user.append(user)
    PR.append(PR)
    NUM.append(NUM)
    VIR.append(VIR)
    RE.append(RE)
    MEH.append(MEH)
    S.append(S)
    CPU.append(CPU)
    MM.append(MM)
    TIMESTA.append(TIMESTA)
    INFO.append(INFO)

print ID, CPU, MM, INFO

由于

2 个答案:

答案 0 :(得分:0)

首先,您不能将for循环中的临时值命名为与要存储信息的列表相同。该日志文件也不是CSV文件。 CSV表示逗号分隔值,例如

a, b, c

你想要的是这样的。

log = open('C:/test.log', 'r').read().splitlines() # read the file, split by line, and remove extraneous whitespace.
log = log[2:] # get rid of 1st and second lines.
log = [line.split(' ') for line in log] # split each line by spaces
ID = []
users = []
# etc.
for line in log:
    ID.append(line[0])
    users.append(line[1])
    # etc.

我没有测试过这个,但它应该可以工作:)祝你好运。

答案 1 :(得分:0)

我想你想这样做。

import csv
from itertools import islice

rs = csv.reader(open("C:/test.log", 'rb'), delimiter=' ')

IDs      = []
users    = []
PRs      = []
NUMs     = []
VIRs     = []
REs      = []
MEHs     = []
Ss       = []
CPUs     = []
MMs      = []
TIMESTAs = []
INFOs    = []

for ID, user, PR, NUM, VIR, RE, MEH, S, CPU, MM, TIMESTA, INFO in islice(rs, 2, None):
    IDs.append(ID)
    users.append(user)
    PRs.append(PR)
    NUMs.append(NUM)
    VIRs.append(VIR)
    REs.append(RE)
    MEHs.append(MEH)
    Ss.append(S)
    CPUs.append(CPU)
    MMs.append(MM)
    TIMESTAs.append(TIMESTA)
    INFOs.append(INFO)

print IDs, CPUs, MMs, INFOs

输入(test.log中):

Wed Apr 23 00:00:13 GMT 2014
ID USER PR NUM VIR RE MEH S CPU MM TIMESTA INFO
1555 root 19 0 3162m 1.7g 8192 S 34.6 22.1 955:04.48 resource
1566 nobody 19 0 2172m 2.9g 8192 S 22.6 33.1 955:04.48 resource2

输出:

['1555', '1566'] ['34.6', '22.6'] ['22.1', '33.1'] ['resource', 'resource2']