如何在考虑潜在的空白字段的同时使用csv模块从.txt文件中获取数据?

时间:2017-05-10 12:17:17

标签: python python-2.7 csv

我目前正在尝试从以文本文件形式吐出日志的计算机中获取有用数据。我想要获得的相关数据是尺寸A,B和C,左半径和右半径,左和右公差以及单位。

enter image description here

enter image description here

但是,正如您所看到的,有时字段为空。目前,我使用字符串拆分函数来按空格分隔字符串并从那里分配。

npm install npm@latest -g
npm cache clean
npm unistall -g cordova
npm intsall -g cordova

然而,问题在于,如果某些字段为空,则会跳过它们并为它们分配错误的字典键。如果我的代码用于第二张图像中的日志,则左半径数1将错误地分配给self.variables.jobDetails["Dimension A"] = ((strow.split())[1]) self.variables.jobDetails["Dimension B"] = ((strow.split())[2]) self.variables.jobDetails["Dimension C"] = ((strow.split())[3]) self.variables.jobDetails["Radius Left"] = ((strow.split())[4]) self.variables.jobDetails["Radius Right"] = ((strow.split())[5])

查看所有日志,似乎字段条目的最后一位数字始终位于同一位置。希望这会有所帮助。

由于

1 个答案:

答案 0 :(得分:1)

代码的主要问题是您使用的是split()。这会在空白上分割你的数据。它不知道分隔字段的空格和表示空字段的空格之间的区别。

唯一的选择是确定每个字段的宽度。仅使用输出图片就很难准确地做到这一点,但在我看来,你有一行90个字符分成宽度为9,9,9,13,8,15,11,16的字段;其中除了最后一个都是空白或数字。

您不能说,但我猜您已经从数据中选择了正确的行并将其存储在strow中。

所以:

def pick_apart(strow):
   spans =((0, 9), (9, 18), (18, 27), (27, 40), (40, 48), (48, 63), (63, 74), (74, 90))  
   # you will have to double-check this, it's nearly impossible to get right by eye alone
   return list(strow[i:j] for (i,j) in spans)

# This line emulates your process of reading the data into strow
strow = "        0       40       40            1       1              3          3           g-in"
fields = pick_apart(strow)
# If this assertion fails then there are errors in spans that you need to fix
assert (fields==['        0', '       40', '       40', '            1', '       1', '              3', '          3', '           g-in'])


self.variables.jobDetails["Dimension A"] = fields[0]
self.variables.jobDetails["Dimension B"] = fields[1]
self.variables.jobDetails["Dimension C"] = fields[2]
self.variables.jobDetails["Radius Left"] = fields[3]
self.variables.jobDetails["Radius Right"] = fields[4]