使用数字处理字符串会导致Python中出现'ValueError:int()错误文字无效

时间:2015-10-30 06:55:57

标签: python

所以基本上我们给出了一个看起来像这样的文本:

20
08 02 22 97 38 15 00 40 00 75 04 05 07 78 52 12 50 77 91 08
49 49 99 40 17 81 18 57 60 87 17 40 98 43 69 48 04 56 62 00
81 49 31 73 55 79 14 29 93 71 40 67 53 88 30 03 49 13 36 65
52 70 95 23 04 60 11 42 69 24 68 56 01 32 56 71 37 02 36 91
22 31 16 71 51 67 63 89 41 92 36 54 22 40 40 28 66 33 13 80
24 47 32 60 99 03 45 02 44 75 33 53 78 36 84 20 35 17 12 50
32 98 81 28 64 23 67 10 26 38 40 67 59 54 70 66 18 38 64 70
67 26 20 68 02 62 12 20 95 63 94 39 63 08 40 91 66 49 94 21
24 55 58 05 66 73 99 26 97 17 78 78 96 83 14 88 34 89 63 72
21 36 23 09 75 00 76 44 20 45 35 14 00 61 33 97 34 31 33 95
78 17 53 28 22 75 31 67 15 94 03 80 04 62 16 14 09 53 56 92
16 39 05 42 96 35 31 47 55 58 88 24 00 17 54 24 36 29 85 57
86 56 00 48 35 71 89 07 05 44 44 37 44 60 21 58 51 54 17 58
19 80 81 68 05 94 47 69 28 73 92 13 86 52 17 77 04 89 55 40
04 52 08 83 97 35 99 16 07 97 57 32 16 26 26 79 33 27 98 66
88 36 68 87 57 62 20 72 03 46 33 67 46 55 12 32 63 93 53 69
04 42 16 73 38 25 39 11 24 94 72 18 08 46 29 32 40 62 76 36
20 69 36 41 72 30 23 88 34 62 99 69 82 67 59 85 74 04 36 16
20 73 35 29 78 31 90 01 74 31 49 71 48 86 81 16 23 57 05 54
01 70 54 71 83 51 54 69 16 92 33 48 61 43 52 01 89 19 67 48

它是一个20x20维的正方形,你必须在正整数网格中找出相同方向(水平,垂直或对角线)上四个相邻数字的最大乘积。这就是我所拥有的:

def main():
  # open file for reading

  in_file =  open ("./Grid.txt", "r")
  dimension = in_file.readline()
  dimensions = int(dimension)
  greatest = 0
  grid = ''
  largest = [0, 0, 0, 0]

  for i in range (0, dimensions):
    grid = grid + in_file.readline()

  grid = grid.strip() 
  grid = grid.replace(" ","")
  i = 0
  j = 0 

  print(int(grid[i]))
  for i in range (0, dimensions * 2 + (dimensions - 1)):
    for j in range (0, dimensions * 2 + (dimensions - 1) - 3):
      if (int(grid[i])*10 + int(grid[i+1]))*(int(grid[i+2])*10 + int(grid[i+3]))*(int(grid[i+4])*10 + int(grid[i+5]))*(int(grid[i+6])*10 + int(grid[i+7])) > largest[0]:
        largest[0] = (int(grid[i])*10 + int(grid[i+1]))*(int(grid[i+2])*10 + int(grid[i+3]))*(int(grid[i+4])*10 + int(grid[i+5]))*(int(grid[i+6])*10 + int(grid[i+7]))

  print(max(largest))    

main()

我知道它非常复杂,但基本上,我不知道如何让这组数字看起来像一个数字列表(一个数组)......所以我基本上最终不得不编号。例如,第一个数字是02,所以我多次0乘10,并添加2 ...无论如何,问题是我得到ValueError:int()的无效文字,基数为10:'\ n'。任何帮助表示赞赏!

1 个答案:

答案 0 :(得分:5)

问题在于这一行:

grid = grid + in_file.readline()

将其更改为:

grid = grid + in_file.readline().strip()  # you must strip each line

您在阅读时需要strip每行,但是目前,您只需strip ping最终字符串,这会留下您在每行中存在的所有空格。最终,您的代码会尝试将非数字字符(例如空格,换行符)转换为数字并运行到错误中。

修复后,运行它会产生以下输出:

➜  /tmp  ./test.py
0
1614

其他建议

肯定需要在发布之前使代码更具可读性。看起来很痛苦,甚至更痛苦的调试......我几乎把它留在了那里。

一个可能的开始可能是复杂的for循环。考虑:

for i in range (0, dimensions * 2 + (dimensions - 1)):
    for j in range (0, dimensions * 2 + (dimensions - 1) - 3):
        tmp = int(grid[i])   * 10 \
            + int(grid[i+1]) * int(grid[i+2]) * 10 \
            + int(grid[i+3]) * int(grid[i+4]) * 10 \
            + int(grid[i+5]) * int(grid[i+6]) * 10 \
            + int(grid[i+7])

        if tmp > largest[0]:
            largest[0] = tmp

首先,它让我看到罪魁祸首是int(grid[i+7])指令,而之前它会在抱怨时展示整条线并且没有提供信息。

第二次,它不会两次完全相同的计算。它使用临时变量。

第三次,您应该考虑将grid变量转换为实际网格(例如数组数组)。目前,它只是一个字符串,因此该名称具有误导性。

第四,当您将grid转换为实际网格时,您可以使用列表推导并将值直接转换为数字,如下面的简短示例所示:

>>> line = '12 34 5 6 78 08 1234'
>>> [int(v) for v in line.split()]
[12, 34, 5, 6, 78, 8, 1234]    # array of integers, not strings
>>>

它会在转到其他部分之前为您节省转换,并在代码更简单的过程中为您验证数据,而不是等待复杂的计算爆炸。