Python和Excel读取文件问题

时间:2011-07-18 08:45:10

标签: python string floating-point

我很抱歉,如果这是一个愚蠢的问题,但我已经在这个工作了几个小时,我无法使它工作。请帮忙!

我有一个源自Excel的.txt文件。该文件包含字符串和数字,但我只对数字感兴趣,这就是为什么我跳过第一行而我只阅读第2列。

   from numpy import *

我将它加载到Python中

    infile = open('europenewMatrix.txt','r')
    infile.readline() # skip the first line
    numbers = [line.split(',')[2:] for line in infile.readlines()]
    infile.close()

因为我需要对此进行计算,我将其转换为矩阵:

    travelMat = array(numbers)

好的,但这并没有将字符串转换为整数,所以我手动执行:

    for i in xrange(len(numbers)):
        for j in xrange(len(numbers)):
            travelMat[i,j] = int(self.travelMat[i,j])
        #end for

此时,我希望我的所有条目都是整数 但如果我这样做

    print 'type is',type(self.travelMat[1,2]) 

答案是:

type is <type 'numpy.string_'>

如何真正将所有条目转换为整数? 非常感谢!

3 个答案:

答案 0 :(得分:2)

在创建数组之前,

在读取数字时转换数字:

infile = open('europenewMatrix.txt','r')
infile.readline() # skip the first line
numbers = []
for line in infile:
    numbers.append([int(val) for val in line.split(',')[2:]])
infile.close()
travelMat = array(numbers)

答案 1 :(得分:1)

如果您正在使用csv或类似csv的文件,请使用csv标准库模块。

from numpy import *
import csv

infile = open('europenewMatrix.txt', 'r')
reader = csv.reader(infile)
reader.next() # skip the first line
numbers = [[int(num) for num in row[2:]] for row in reader]
infile.close()

travelmat = array(numbers)

http://docs.python.org/library/csv.html

答案 2 :(得分:0)

如果有人的问题可能具有相同的标题,但使用真实的Excel(.xls)文件,请尝试此操作(使用模块xlrd):

import xlrd
import numpy as np

sheet = xlrd.open_workbook('test_readxls.xls').sheet_by_name('sheet1')
n_rows, n_cols = 5,2
data = np.zeros((n_rows, n_cols))
for row in range(n_rows):
    for col in range(n_cols):
        data[row,col] = float(sheet.cell(row,col).value)