xlrd:想要读取几个excel文件的表格并存储在一个列表/数组中? (更好的方法?)

时间:2011-06-03 14:34:11

标签: python excel xlrd xlwt

我没有xprd / xlwt的xp,但我设法访问了我想从中收集数据的文件之一。我想从目录中的所有文件中收集数据并将其移动到一个工作表。我在想,如果有一些我可以将它存储在一个数组/列表中,它很容易输出到csv。如果这是太多的工作,并且有一个简单的方法PLZ帮助,否则我使用Idle来玩想法并且到目前为止已经提出了这个:

>>> import xlrd, xlwt
>>> book = xlrd.open_workbook('c:\excelTry\Papineau.csv.xls')
>>> book.sheet_names()
[u'Charge Codes', u'Month']
>>> sh = book.sheet_by_index(1)
>>> #produces:
>>> sh.book
<xlrd.Book object at 0x01213BF0>
>>> for x in range(0, 10):
        sh.row_values(x)
[u'William Papineau', u'Pay Period 11', '', '', u' ', u' ', '', '', '', u'Weekly Total', '', '', u' ', '', '', '', '', u'Weekly Total', u'Biweekly', u'Percent of Effort']
[u'Index Number', u'Index Description', 40678.0, 40679.0, 40680.0, 40681.0, 40682.0, 40683.0, 40684.0, '', 40685.0, 40686.0, 40687.0, 40688.0, 40689.0, 40690.0, 40691.0, '', u'Total', '']
[u'E45776', u'Seat Belt Study', '', 8.0, 8.0, 8.0, 8.0, u' ', '', 32.0, '', '', '', '', '', u' ', '', 0.0, 32.0, 0.4155844155844156]
[u'E43457', u'MultiScaleWaterQuality', '', '', '', '', '', 8.0, '', 8.0, '', 5.0, 8.0, u' ', '', '', '', 13.0, 21.0, 0.2727272727272727]
[u'E45125', u'GLOSS', '', '', '', '', '', '', '', 0.0, '', '', '', 8.0, 8.0, '', '', 16.0, 16.0, 0.2077922077922078]
[u'E45131', u'GLOS AOC Trib Monitoring', '', '', '', '', '', '', '', 0.0, '', '', '', '', '', 8.0, '', 8.0, 8.0, 0.1038961038961039]

这产生了看起来像列表对象的内容,但是我操作或追加它的每一次尝试都会产生错误,说明不可编写脚本或可迭代。使用os.listdir(path)和for循环使用os模块处理文件迭代。任何帮助将不胜感激!

2 个答案:

答案 0 :(得分:3)

到目前为止,在您的代码中,您似乎没有使用从工作表中获取的值执行任何操作。也许有些代码没有粘贴到问题中......

您能否包含最后一行代码的输出?

您说要将它们全部存储在一个列表中 尝试这样的事情:

final = []
for rowx in xrange(sh.nrows):
    final.extend(sh.row_values(rowx))

此外:
小心Windows路径。仅当后面的字母没有反斜杠形成转义序列(例如\t或制表符)时,单反斜杠才有效。其他选项(选项3可能是最好的;除非有特殊原因不使用它):

  1. 原始字符串:book = xlrd.open_workbook(r'c:\excelTry\Papineau.csv.xls')
  2. 正斜杠:book = xlrd.open_workbook('c:/excelTry/Papineau.csv.xls')
  3. os.path.join
    book = xlrd.open_workbook(os.path.join('c:','excelTry','Papineau.csv.xls'))

答案 1 :(得分:1)

data = []
for i in xrange(sh.nrows):
    data.append(sh.row_values(i))
it will append each rows from xls file into list "data".
eg: [['a','b'],['c','d'],['e','f']] like this .