在python中打开并读取excel .xlsx文件

时间:2013-08-30 12:26:07

标签: python excel python-2.7 pandas xlrd

我正在尝试使用python打开一个excel .xlsx文件,但我无法找到办法,我尝试使用pandas但是它想要使用一个名为NumPy的库我试图安装numpy但是它仍然找不到numpy。

我也尝试过使用xlrd库,但我得到了以下回溯:

Traceback (most recent call last):
  File "C:\test.py", line 3, in <module>
    book = open_workbook('test.xlsx')
  File "C:\Python27\lib\site-packages\xlrd\__init__.py", line 370, in open_workbook
    biff_version = bk.getbof(XL_WORKBOOK_GLOBALS)
  File "C:\Python27\lib\site-packages\xlrd\__init__.py", line 1323, in getbof
    raise XLRDError('Expected BOF record; found 0x%04x' % opcode)
XLRDError: Expected BOF record; found 0x4b50

我认为是因为XLRD无法读取.xlsx文件?

有人有任何想法吗?

编辑:

import csv
with open('test.csv', 'rb') as csvfile:
    data = csv.reader(csvfile, delimiter=',')
    for row in data:
        print "------------------"
        print row
        print "------------------"
        for cell in row:
            print cell

3 个答案:

答案 0 :(得分:11)

也许您可以将.xlsx导出为.csv文件?

然后你可以尝试:

import csv
with open('file.csv','rb') as file:
    contents = csv.reader(file)
    [x for x in contents]

这可能有用: http://docs.python.org/2/library/csv.html#csv.reader

希望有所帮助!

编辑:

如果你想找到一个spectific单元格,比如F13,你可以创建一个像矩阵一样的嵌套列表,它们引用每个元素:

import csv
with open('file.csv','rb') as file:
    contents = csv.reader(file)
    matrix = list()
    for row in contents:
        matrix.append(row)

然后使用matrix[5][12]访问F13。

P.S。:我没有测试过这个。如果“row”是一个列表,其中每个单元格都是一个元素,则继续将所有行附加到矩阵,因此第一个索引是行号,第二个索引是列号。

答案 1 :(得分:2)

好像你在使用Linux发行版。我也有同样的问题,“xlwt”库不会发生这种情况,但只能使用“xlrd”。我所做的并不是解决这个问题的正确方法,但它使得事情暂时有效,希望很快就能回答这个问题;我在Windows上安装了“xlrd”并将文件夹粘贴在Linux上我的python代码所在的目录,并且它有效。

答案 2 :(得分:2)

因为我知道其他人也会读这个 -

您可以安装以下模块(它不会自动存在) https://pypi.python.org/pypi/openpyxl

您可以阅读以下内容以获得有关如何使用它的详细信息

https://automatetheboringstuff.com/chapter12/