以下代码应该通过目录,打开文件,转换等。当一个单元格为空时,生成的CSV文件在其位置输出“无”。
有什么理由可以解决这个问题吗?
由于
import os
from openpyxl import load_workbook
import csv
for subdir, dirs, files in os.walk("C:\Users\Alan\Downloads\Knowledge\HOW DO I"):
for file in files:
filepath = subdir + os.sep + file
wb = load_workbook(filename=filepath)
sh = wb.active
your_csv_file = open(filepath.replace(".xlsx","")+'_csv.csv','wb')
wr = csv.writer(your_csv_file,quoting=csv.QUOTE_ALL)
for rownum in sh.iter_rows():
wr.writerow([unicode(val.value).encode('ascii','ignore') for val in rownum])
your_csv_file.close()
答案 0 :(得分:1)
OpenPyXl不存储空单元格(空白表示没有值,字体,边框等)。如果从工作表中获取单元格,它会动态创建一个值为None
的新空单元格。
Worksheet.iter_rows()
的当前实现(v2.4.0)使用Worksheet.cell()
方法调用Cell()
构造函数而没有值。
您需要更改代码以处理“空”单元格:
for rownum in sh.iter_rows():
values = [(u"" if cell.value is None else unicode(cell.value))
for cell in rownum]
wr.writerow([value.encode('ascii', 'ignore') for value in rownum])
注意:由于您将数据导出为CSV文件(可能是Windows用户),因此您可以选择更有用的编码,例如:cp1252
。
答案 1 :(得分:-1)
为什么呢?因为等同于#34;空"似乎是正确的。与"无"。我想要' NA'但是,我有类似的东西:
def _transmap(dat):
transmap = {
# empty cells are going to be empty strings
None: 'NA',
# workaround for bug in openpyxl
# https://bitbucket.org/openpyxl/openpyxl/issues/674/
dt.datetime(1899, 12, 30, 0, 0): dt.time(0, 0),
dt.datetime(1899, 12, 31, 0, 0): dt.datetime(1900, 1, 1, 0, 0),
}
return transmap[dat] if dat in transmap else dat
然后你会想要这样的东西:
for rownum in sh.iter_rows():
wr.writerow([unicode(_transmap(val.value)).encode('ascii','ignore') for val in rownum])