我(新手)尝试从excel文档中读取多个表,并在单个csv中以新格式读取。 在csv中,我需要以下字段:year(来自全局变量),month(来自全局变量),outlet(表名称); rowvalue [a](用于说明行的字符串),columnvalue [1](用于说明cloumn的字符串),cellvalue(浮点型)
然后必须在其中输入相应的值。
从各个表中,仅需读取RowNum 6到89。
npm install
我希望输出如下:
#BWA-Reader
#read the excel spreadsheet with all sheets
#Python 3.6
Importe
import openpyxl
import xlrd
from PIL import Image as PILImage
import csv
# year value of the Business analysis
year = "2018"
# month value of the Business analysis
month = "11"
# .xlxs path
wb = openpyxl.load_workbook("BWA Zusammenfassung 18-11.xlsx")
print("Found your Spreadsheet")
# List of sheets
sheets = wb.get_sheet_names()
# remove unneccessary sheets
list_to_remove = ("P",'APn','AP')
sheets_clean = list(set(sheets).difference(set(list_to_remove)))
print("sheets to load: " + str(sheets_clean))
# for loop for every sheet based on sheets_clean
for sheet in sheets_clean:
# for loop to build list for row and cell value
all_rows = []
for row in wb[sheet].rows:
current_row = []
for cell in row:
current_row.append (cell.value)
all_rows.append(current_row)
print(all_rows)
# i´m stucked -.-´
在一台csv中的所有工作表
非常感谢您每个想法如何解决我的项目!
答案 0 :(得分:0)
此问题的完整答案非常取决于实际数据集。
我建议您研究一下熊猫的read_excel()
函数。这将使提取所需的行/列/单元格变得更加容易,而无需循环遍历所有工作表。
您可能需要一些关于熊猫的教程才能到达那里,但是从您的尝试来看,熊猫可能是将来拥有的一项有用技能!