我想迭代DataFrame(df)为每家医院('A'和'B')生成PDF。我尝试了很多方法,但是没有成功,除非我用np.random.rand(1)将该名称作为随机数,但仍有问题。更新: 我希望.pdf的名称是每次迭代的医院名称。如果我尝试添加医院名称,则会导致错误:
当我设置:
pdf_file_name = str(np.random.rand(1))+'.pdf'
结果是:
OSError: [Errno 22] Invalid argument: '0 A\nName: Hospital, dtype: object.pdf'
所以我需要弄清楚如何: 1.将医院名称传入文件名和 2.迭代医院名称,每个医院生成一份PDF。
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter
from reportlab.lib.pagesizes import portrait
from reportlab.platypus import Image
import pandas as pd
import numpy as np
df = pd.DataFrame({'Hospital':['A','B']})
#This is here to just produce one report that "works" while working on the code.
df = df[(df.Hospital == 'A')]
hospital = df['Hospital']
def import_data(df):
import numpy as np
hospital = df['Hospital']
pdf_file_name = str(np.random.rand(1))+'.pdf'
generate_report(hospital, pdf_file_name)
def generate_report(hospital, pdf_file_name):
c = canvas.Canvas(pdf_file_name, pagesize=portrait(letter))
c.setFont('Helvetica', 48, leading=None)
c.drawCentredString(415, 500, 'Report')
c.setFont('Helvetica', 24, leading=None)
c.drawCentredString(415, 450, 'This Report is For:')
c.setFont('Helvetica-Bold', 34, leading=None)
c.drawCentredString(415, 395, str(hospital))
c.showPage()
c.save()
import_data(df)
提前致谢!
答案 0 :(得分:1)
IIUC,你可以做点什么
def import_data(df):
for hospital, hosp_df in df.groupby("Hospital"):
pdf_file_name = hospital + '.pdf'
generate_report(hospital, pdf_file_name)
df = pd.DataFrame({'Hospital':['A','B'], 'Other': [1,2]})
import_data(df)
这为我生成了两个文件,一个名为A.pdf
,第二个名为B.pdf
,每个文件都说"报告/此报告适用于:/ A" (或B)。
目前我们没有对hosp_df
做任何事情,看起来像是
A
Hospital Other
0 A 1
和
B
Hospital Other
1 B 2
但您也可以将hosp_df
传递到generate_report
并使用该医院特定数据执行任何操作。