迭代ReportLab中的DataFrame

时间:2015-12-03 15:13:16

标签: python python-3.x pandas reportlab

我想迭代DataFrame(df)为每家医院('A'和'B')生成PDF。我尝试了很多方法,但是没有成功,除非我用np.random.rand(1)将该名称作为随机数,但仍有问题。更新: 我希望.pdf的名称是每次迭代的医院名称。如果我尝试添加医院名称,则会导致错误:

当我设置:

pdf_file_name = str(np.random.rand(1))+'.pdf'

结果是:

OSError: [Errno 22] Invalid argument: '0    A\nName: Hospital, dtype: object.pdf'

所以我需要弄清楚如何: 1.将医院名称传入文件名和 2.迭代医院名称,每个医院生成一份PDF。

from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter
from reportlab.lib.pagesizes import portrait
from reportlab.platypus import Image
import pandas as pd
import numpy as np

df = pd.DataFrame({'Hospital':['A','B']})
#This is here to just produce one report that "works" while working on the code.
df = df[(df.Hospital == 'A')]

hospital = df['Hospital']
def import_data(df):
    import numpy as np
    hospital = df['Hospital']
    pdf_file_name = str(np.random.rand(1))+'.pdf'
    generate_report(hospital, pdf_file_name)

def generate_report(hospital, pdf_file_name):
    c = canvas.Canvas(pdf_file_name, pagesize=portrait(letter))
    c.setFont('Helvetica', 48, leading=None)
    c.drawCentredString(415, 500, 'Report')
    c.setFont('Helvetica', 24, leading=None)
    c.drawCentredString(415, 450, 'This Report is For:')
    c.setFont('Helvetica-Bold', 34, leading=None)
    c.drawCentredString(415, 395, str(hospital))
    c.showPage()
    c.save()
import_data(df)

提前致谢!

1 个答案:

答案 0 :(得分:1)

IIUC,你可以做点什么

def import_data(df):
    for hospital, hosp_df in df.groupby("Hospital"):
        pdf_file_name = hospital + '.pdf'
        generate_report(hospital, pdf_file_name)

df = pd.DataFrame({'Hospital':['A','B'], 'Other': [1,2]})
import_data(df)

这为我生成了两个文件,一个名为A.pdf,第二个名为B.pdf,每个文件都说"报告/此报告适用于:/ A" (或B)。

目前我们没有对hosp_df做任何事情,看起来像是

A
  Hospital  Other
0        A      1

B
  Hospital  Other
1        B      2

但您也可以将hosp_df传递到generate_report并使用该医院特定数据执行任何操作。