我想使用命名实体识别(NER)根据给定的数据集自动汇总机票。
所以基本上这是我的数据集。
在这里,我需要以pdf格式创建有关乘客详细信息的摘要:
PNR号____(PNRNum)指的是乘客姓名 ____(名称)从____(开始时间)开始从____(德普机场),____(起始国家)到____(阿勒机场),____(终止国家)。航班号是____(航班号),是_____(国际机场),使用 _____(客舱等级)基本票价_____(基本票价)。
在此处应输入PNR编号作为输入以输入第一个空格,而数据集中的相应数据应在其余空格中填充。
airline = pd.read_csv("AIR-LINE.csv")
def create_airline_ticket():
c = canvas.Canvas('AIRlines.pdf')
c.setFont("Courier", 20)
c.drawCentredString(300, 700, 'Airline Ticket')
c.setFont("Courier", 14)
form = c.acroForm
c.drawString(10, 650, 'The PNR Number')
options = [('airline.loc[[0, 10], :]')]
form.choice(name='choice1', tooltip='Field choice1',
value='A',
x=165, y=645, width=72, height=20,
borderColor=magenta, fillColor=pink,
textColor=blue, forceBorder=True, options=options)
c.save()
我想到要使用ReportLabs模块才能使用其中可用的列表框。但这并没有相应地进行。我与其他方式有关。
那么您能建议我逐步进行操作吗?由于我是python的初学者,因此我可以轻松学习。谢谢。
答案 0 :(得分:1)
是的,我绝对会推荐使用python的SpaCy。另一个选项是StanfordNER。
我不明白您指的是什么意思?您是说如果有人尝试进行机票汇总?