使用命名实体识别的自动汇总

时间:2018-12-18 06:30:47

标签: python nlp spacy ner

我想使用命名实体识别(NER)根据给定的数据集自动汇总机票

所以基本上这是我的数据集。

enter image description here

在这里,我需要以pdf格式创建有关乘客详细信息的摘要:

  

PNR号____(PNRNum)指的是乘客姓名   ____(名称)从____(开始时间)开始从____(德普机场),____(起始国家)到____(阿勒机场),____(终止国家)。航班号是____(航班号),是_____(国际机场),使用   _____(客舱等级)基本票价_____(基本票价)。

在此处应输入PNR编号作为输入以输入第一个空格,而数据集中的相应数据应在其余空格中填充。

airline = pd.read_csv("AIR-LINE.csv")
def create_airline_ticket():
    c = canvas.Canvas('AIRlines.pdf')

    c.setFont("Courier", 20)
    c.drawCentredString(300, 700, 'Airline Ticket')
    c.setFont("Courier", 14)
    form = c.acroForm

    c.drawString(10, 650, 'The PNR Number')
    options = [('airline.loc[[0, 10], :]')]
    form.choice(name='choice1', tooltip='Field choice1',
                value='A',
                x=165, y=645, width=72, height=20,
                borderColor=magenta, fillColor=pink, 
                textColor=blue, forceBorder=True, options=options)

    c.save()

我想到要使用ReportLabs模块才能使用其中可用的列表框。但这并没有相应地进行。我与其他方式有关。

那么您能建议我逐步进行操作吗?由于我是python的初学者,因此我可以轻松学习。谢谢。

1 个答案:

答案 0 :(得分:1)

是的,我绝对会推荐使用python的SpaCy。另一个选项是StanfordNER。

我不明白您指的是什么意思?您是说如果有人尝试进行机票汇总?

相关问题