嗨,我正在尝试使用python-crfsuite为以下任务创建序列标签模型。
我需要从一个段落中解析信息,例如:
大家好,我想在12月24日预订HKG到LAX的票务,详情如下。 乘客姓名:John,Riya BNE,于1月1日到DXB。乘客名称:迈克(Mike)乘客:艾伦(Allen)从柯克(COK)到DEL(明天出发)
从以上句子中,我想解析如下细节,
ticket1:
------------
passengers: John, Riya
origin: HKG
destination: LAX
date: 24th Dec
ticket2:
------------
passengers: Mike
origin: BNE
destination: DXB
date: 1st JAN
ticket3:
-------------
passenger: Allen
origin: COK
destination: DEL
date: tomorrow
任何人都可以在不破坏链接的情况下解析数据。 任何建议或参考
我用于训练的样本数据集
Hi NNP O
all DT O
, , O
I PRP O
want VBP O
to TO O
book NN O
a DT O
tickets NNS O
for IN O
below IN O
details NNS O
HKG NNP B-origin
to TO O
LAX VB B-dest
on IN O
24th CD B-date
Dec. NNP I-date
passenger NN O
names NNS O
: : O
John NNP passenger
, , B-passenger
Riya NNP B-passenger
BNE NNP B-origin
to TO O
DXB NNP B-dest
on IN O
B-1st CD date
JAN. NNP I-date
passenger NN O
name NN O
: : O
Mike JJ B-passenger
passenger NN O
: : O
Allen NNP B-passenger
from IN O
COK NNP B-origin
to TO O
DEL NNP B-dest
for IN O
tomorrow NN B-date
预先感谢!