使用python-crfsuite进行序列标记

时间:2018-12-28 05:23:28

标签: python machine-learning crf crfsuite python-crfsuite

嗨,我正在尝试使用python-crfsuite为以下任务创建序列标签模型。

我需要从一个段落中解析信息,例如:

  

大家好,我想在12月24日预订HKG到LAX的票务,详情如下。    乘客姓名:John,Riya BNE,于1月1日到DXB。乘客名称:迈克(Mike)乘客:艾伦(Allen)从柯克(COK)到DEL(明天出发)

从以上句子中,我想解析如下细节,

ticket1:
------------
passengers: John, Riya
origin: HKG
destination: LAX
date: 24th Dec 

ticket2:
------------
passengers: Mike
origin: BNE
destination: DXB
date: 1st JAN

ticket3:
-------------
passenger: Allen
origin: COK    
destination: DEL
date: tomorrow

任何人都可以在不破坏链接的情况下解析数据。 任何建议或参考

我用于训练的样本数据集

Hi      NNP     O
all     DT      O
,       ,       O
I       PRP     O
want    VBP     O
to      TO      O
book    NN      O
a       DT      O
tickets NNS     O
for     IN      O
below   IN      O
details NNS     O
HKG     NNP     B-origin
to      TO      O
LAX     VB      B-dest
on      IN      O
24th    CD      B-date
Dec.    NNP     I-date
passenger       NN      O
names   NNS     O
:       :       O
John    NNP     passenger
,       ,       B-passenger
Riya    NNP     B-passenger
BNE     NNP     B-origin
to      TO      O
DXB     NNP     B-dest
on      IN      O
B-1st   CD      date
JAN.    NNP     I-date
passenger       NN      O
name    NN      O
:       :       O
Mike    JJ      B-passenger
passenger       NN      O
:       :       O
Allen   NNP     B-passenger
from    IN      O
COK     NNP     B-origin
to      TO      O
DEL     NNP     B-dest
for     IN      O
tomorrow        NN      B-date

预先感谢!

0 个答案:

没有答案