GATE如何处理机器学习(文本分类)?

时间:2016-03-23 09:48:16

标签: nlp text-mining text-classification gate

以下面的句子作为例子(来自GATE官方教程幻灯片:模块11 https://gate.ac.uk/sale/talks/gate-course-may10/track-3/module-11-ml-adv/):

我被告知该商品有库存,次日送货。几天后,我追赶他们被告知有一个错误,没有库存。几天后再次追赶,仍然没有股票,然后发现他们从一开始就给我开了账单。所以他们有一个多星期的钱 - 不知道什么时候他们会有股票 - 我已经完成了所有的追逐。尽管其他人在八年的互联网购物中所说的最糟糕的经验至今都没有。

当整个句子被标记为anntation并被视为GATE机器学习PR(批量学习)中的实例时,GATE将如何处理学习过程?

我有两个猜测。一个是GATE使用人类语言自动标记句子中的每个单词并收集这些功能以构建分类模型。另一个是GATE简单地将句子转换为数学变量,如矢量,并根据语言学特征训练模型,如使用了多少名词,adj,adv。

我不确定哪一个是正确的,或者是否会有另一个解释。希望有人可以给出确认或任何相关信息。

谢谢!

1 个答案:

答案 0 :(得分:0)

GATE根据您在配置xml文件中的定义构建模型。除了实例类型,可能会有注释,如Token(具有功能root,POS,..)或N-gram或您自己的JAPE规则创建的注释(带功能)。 Gate将使用这些定义并构建模型。