在AlchemyAPI中命名实体提取和分类

时间:2013-04-29 09:23:12

标签: classification alchemyapi

我正在测试AlchemyAPI从给定网站中提取公司名称。在大多数情况下,我能够获得正确的信息。我还需要将结果分类为业务。我从AlchemyAPI得到的是最一般的分类,但我需要一个更具体的答案。例如,在他们的演示链接中,如果我输入www.ford.com,它会将类别作为娱乐返回。 DMOZ还将福特排在最顶层。我需要将福特归类为商务车辆。有什么方法可以做到这一点吗? AlchemyAPI是否使用DMOZ进行分类,如果是,如何实现更具体的分类?

另一个例子是百事可乐。 Pepsico被列为商业。我需要将其归类为业务 - >食品和饮料。

2 个答案:

答案 0 :(得分:0)

听起来您正在使用AlchemyAPI的文本分类端点。该调用将尝试将整个文档分类为12个类别中的1个(“业务”和“娱乐”是其中两个)。

文本分类调用旨在表示“此文档通常是关于X”。如果要从文档中提取特定公司名称并找出公司所在的类别,请尝试使用实体提取调用(更多信息:http://www.alchemyapi.com/api/entity-extraction/)。该调用将找到文档中的所有公司,并将为每个公司返回“类型”。实体提取调用支持数百种类型,而不是另一个调用中的12个类别。这应该可以让您更加精确地进行分类。

答案 1 :(得分:0)

AlchemyAPI的ranked named entity extractioncategorize命名实体,如果您启用消歧,它会为您提供更具体的分类(即Ford = Company - > AutomobileCompany)。