基于两个属性的自然语言汇总

时间:2014-11-18 17:39:15

标签: nlp linguistics

问题在概念上非常简单:我希望根据两个属性总结一组(上限为30,但很少> 5)。说出形状和颜色。而不是像

这样的临床事物
  

项目1是红色立方体
  项目2是蓝色球体
  项目3是蓝色圆柱
  第4项是绿球

我正在寻找更具人性化的东西,比如

  

你有两个球体,一个是蓝色,一个是绿色   或者你有两个球体,一些是蓝色的,另一些是绿色的   你还有一个蓝色圆柱体和一个红色立方体。

我怎么会以某种有组织的方式去做呢? 有没有比拼出每一个案例更好的方法?例如。优于: if(singleItem),if(仅1种形状和1种颜色),if(1种形状,多种颜色),if(多种形状,多种颜色)等......

1 个答案:

答案 0 :(得分:1)

您必须将要描述的属性组定义为属于同一类别,即颜色,形状等。

然后将您的数据分类到这些类别并尝试进行概括。

这实际上取决于你想要谈论的内容(你主要讨论了形状,但你也可以谈论颜色,例如“我们有两个蓝色项目”)。如果您只想总结并且所有属性都具有相同的优先级,则可以例如首先看一下这些项目的共同点。对于每个项目,如果你已经谈过它们,请标记它们,所以你没有得到:

我们有两个球体,一个是蓝色,一个是绿色。 我们还有两个蓝色项目,一个球体和一个圆柱体

......这可能听起来像是在谈论两个不同的蓝色球体,但你可能只有一个。

对于算法,您可能无法定义条件语句。但首先,考虑一下您想要讨论的所有不同情况,然后定义一个树结构,其中列出了每个案例,所以你不要忘记任何。