我正在尝试使用OpenAmplify API来评估URI的内容。关键是要提出与文章真正相关的主题。不幸的是,我得到的主题分析是:
由于信噪比严重偏向于噪音,因此质量对我正在尝试做的事情都非常有用。我正在分析网络内容,因此涉及一定数量(可能是大量)无关内容(广告等)。我明白了。
尽管如此,许多被回归的主题要么是无用的(完全没有感性,甚至不是语言),无关紧要(如在哪里,来自哪里?)或过于细化以提供任何意义或见解。我可以使用值,嗯,为每个域,子域,主题等返回的值来过滤掉大部分噪音,但我真的不知道这意味着什么。
当然,我理解值它是衡量“文字中这个词的突出性”的标准,但数字本身看起来完全随意,我阻止我说“忽略”任何价值小于50“的条款,并赋予其任何实际意义。
是否有任何范围标准可以帮助我了解如何将主题的价值分数用作过滤阈值?或者,我是否应该使用另一个领域来进行这种过滤?
感谢您的帮助。
答案 0 :(得分:0)
从其他渠道,我了解到value
属性无法按照我希望的方式进行评估。它对于不同的信号意味着不同的东西,没有一种是以对这种要求有意义的方式定义的。