我必须在参考内容上自动搜索属于某些产品的特定关键字。结果可能是指多个产品组的关键字。假设一组有14个关键字,另一组有7个,另一组总共有11个关键字。我的搜索可能会导致从每个组中选择特定数量的关键字-说我的结果可能是14个关键字中的7个,7个中的3个以及11个中的2个。每个关键字的权重都相同。但是,它们的分布频率可能不同。例如,我的结果可能是第一组的14个中的7个,可能是10、20、25、30、5、2、50等,接下来的组也是如此。在这种情况下,我如何提供一个评分系统来评估建议,应对三个值中的哪个值进行评估。我应该使用的统计意义是什么?以及应该设定的置信区间是什么