我正在尝试创建一种算法,给定站点中的一组元素,将返回更有可能是描述产品的“一个”的算法。
这当然不是100%准确的算法,之后需要基于人的选择,但我试图获得至少3个最可能的图像列表。以下是我到目前为止所做的事情:
1 - 摆脱哪个方块尺寸小于50x50px
2 - 计算页面中所有的平均平方大小
3 - 根据与平均方形尺寸的差异(较大的方形尺寸,得分越多)给每个分数
4 - 如果宽度>比(高度* 5),得分=得分* 0.5(我这样做是因为这可能是页面中的横幅)。
这是我想要改变的,但我没有看到这样做的好方法。在第3步中,我现在正在做的是给出以下分数:
score_of_image = average_square_size - square_size_image
我希望有一个特定数量的积分将分享给所有人,具体取决于他们的大小。分享应反映一张与其他图片相关的图片的大小。分享这些点会有什么好算法?
答案 0 :(得分:1)
我认为您需要决定某些方面与其他方面有多重要,但您可以简单地计算图像的大小(宽x高)并将其用作分数的第一部分。我如何得分这将是记录页面上最大图像的区域,并计算其他图像的百分比。我不认为平均图像尺寸确实在这里添加任何东西,因为我认为最大的图像很可能是产品图像。
然后计算方形的单独分数,做这样的事情: -
if (height > width) {
result = (width/height) * max_points_for_squareness;
} else {
result = (height/width) * max_points_for_squareness;
}
因此,在这两个方面之间,您可以获得两个可用于分配总分数的百分比(如果您愿意,可以分配更多的分数,或者更多的分配图像大小。