我将首先描述我的问题。
我有n个页面,每个页面都有自己的流行因素。流行度因子的大小为10.现在,我对每个页面都有总页面点击次数,我希望使用这些总页面点击次数再次以10的比例计算流行度因子。
总页面点击次数是一个绝对数字,我的这些值只有1,70,000页。我和我在一起的总页数是41,00,000。
现在,我的问题是我不知道如何规范所有页面的总页面点击次数。
我试过这样做:
每页的受欢迎程度=所有页面的总页面点击数/总数。页面。
我假设没有数据的页面将至少有1页总页数。但是这样我的分母变得非常大,而且在10分的缩放过程中,我迷失了。
任何人都可以帮助我如何处理它?</ p>
答案 0 :(得分:0)
有几种方法可以做到这一点。以下是一些例子:
绝对受欢迎程度
查找最受欢迎页面的点击次数。
根据与最热门页面相比的点击次数分配受欢迎度分数:
0-10%=受欢迎程度1,10-20%=受欢迎程度2,依此类推。
相对受欢迎程度
根据页面点击次数对所有页面进行排序。
根据列表中的位置分配受欢迎度分数:
0-10%=受欢迎程度1,10-20%=受欢迎程度2,依此类推。
没有统计信息的网页的受欢迎程度
我不能就如何处理这些问题给你任何建议。如果您不知道页面被访问了多少次,那么很难给它一个流行度分数。