确定参数的权重(类似于Google pagerank)

时间:2010-09-23 03:38:02

标签: java algorithm statistics analysis

我为我的项目抓取了一些博客,并提取了一些功能,例如文档的长度,链接,链接。这些博客中的每一个都讨论了一些特定的主题,每个主题都可以有很多文章,我需要为每个主题最多决定一两个重要的博客。如何为这些功能指定权重以选择重要的博客?

我可以使用机器学习算法,但有数百万个博客,我不想对它们进行注释。是否有经过数学验证的方法来确定权重?

感谢
巴拉

1 个答案:

答案 0 :(得分:0)

一个建议:如果确定A的等级,则确定有多少页面引用A。