标签: java algorithm statistics analysis
我为我的项目抓取了一些博客,并提取了一些功能,例如文档的长度,链接,链接。这些博客中的每一个都讨论了一些特定的主题,每个主题都可以有很多文章,我需要为每个主题最多决定一两个重要的博客。如何为这些功能指定权重以选择重要的博客?
我可以使用机器学习算法,但有数百万个博客,我不想对它们进行注释。是否有经过数学验证的方法来确定权重?
感谢 巴拉
答案 0 :(得分:0)
一个建议:如果确定A的等级,则确定有多少页面引用A。