我的网站需要开发一系列与其行业相关的关键字和关键短语,以便当用户发布某些内容时,可以相关地标记帖子。
除了手动创建数千个单词和短语的列表外,生成此类列表的常见做法是什么?
是通过将帖子解析为常用关键字还是其他内容来完成的?
想:
我似乎依赖于发布帖子的解析一开始就是相当有限的,并且意味着只有在网站上开发内容更长时间后,我才能拥有一个不错的关键字列表。
答案 0 :(得分:2)
我会请求用户的帮助;当用户发布消息时,他或她可以选择已存在的标签并添加新标签。新的可以直接显示或者可以进入队列以供您审核。
答案 1 :(得分:1)
您可以尝试培训专家系统(可能是贝叶斯分类器)来对文档(标签)进行分类,类似于专家(人类)对类似文档进行分类的方式。但是,你需要人工培训,所以你应该先做到这一点。然后你可能会发现尝试向用户推荐标签是一项很多工作并且容易出错,并且会跳过这一部分。