是否可以从一长串文本中自动拉出随机“标签”?

时间:2012-09-11 14:39:54

标签: javascript python tags

我在想如果用户提交了一条消息并点击了“建议标签”按钮,他们的消息就会被分析,并且一个表单字段填充了他们帖子中的随机单词。

是否可以在可扩展的级别上执行此操作? JavaScript是否能够处理它或更好地将Ajax返回到python?

我认为某些常用词会被排除(a,the,and等),也许10个最长的词或者只是随机而不常用的词会被添加到表单字段中,例如“tag1,tag2,tag3”< / p>

2 个答案:

答案 0 :(得分:0)

当然有可能,你几乎描述了要测试的算法,它似乎没有包含任何明显不可计算的步骤:

  1. 将邮件拆分为文字
  2. 过滤掉常用字词
  3. 按字长排序
  4. 选择前十名并将其显示为标签
  5. 不确定“可扩展级别”是什么意思,这对我来说听起来是客户端的。除非消息很长,即没有人输入,否则我认为这样做不会有任何问题。

答案 1 :(得分:0)

同意@unwind,它取决于文本的内容长度和你的算法来获取标签(可扩展性)