应用错误收集

时间：2011-12-28 22:04:49

标签： algorithm computer-science theory bigdata

算法背后的理论是什么，例如，在写一个类似的问题时，在stackoverflow网站上生成建议？你能推荐一些关于这个主题的书吗？

答案 0 :(得分：5)

您谈论的算法主要在3 AI个分支中找到：NLP，ML和IR。

例如，为了找到新问题中最相似的10个问题，可以从每个问题的文本中提取n-grams，为每个问题的n-gram计算TF-IDF权重向量，然后计算{在新问题和所有其他问题之间{3}}，选择具有最高相似性的10个问题。

答案 1 :(得分：1)

我认为这与源自市场购物篮分析的关联规则挖掘有关。作为一个很好的参考，Bing Liu的 Web数据挖掘绝对是最好的之一。