stackoverflow建议如何工作?

时间:2011-12-28 22:04:49

标签: algorithm computer-science theory bigdata

算法背后的理论是什么,例如,在写一个类似的问题时,在stackoverflow网站上生成建议?你能推荐一些关于这个主题的书吗?

2 个答案:

答案 0 :(得分:5)

您谈论的算法主要在3 AI个分支中找到:NLPMLIR

例如,为了找到新问题中最相似的10个问题,可以从每个问题的文本中提取n-grams,为每个问题的n-gram计算TF-IDF权重向量,然后计算{在新问题和所有其他问题之间{3}},选择具有最高相似性的10个问题。

您可以阅读的一些免费书籍:
cosine similarity
http://nlp.stanford.edu/IR-book/

从1月下旬开始的2门免费课程:
http://infolab.stanford.edu/~ullman/mmds.html
http://www.nlp-class.org/

另外(涉及的种类):
http://jan2012.ml-class.org/
http://see.stanford.edu/see/courseinfo.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a

答案 1 :(得分:1)

我认为这与源自市场购物篮分析的关联规则挖掘有关。作为一个很好的参考,Bing Liu的 Web数据挖掘绝对是最好的之一。