算法背后的理论是什么,例如,在写一个类似的问题时,在stackoverflow网站上生成建议?你能推荐一些关于这个主题的书吗?
答案 0 :(得分:5)
您谈论的算法主要在3 AI个分支中找到:NLP,ML和IR。
例如,为了找到新问题中最相似的10个问题,可以从每个问题的文本中提取n-grams,为每个问题的n-gram计算TF-IDF权重向量,然后计算{在新问题和所有其他问题之间{3}},选择具有最高相似性的10个问题。
您可以阅读的一些免费书籍:
cosine similarity
http://nlp.stanford.edu/IR-book/
从1月下旬开始的2门免费课程:
http://infolab.stanford.edu/~ullman/mmds.html
http://www.nlp-class.org/
另外(涉及的种类):
http://jan2012.ml-class.org/
http://see.stanford.edu/see/courseinfo.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a
答案 1 :(得分:1)
我认为这与源自市场购物篮分析的关联规则挖掘有关。作为一个很好的参考,Bing Liu的 Web数据挖掘绝对是最好的之一。