到目前为止,这是我的名单上的内容。我想以同样的方式了解其他人,也许更具技术性,也许更少
吹到比特:数字爆炸后你的生活,自由和幸福 - Ableson,Leeden和Lewis
Glut:通过年龄掌握信息 - Wright
信息规则 - 瓦里安和夏皮罗
Web Dragons:搜索引擎技术的神话 - Witten,Gori和Numerico
我在文本挖掘中看到过一些,包括
Web数据挖掘 - 刘曙
现代信息检索 - Baeza-Yates,Ribiero-Neto
同时寻找像左派这样的博客
http://www.stat.columbia.edu/~gelman/blog/
http://www.econlib.org/library/Enc/Information.html
答案 0 :(得分:5)
是明显的“圣经”(如上所述)。
是一本有趣的新教科书(学生级),充满了文献参考。它包含对并行检索算法的良好解释(样本章节)。
有很好的评价;我不太喜欢它(阅读Croft主页上的示例章节)。
是评估IR的TREC方法的一个很好的介绍。
解释了如何有效地计算PageRank。
答案 1 :(得分:3)
Introduction to Information Retrieval似乎是目前基础技术的推荐文本;它于2008年发布,我还没有读过。 (全文在线免费。)正如TimB推荐的那样,管理千兆字节是我最喜欢的旧书;它比现代信息检索更好,尽管这也值得一看。您可以使用the obvious search找到更多内容。
答案 2 :(得分:2)
Managing Gigabytes - Witten, Moffat, and Bell:详细介绍了信息检索,文本和图像压缩背后的一些技术。 (免责声明:我的大学主管是第二作者。)
您还应该了解ACM的SIGIR,它组织了一次关于信息检索的年度会议,并且还有一个mailing list。
答案 3 :(得分:0)
如上所述预定Introduction to Information Retrieval。
我认为,最好的高级信息是在几个学术网站和会议论文(SIGIR,CIKM,SPIRE,WWW009,......)中发现的出版物。
例:
答案 4 :(得分:0)
信息检索 - 实施和评估搜索引擎已于2010年由麻省理工学院出版社出版,是一本关于获取信息检索实用知识的好书。 Stefan Buttcher,Charles Clarke和Gordon Cormack是本书的作者。 Buttcher是Clarke的博士生,Clarke是Cormack的博士生。总而言之,他们在本书中结合了大约50年的IR研究和经验。它必须阅读!!!