我有一个项目来创建类似于altavista.com的高流量搜索引擎。 Windows .NET C#将用于该项目。我正在寻找一个可以处理非常高负载的好的搜索引擎数据库。我看了一下lucene和sql server 2008.我已经读过lucene在负载非常高时容易腐败。所以,我正在考虑sql server 2008,但我不确定sql server可以处理超过千兆字节数据的非常高的负载。
数据库将获得一大块数据,需要在表中的其他位置获取类似的数据。它只会在stackoverflow上执行类似问题区域。它需要搜索数百万行。是sql server 2008和lucene我唯一的选择
答案 0 :(得分:2)
我已经成功地使用了Lucene的大量数据,并且我面临数据损坏问题。
但是如果你担心独立的lucene,你可以试试apache solr,它是一个基于Lucene的开源搜索服务器
Solr是受欢迎的,快速开放的 来源企业搜索平台 Apache Lucene项目。它的主要 功能包括强大的全文 搜索,点击突出显示,刻面 搜索,动态聚类,数据库 集成和丰富的文档(例如, Word,PDF)处理。索尔很高兴 可扩展,提供分布式搜索 和索引复制,它的功能 搜索和导航功能 许多世界上最大的互联网 位点。
在Google代码solr.net中有一个针对solr的.net客户端..您可以试试这个