我是分布式系统的新手。我知道solrcloud提供分布式搜索功能。据我所知,hadoop是一个用于大数据的分布式处理框架。为什么我们将两个分布式框架集成在一起?它是用于以hdfs格式索引和搜索文件吗?使用hadoop和solrcloud有什么好处?如果有人可以详细解释或给我链接以更好地了解它们将真的有用。
答案 0 :(得分:0)
Solr(主要)用于存储和搜索,Hadoop(主要)用于分布式处理。他们解决了不同的问题。
最常见的是use Solr with HDFS to store / load its index files,要么使用HDFS群集中的现有功能,要么允许processed Hadoop result通过Solr进行搜索。
如果您在Google上进行一些搜索,您会发现很多用例,演示文稿和库,例如LucidWorks' Hadoop integrations,Solr+Hadoop或Hortonworks' Indexing and searching data in Apache Solr。