我们运行Cassandra / Solr集群,目前Cassandra和Solr驻留在每个节点的同一个硬盘上。
我希望为每个节点添加一个SSD驱动器,并有效地将Cassandra和Solr分开以分离硬盘驱动器。我想为每个节点添加2个SSD,但由于预算限制,我很可能现在无法为每个节点购买2个独立的驱动器,并且将限制为1个。
也就是说,我们白天对客户的主要用途是通过我们的前端UI / Solr查询数据库,因此最重要的是针对所有潜在的读取/查询进行优化。工作日(所有处理,分析等都在下班后发生)。哪个是最好/最有效的SSD驱动器使用,把Solr放在它们上面还是Cassandra?
我没想到性能会出现奇迹般的增长,而是我认为将Solr放在更快的驱动器上会更有利于我们的情况,只是想验证我是否正在看这个正确。
答案 0 :(得分:0)
除了你提到的内容之外,我不会假设你的环境,但请记住,DSE搜索将从索引路径读取Cassandra(read-before-write以确保有效的整个文档)插入到Lucene索引中)和查询路径(因为存储的文档字段是从Cassandra中检索的,而不是Lucene本身)。最理想的情况是,您的搜索查询将访问加载到操作系统页面缓存中的Lucene索引的Solr过滤器缓存和segment / docValues。
答案 1 :(得分:0)
您没有提到Solr索引相对于系统内存的大小。
在理想的世界中,您的Solr索引适合RAM ...根据我的经验,当RAM的价格阻止您在RAM中安装Solr索引时,将Solr索引放在SSD上可以显着提高性能。
我在运行混合存储系统方面的经验非常有限,其中Cassandra SSTables放在盘片上,Solr索引在SSD上,但我的经验表明这是一种有价值的方法,并且仍然应该提供显着的性能改进而不是100%的盘片。 / p>