标签: indexing elasticsearch lucene bigdata
我有3TB数据,大约有10亿条记录,每条记录有6列,例如:name,location,ip,count,behavior,type. 我有10个linux服务器,每个服务器有16个内核,90G内存和5TB硬盘空间。
name,location,ip,count,behavior,type.
我不想很快完成索引,所以我应该如何设计ElasticSearch索引结构,例如:有多少分片会更好?并且,我应该使用多种类型,即相同的索引有多种类型。请求多种类型有助于索引性能。