我在ES群集中有以下JSON数据,
"subjectData": {
"caseA": [
"na",
"Mechanical Engineering",
"Electrical and Electronic Engineering Technologies/Technicians, Other"
],
"caseB": [
"Mechanical Engineering",
"Electrical Engineering Technologies/Technicians",
"na"
],
"caseC": [
"Engineering",
"Engineering Technologies and Engineering-related Fields",
"Military Science, Leadership and Operational Art"
]
}
现在我需要查询有多少数据有NA +一些其他主题值。因此,我需要可以计算具有subjectData.fourdigit的数据集的查询:NA +一些其他值,例如,
GET mycluster/data/_count
{
"query": {
"filtered": {
"filter": {
"query": {
"query_string": {
"query": "subjectData.fourdigit: \"na\" AND subjectData.fourdigit: \"values other than NA\""
}
}
}
}
}
}
我可以使用像
这样的查询GET mucluster/data/_count
{
"query": {
"filtered": {
"filter": {
"query": {
"query_string": {
"query": "subjectData.fourdigit: \"na\" AND subjectData.fourdigit: \"Mechanical Engineering\""
}
}
}
}
}
}
结果是,
{
"count": 2933,
"_shards": {
"total": 6,
"successful": 6,
"failed": 0
}
}
但是这是针对一个特定的值,subjectData.fourdigit:\“Mechanical Engineering \”,这个群集有超过1000个像这样的值。
我需要将它设置为通用的,因为我有数百万个数据,所有这些数据都有不同的subjectData.fourdigit值(计数为1000)。
任何帮助/建议/想法都非常有用。