2.X/6. Modeling Your Data

6-3-3. Finding Parents by Their Children

drscg 2017. 9. 23. 14:33

The has_child query and filter can be used to find parent documents based on the contents of their children. For instance, we could find all branches that have employees born after 1980 with a query like this:

has_child query와 filter는 자식의 내용으로 부모 document를 찾는데 사용될 수 있다. 예를 들어, 1980년 이후에 태어난 직원을 가진, 모든 지점을 찾을 수 있다. query는 아래와 같다.

GET /company/branch/_search
{
  "query": {
    "has_child": {
      "type": "employee",
      "query": {
        "range": {
          "dob": {
            "gte": "1980-01-01"
          }
        }
      }
    }
  }
}

Like the nested query, the has_child query could match several child documents, each with a different relevance score. How these scores are reduced to a single score for the parent document depends on the score_mode parameter. The default setting is none, which ignores the child scores and assigns a score of 1.0 to the parents, but it also accepts avgminmax, and sum.

nested query와 마찬가지로, has_child query는 각각 다른 relevance score를 가진, 다수의 자식 document와 일치할 수 있다. 이들 score가, 부모 document를 위해, 단일 score로 합쳐지는 방법은, score_mode 매개변수에 달려있다. 기본 설정은 자식의 score를 무시하고, 부모에게 1.0 이라는 score를 할당하는 none 이다. 그러나, avgminmaxsum 도 가능하다.

The following query will return both london and liverpool, but london will get a better score because Alice Smith is a better match than Barry Smith:

다음 query는, london 과 liverpool 모두를 반환한다. 그러나, Alice Smith 가 Barry Smith 보다 더 잘 일치하기 때문에, london 은 더 높은 score를 가질 것이다.

GET /company/branch/_search
{
  "query": {
    "has_child": {
      "type":       "employee",
      "score_mode": "max",
      "query": {
        "match": {
          "name": "Alice Smith"
        }
      }
    }
  }
}
Tip

The default score_mode of none is significantly faster than the other modes because Elasticsearch doesn’t need to calculate the score for each child document. Set it to avgminmax, or sum only if you care about the score.

score_mode 의 기본값인 none 은 다른 모드보다 훨씬 빠르다. 왜냐하면, Elasticsearch가, 각각의 자식 document에 대해, score를 계산할 필요가 없기 때문이다. score가 필요하다면,avgminmaxsum 을 설정하면 된다.

min_children and max_childrenedit

The has_child query and filter both accept the min_children and max_children parameters, which will return the parent document only if the number of matching children is within the specified range.

has_child query와 filter는 min_children 과 max_children 매개변수를 가질 수 있다. 이것은 일치하는 자식의 수가 지정한 범위내인 부모 document만을 반환한다.

This query will match only branches that have at least two employees:

아래 query는 최소 2명 이상의 직원을 가진 지점만 일치한다.

GET /company/branch/_search
{
  "query": {
    "has_child": {
      "type":         "employee",
      "min_children": 2, 
      "query": {
        "match_all": {}
      }
    }
  }
}

일치하려면, 지점은 최소 두 명의 직원을 가져야 한다.

The performance of a has_child query or filter with the min_children or max_children parameters is much the same as a has_child query with scoring enabled.

min_children 나 max_children 매개변수를 가진, has_child query나 filter의 성능은, score 계산이 활성화된 has_child query와 거의 동일하다.


'2.X > 6. Modeling Your Data' 카테고리의 다른 글

6-3-1. Parent-Child Mapping  (0) 2017.09.23
6-3-2. Indexing Parents and Children  (0) 2017.09.23
6-3-4. Finding Children by Their Parents  (0) 2017.09.23
6-3-5. Children Aggregation  (0) 2017.09.23
6-3-6. Grandparents and Grandchildren  (0) 2017.09.23