2.X/2. Search in Depth

2-2. Full-Text Search

drscg 2017. 9. 30. 02:01

Now that we have covered the simple case of searching for structured data, it is time to explore full-text search: how to search within full-text fields in order to find the most relevant documents.

지금까지 구조화된 데이터를 위한, 간단한 검색을 살펴봤다. 이제 full-text 검색(full-text search) 을 탐험할 시간이다. 가장 적합한 document를 찾기 위해, full-text field를 검색하는 방법을 알아 보자.

The two most important aspects of full-text search are as follows:

full-text 검색에서 가장 중요한 두 가지가 있는데, 아래와 같다.

Relevance

The ability to rank results by how relevant they are to the given query, whether relevance is calculated using TF/IDF (see What Is Relevance?), proximity to a geolocation, fuzzy similarity, or some other algorithm.

주어진 query와 얼마나 관련 있는가에 따라, 결과의 순위를 계산하는 능력. relevance는 TF/IDF(What Is Relevance? 참고), geo-location에 대한 근접도, fuzzy 유사성, 다른 어떤 알고리즘 등을 이용하여 계산된다.

Analysis

The process of converting a block of text into distinct, normalized tokens (see Analysis and Analyzers) in order to (a) create an inverted index and (b) query the inverted index.

(a) inverted index를 생성하고, (b) inverted index에 query하기 위해, 텍스트 데이터를, 별개의, 정규화된 token으로 바꾸는 프로세스 (Analysis and Analyzers 참고)

As soon as we talk about either relevance or analysis, we are in the territory of queries, rather than filters.

relevance나 analysis에 대해 이야기 하면서, 이제 우리는 filter 보다는, query의 영역에 들어섰다.

'2.X > 2. Search in Depth' 카테고리의 다른 글

2-1-5. Dealing with Null Values  (0) 2017.09.30
2-1-6. All About Caching  (0) 2017.09.30
2-2-1. Term-Based Versus Full-Text  (0) 2017.09.30
2-2-2. The match Query  (0) 2017.09.30
2-2-3. Multiword Queries  (0) 2017.09.30