다국어 5

3-1-3. Pitfalls of Mixing Languages

If you have to deal with only a single language, count yourself lucky. Finding the right strategy for handling documents written in several languages can be challenging.단일 언어만 다룬다면, 운이 아주 좋은 경우이다. 여러 가지 언어로 작성된 document를 다루는 올바른 방법을 찾는다는 것은 쉽지 않다.At Index TimeeditMultilingual documents come in three main varieties:다국어 document는 3가지 정도로 나눌 수 있다.One predominant language per document, which may con..

3-1-4. One Language per Document

A single predominant language per document requires a relatively simple setup. Documents from different languages can be stored in separate indices—blogs-en, blogs-fr, and so forth—that use the same type and the same fields for each index, just with different analyzers:document별로 하나의 두드러진 언어가 있으면, 상대적으로 간단한 설정이 요구된다. 서로 다른 언어로 된 document는 개별 indices(blog-en, blog-fr 등)에 저장할 수 있다. 이들은 각 index에서 동..

3-1-5. One Language per Field

For documents that represent entities like products, movies, or legal notices, it is common for the same text to be translated into several languages. Although each translation could be represented in a single document in an index per language, another reasonable approach is to keep all translations in the same document:상품, 영화, 법적 고지같은 요소를 나타내는 document의 경우, 동일한 문장(text)을 여러 가지 언어로 번역하는 것이 일반적이다..

3-1-6. Mixed-Language Fields

Usually, documents that mix multiple languages in a single field come from sources beyond your control, such as pages scraped from the Web:일반적으로, 하나의 field에 여러 가지 언어가 섞여 있는 document는, web에서 스크랩한 페이지처럼, 통제할 수 없는 소스에서 나타난다.{ "body": "Page not found / Seite nicht gefunden / Page non trouvée" }They are the most difficult type of multilingual document to handle correctly. Although you can simply use ..

3-3-6. Sorting and Collations

So far in this chapter, we have looked at how to normalize tokens for the purposes of search. The final use case to consider in this chapter is that of string sorting.지금까지 이 장에서, 검색을 목적으로, token을 정규화하는 방법을 살펴보았다. 이 장에서 고려할 마지막 사용 사례는 문자열의 정렬 사례이다.In String Sorting and Multifields, we explained that Elasticsearch cannot sort on an analyzed string field, and demonstrated how to use multifields to ..