2.X/1. Getting Started

1. Getting Started

drscg 2017. 10. 1. 12:30

Elasticsearch is a real-time distributed search and analytics engine. It allows you to explore your data at a speed and at a scale never before possible. It is used for full-text search, structured search, analytics, and all three in combination:

Elasticsearch 는 실시간 분산 검색 엔진이고 분석 엔진이다. 기존에는 불가능했던 속도와 규모로 데이터를 탐색 할 수 있다. full-text 검색, 구조화된 검색, 분석, 그리고 이 3개 모두를 조합하여 사용된다.

  • Wikipedia uses Elasticsearch to provide full-text search with highlighted search snippets, and search-as-you-type and did-you-mean suggestions.

    Wikipedia 는 강조된 검색 정보를 가진 full-text 검색, instant 검색(search-as-you-type)검색 제안(정확한 의미를 파악한 제안: did-you-mea suggestions) 등의 기능을 제공하기 위해 Elasticsearch를 사용한다.

  • The Guardian uses Elasticsearch to combine visitor logs with social -network data to provide real-time feedback to its editors about the public’s response to new articles.

    Guardian 은 뉴스에 대한 대중의 반응을 편집자들에게 실시간으로 feedback하기 위해, 방문자의 log와 SNS 데이터를 조합하는데 Elasticsearch를 사용한다.

  • Stack Overflow combines full-text search with geolocation queries and uses more-like-this to find related questions and answers.

    Stack Overflow 는 위치정보 query를 full-text search와 조합하고, 관련된 질의/응답을 찾기 위해 더 비슷한 것(more-like-this) 를 사용한다.

  • GitHub uses Elasticsearch to query 130 billion lines of code.

    GitHub 는 1,300억 라인의 코드를 검색하기 위해 Elasticsearch를 사용한다.

But Elasticsearch is not just for mega-corporations. It has enabled many startups like Datadog and Klout to prototype ideas and to turn them into scalable solutions. Elasticsearch can run on your laptop, or scale out to hundreds of servers and petabytes of data.

하지만, Elasticsearch는 거대 기업만을 위한 것은 아니다. Elasticsearch는 DataDogsKlouts 같은 많은 startup이 아이디어를 시험하고, 아이디어를 더 규모 있는 solution으로 바꾸는 것을 가능하게 했다. Elasticsearch는 노트북에서도 실행이 되고, 수백 개의 서버와 수 PB(PetaByte)의 데이터로 확장(scale out)할 수 있다.

No individual part of Elasticsearch is new or revolutionary. Full-text search has been done before, as have analytics systems and distributed databases. The revolution is the combination of these individually useful parts into a single, coherent, real-time application. It has a low barrier to entry for the new user, but can keep pace with you as your skills and needs grow.

Elasticsearch의 모든 부분이 새롭거나 혁명적이다. full-text 검색은 분석 시스템, 분산 데이터베이스와 마찬가지로, 기존에도 존재했다. 혁명적인 부분은 이들 각각의 유용한 부분들을 하나로, 일관되게, 실시간 응용프로그램으로 조합했다는 사실이다. 새로운 사용자가 되기 위한 진입 장벽도 매우 낮다. 하지만, 여러분의 기술과 수요의 증가함에 따라 보조를 맞출 수 있다.

If you are picking up this book, it is because you have data, and there is no point in having data unless you plan to do something with it.

여러분이 이 책을 선택했다면, 여러분이 데이터를 가지고 있기 때문이다. 그 데이터를 가지고 _뭔가를 할_ 계획이 없다면, 데이터를 가지고 있을 이유가 없다.

Unfortunately, most databases are astonishingly inept at extracting actionable knowledge from your data. Sure, they can filter by timestamp or exact values, but can they perform full-text search, handle synonyms, and score documents by relevance? Can they generate analytics and aggregations from the same data? Most important, can they do this in real time without big batch-processing jobs?

불행하게도, 대부분의 데이터베이스는 데이터에서 사용할 수 있는 지식을 꺼내오는데 있어 놀라울 만큼 부적절하다. 물론, timestamp나 정확한 값에 의해 걸러내는 것은 가능하다. 하지만 full-text 검색, 동의어 다루기, 관련성(relevance)으로 document의 score를 계산하는 것이 가능한가? 동일한 데이터로부터 분석하고 aggregation하는 것이 가능한가? 무엇보다 중요한 것은, 거대한 일괄 처리 작업 없이 실시간으로 이런 것들을 할 수 있는가?

This is what sets Elasticsearch apart: Elasticsearch encourages you to explore and utilize your data, rather than letting it rot in a warehouse because it is too difficult to query.

이것이 Elasticsearch를 돋보이게 하는 점이다. Elasticsearch는 query가 너무 어려워서 warehouse에 쌓아두기 보다는, 데이터를 탐색하고 활용하기를 권장한다.

Elasticsearch is your new best friend.

Elasticsearch는 여러분의 새로운, 최고의 친구가 될 것이다.

'2.X > 1. Getting Started' 카테고리의 다른 글

1-01. You Know, for Search…  (0) 2017.10.01
1-01-01. Installing and Running Elasticsearch  (0) 2017.10.01
1-01-02. Talking to Elasticsearch  (0) 2017.10.01
1-01-03. Document Oriented  (0) 2017.10.01
1-01-04. Finding Your Feet  (0) 2017.10.01