ElastciSearch 3

[ElasticSearch] ElasticSearch 인덱스 생성, 조회, 삭제 명령어 살펴보기

TEST 환경 ES 버전 : 7.11.2 📌 ElasticSearch의 인덱스 조회, 생성, 삭제 명령어 1) ElasticSearch Cluster 상태 확인 명령어 curl --location --request GET 'http://localhost:9200/_cat/health?v' 결과 2) 인덱스 조회 명령어 curl --location --request GET 'http://localhost:9200/_cat/indices?v' 결과 3) 인덱스 생성 명령어 curl --location --request PUT 'http://localhost:9200/books(생성할 인덱스 작성)' 결과 { "acknowledged": true, "shards_acknowledged": true, "inde..

ElastciSearch 2021.06.13

Khaiii - 카카오 형태소 분석기( 설치 방법, 정의 등 )

khaiii란? - 카카오에서 개발한 세번째 형태소 분석기 - CNN(Convolutional Neural Network) 신경망 알고리즘 사용 Khaiii 설치 방법 ※ 조건 1. Khaiii는 Window환경을 지원하지 않는다. 2. C++로 개발되었기 때문에 gcc/clang 컴파일러가 필요하다. ※ 빌드 툴 pip install cmake CMake 3.10 이상 필요 CMake란? CMake는 소프트웨어를 빌드, 테스트 및 패키징하기 위해 설계된 크로스 플랫폼 오픈 소스 툴 제품군 CMake는 간단한 플랫폼과 컴파일러 독립 구성 파일을 사용하여 소프트웨어 컴파일 프로세스를 제어하고 사용자가 선택한 컴파일러 환경에서 사용할 수 있는 네이티브 메이크 파일과 워크스페이스를 생성하는 데 사용된다. ※ ..

ElastciSearch 2021.05.16

[ElasticSearch] nori analyzer 옵션 살펴보기

Nori Analyzer 란? ElasticSearch에서 공식적으로 제공하는 한글 형태소분석기 mecab-ko-dic 사전을 재가공 하여 사용 1개의 토크나이저와 2개의 토큰 필터를 가지고 있음 ElasticSearch에서 사용가능한 한글 형태소 분석기 종류 1. Nori Analyzer 2. 아리랑 3. 은전한닢 (seunjeon) 4. Open Korean Text nori_tokenizer decompound_mode 복합 토큰을 어떻게 처리할지 결정하는 방식 정하기 none 가거도항 가곡역 이런 것들을 나누지 않고 그대로 사용한다는 것 discard 가곡역 -> 가곡, 역 (최소한의 단위로 나누는 느낌) default mixed 가곡역 => 가곡역, 가곡, 역 discard_punctuation..

ElastciSearch 2021.04.01