khaiii란?
- 카카오에서 개발한 세번째 형태소 분석기
- CNN(Convolutional Neural Network) 신경망 알고리즘 사용
Khaiii 설치 방법
※ 조건
1. Khaiii는 Window환경을 지원하지 않는다.
2. C++로 개발되었기 때문에 gcc/clang 컴파일러가 필요하다.
※ 빌드 툴
pip install cmake
- CMake 3.10 이상 필요
- CMake란?
- CMake는 소프트웨어를 빌드, 테스트 및 패키징하기 위해 설계된 크로스 플랫폼 오픈 소스 툴 제품군
- CMake는 간단한 플랫폼과 컴파일러 독립 구성 파일을 사용하여 소프트웨어 컴파일 프로세스를 제어하고 사용자가 선택한 컴파일러 환경에서 사용할 수 있는 네이티브 메이크 파일과 워크스페이스를 생성하는 데 사용된다.
※ Python
- Khaiii는 실행하기 위한 프로그램과 함께 리소스를 필요로 한다.
- 리소스는 Python 스크립트를 통해 빌드되는데, Python 3 버전이 필요하다.
※ 빌드
mkdir build
cd build
cmake ..
make all
※ 리소스
make resource
- bin 디렉터리 아래에 생성된 khaiii 프로그램을 실행하기 위해서는 리소스를 빌드해야 한다.
- 성공적으로 빌드가 되면 share/khaiii 디렉터리 아래에 필요한 리소스 파일들이 빌드된다.
※ 설치
make install
- 프로그램과 리소스가 정상적으로 빌드되었다면, 설치할 수 있다.
- PREFIX 경로 아래에 bin, include, lib, share 디렉터리를 생성
※ Python 바인딩
make package_python
cd package_python
pip install .
※ 공식문서를 잘 읽어보는 것을 추천한다.
※ 겪었던 오류 & 추천
1. 윈도우에서 Ubuntu 18.04LTS로 설치했을 때, 계속해서 오류가 났다. ( 거의 3일을 소요한 듯 )
이 부분에서 Ubuntu 18.04LTS를 삭제했다가 재설치했더니 아주 잘 깔렸다.
검색해도 나오지 않는 이슈가 나왔을 때는 재설치를 해보는 것을 추천한다.
2. Docker를 사용해보는 것도 추천한다.
3. AWS 의 EC2를 생성하여 설치해보는 것도 추천한다.
참고링크
1. khaiii github - github.com/kakao/khaiii
2. CNN 이란 - https://hobinjeong.medium.com/cnn-convolutional-neural-network-9f600dd3b395
'ElastciSearch' 카테고리의 다른 글
[ElasticSearch] ElasticSearch 인덱스 생성, 조회, 삭제 명령어 살펴보기 (0) | 2021.06.13 |
---|---|
[ElasticSearch] nori analyzer 옵션 살펴보기 (0) | 2021.04.01 |