ElastciSearch

Khaiii - 카카오 형태소 분석기( 설치 방법, 정의 등 )

GaGah 2021. 5. 16. 17:18

khaiii란?

- 카카오에서 개발한 세번째 형태소 분석기

- CNN(Convolutional Neural Network) 신경망 알고리즘 사용

 

 

Khaiii 설치 방법

※ 조건

    1. Khaiii는 Window환경을 지원하지 않는다. 

    2. C++로 개발되었기 때문에 gcc/clang 컴파일러가 필요하다.

 

※ 빌드 툴

pip install cmake
    • CMake 3.10 이상 필요
    • CMake란?
      • CMake는 소프트웨어를 빌드, 테스트 및 패키징하기 위해 설계된 크로스 플랫폼 오픈 소스 툴 제품군
      • CMake는 간단한 플랫폼과 컴파일러 독립 구성 파일을 사용하여 소프트웨어 컴파일 프로세스를 제어하고 사용자가 선택한 컴파일러 환경에서 사용할 수 있는 네이티브 메이크 파일과 워크스페이스를 생성하는 데 사용된다.

※ Python

    - Khaiii는 실행하기 위한 프로그램과 함께 리소스를 필요로 한다.

    - 리소스는 Python 스크립트를 통해 빌드되는데, Python 3 버전이 필요하다.

 

※ 빌드

mkdir build
cd build
cmake ..

make all 

 

※ 리소스

make resource

   - bin 디렉터리 아래에 생성된 khaiii 프로그램을 실행하기 위해서는 리소스를 빌드해야 한다.

   - 성공적으로 빌드가 되면 share/khaiii 디렉터리 아래에 필요한 리소스 파일들이 빌드된다.

 

※ 설치

make install

   -  프로그램과 리소스가 정상적으로 빌드되었다면, 설치할 수 있다.

   -  PREFIX 경로 아래에 bin, include, lib, share 디렉터리를 생성

 

※ Python 바인딩 

make package_python
cd package_python
pip install .

 

※ 공식문서를 잘 읽어보는 것을 추천한다.

 

※ 겪었던 오류 & 추천

    1. 윈도우에서 Ubuntu 18.04LTS로 설치했을 때, 계속해서 오류가 났다. ( 거의 3일을 소요한 듯 )

         이 부분에서 Ubuntu 18.04LTS를 삭제했다가 재설치했더니 아주 잘 깔렸다. 

         검색해도 나오지 않는 이슈가 나왔을 때는 재설치를 해보는 것을 추천한다.

    2. Docker를 사용해보는 것도 추천한다.

    3. AWS 의 EC2를 생성하여 설치해보는 것도 추천한다.

 

 

 

 

참고링크

1. khaiii github - github.com/kakao/khaiii

 

kakao/khaiii

Kakao Hangul Analyzer III. Contribute to kakao/khaiii development by creating an account on GitHub.

github.com

2. CNN 이란 - https://hobinjeong.medium.com/cnn-convolutional-neural-network-9f600dd3b395

 

CNN(Convolutional Neural Network)이란?

* 20.12.22. update, 블로그 옮겼습니다. 공교롭게도 이 블로그를 시작하자마자 취직을 해서 글을 이어쓸 수 없었네요. 이제라도 다시 시작하려고 합니다.

hobinjeong.medium.com

 

 

LIST