README.md

hunspell 한국어 데이터, 개발 정보

오픈소스 데스크톱에 널리 사용되는 hunspell 맞춤법 검사 프로그램에서 동작하는 (현재 유일한) 한국어 맞춤법 사전입니다.

현재 여러 리눅스 배포판과 오픈소스 애플리케이션에서 동작합니다.

  • 단어 단위 맞춤법 검사
  • 불규칙 활용을 포함한 용언 활용 등 교착어인 한국어의 특징에 맞게 구현
  • hunspell 맞춤법 검사를 사용하는 프로그램이라면 수정 없이도 한국어 맞춤법 검사가 동작
  • 오픈소스 배포 가능한 단어 데이터 사용

Github 다운로드 (소스 및 aff/dic 파일)

이용하기

이 곳에는 소스 코드가 들어 있습니다. 맞춤법 검사 기능을 사용하려면 OS별 패키지를 설치하시거나, 여러 가지 애플리케이션별 확장 기능을 이용하십시오. 또는 빌드한 사전 파일을 사용할 수도 있습니다.

사전 파일은 ko.aff 파일과 ko.dic 파일 2개로 이루어져 있고 hunspell 사전이 저장되는 위치에 복사해 사용할 수도 있습니다.

리눅스 배포판에 들어 있는 브라우저나 오피스 프로그램은 보통 내장된 hunspell을 사용하도록 빌드되어 있습니다. 그러니 배포판에 포함된 패키지를 설치하면 프로그램별 확장 기능을 따로 설치하지 않아도 됩니다.

  • 데비안: hunspell-ko 패키지 설치, 6.0 (squeeze) 이후 패키지 정보
  • 우분투: hunspell-ko 패키지 설치, 9.10 (karmic) 이후 패키지 정보
  • 페도라: hunspell-ko 패키지 설치, fc12 이후 패키지 정보
  • Mac OS X 10.5: BaramSpellChecker
  • Mac OS X 10.6 이상: /Library/Spelling 또는 홈폴더/Library/Spelling 아래 aff/dic 파일 복사
  • Mozilla/Firefox 부가 기능
  • LibreOffice 및 OpenOffice.org 부가 기능

hunspell 버전 정보

ko.dic 파일에는 표제어 데이터가 들어 있고 ko.aff (affix) 파일에는 단어의 활용 정보가 들어갑니다. aff 파일과 dic 파일은 hunspell의 전신인 myspell에서도 이용하는 형식이지만 한국어 데이터는 hunspell에만 들어 있는 기능이 필요하기 때문에 hunspell에서만 동작합니다.

  • 현재의 모든 기능을 사용하려면 hunspell 1.2.14 이상 버전이 필요합니다.
  • hunspell 1.6.0 버전은 버그로 대치어의 인코딩이 잘못됩니다. 1.4.x 이하 또는 1.6.1 이상 버전을 사용하십시오.
  • 대부분의 최근 OS와 애플리케이션은 이보다 높은 버전을 사용하고 있으나, 예외적으로 맥오에스에 내장된 hunspell은 1.2.8을 사용하고 있습니다.
  • hunspell 1.2.8에서는 이상 동작을 막기 위해 1.2.8용으로 빌드한 aff 및 dic 파일이 필요합니다. 단 일부 동작하지 않는 기능이 있습니다.
  • hunspell 커맨드라인에서 사용할 경우 1.2.11 이전 버전은 한글로 된 단어를 제대로 분리하지 못해 동작하지 않습니다.
  • 최근 버전에서도 알려진 문제점으로 hunspell 커맨드라인에서 사용할 때 '+' 기호로 시작하는 어근이 제대로 변환되지 않습니다.

기타 정보

이 프로젝트는 2017년부터 공개SW개발자Lab의 지원을 받고 있습니다. http://kosslab.kr