12. 한국어 형태소 분석 기법
12.1 형태소 분석 기법의 유형 분류
형태소 분석 모델 : 언어 독립적, 언어 종속적 모델
분석 알고리즘 : 규칙 기반, 사전 기반, 말뭉치 기반
분석 방향 : bottom-up parallel, top-down perdictive
어절 검색 방향 : 좌우 분석, 우좌 분석, 양방향 분석
결합제약 : 어절형성 규칙과 경합제약 규칙, 접속 정보에 의한 결합제약
문법형태소 사전 : 단위형태소 수록, 결합형태소 수록
형태소 처리 단위 : 자소 단위, 음절 단위
12.2 Head-tail 구분법
12.3 Tabular 파싱법
bottom-up 방식에 의한 형태소 분석으로 먼저 어절을 이루고 있는 모든 자모 단위의 부분 문자열에 대해 사전을 탐색한다.
그 결과로 입력 문자열을 구성하는 모든 가능한 형태소들을 추출하여 삼각 테이블에 저장한다.
12.4 양방향 최장일치법
입력 어절에 대한 첫 번쨰 형태소 분석 결과를 생성하는 방법으로 부분 문자열 중에서 가장 긴 형태소를 우선적으로 성택하여 검사하는 것
12.5 음절 단위 분석법
어절의 처리 단위를 자소 단위 대신에 한글의 표기 특성에 따라 음절 단위로 함으로써 한글의 음절 특성을 이용하여 분석 결과를 추혼하는
형태소 분석
12.6 사전 기반 형태소 분석
형태소 분리나 형태론적 변형 문제를 사전을 중심으로 하여 처리하는 기법
12.7 두 단계 확장 모델
형태소 분석 알고리즘의 효율성과 분석 결과의 타당성, 특히 응용 분야의 적응성을 고려하여 다양한 응용 시스템의 요구 사항에 쉽게 적응
12.8 형태소 분석 기법의 비교