검색엔진/형태소
9. 한국어 형태소 분석 개요
문죄송
2016. 5. 30. 10:30
9.1 형태소의 정의
- 의미가 있는 최소의 단위
- 문법적, 관계적인 뜻을 나타내는 단어 또는 단어의 부분
- 일정한 버위 안에서 쓰이는 낱말의 총체
- 어떤 강애의 낱말을 간단한 풀이를 붙여 차례대로 벌여놓은 낱말의 집단
9.2 형태소 분석의 정의
여러 형태소들의 묶음이 표층형태로 나타나는 하나의 단어로부터 의미를 갖는 최소 단위 인 형태소들을 분리하고각 형태소의 품사를 결정
- 형태소 분석의 처리 단위는 띄어쓰기에 의해 구별되는 문자열이다.
- 입력 문자열은 하나 혹은 둘 이상의 형태소로 이루어진다.
- 형태소는 형태론적 변형 규칙에 따라 변형이 일어날 수 있다.
- 분석 알고리즘은 형태소 사전과 분석 규칙을 기반으로 한다.
- 중의성이 있는 어절에 대해 가능한 모든 북석 결과를 생성한다.
9.3 형태소 분석 예
9.4 중의성 문제
9.5 언어 이론과 형태소 이론
언어학에서 형태론은 언어능력을 가진 인간이 언어를 표출했을 때 단어의 어휘형으로부터 표층형으로 발화되는 과정을 규명하기 위한 모델 혹은
일반화된 규칙인것에 비해 전산학에서 형태론은 형태소 분석 또는 어휘분석 프로그램을 작성하기 위하여 인간이 작성한 문서에서 발견되는 표층형
으로부터 어휘형을 인식하는 방법론
9.6 자연 언어 처리와 형태소 분석
9.7 경험주의적 방법론