검색엔진/형태소
14. 조사/어미의 음절 특성
문죄송
2016. 6. 9. 11:32
14.1 문법 형태소의 특성
1. 복합조사와 복합어미를 포함한 조사와 어미는 미등록어가 거의 없다.
2. 조사와 어미는 사용 빈도에 따라 도빈도어와 저빈도어로 구분 된다.
3. 문법형태소는 형태소 분석 등 한국어 분석 시스템에서 중요한 역할을 한다.
14.2 조사/어미의 출현빈도
1. 조사/어미 빈도조사
* 한국어 형태소 분석기를 이용하여 말뭉치의 각 단어에 대하여 현태소 분석을 한다.
* 형태소 분석된 단어 중에서 추정된 결과 및 분석실패 어절을 제외하고, 분석 성공 및 복합명사로 추정된 단어에 대하여 조사와 어미를 추출한다.
* 추출된 조사를 출현 빈도에 따라 정렬하여 각 조사의 츨현 횟수(단순 빈도) 및 모든 조사의 출현횟수 합계에 대한 각 조사의 상대적 출현빈도
(상대빈도) 를 계산한다. 어미에 대해서도 동일한 방법으로 단순빈도와 상대빈도를 계산한다.
2. 출현빈도 분석
3. 문법 형태소 사전의 구성
14.3 조사와 어말어미의 인식
1. 조사 인식
* 자음으로 끝나는 체언하고만 결합하는 조사 : 이, 은, 을, 과, 아
* 모음으로 끝나는 체언하고만 결합하는 조사 : 가, 는, 를, 와, 고, 다, 든, 라, 랑, 며, 야, 여
2. 어말어미 인식