본문 바로가기
검색엔진/형태소

14. 조사/어미의 음절 특성

by 문죄송 2016. 6. 9.

14.1 문법 형태소의 특성

    1. 복합조사와 복합어미를 포함한 조사와 어미는 미등록어가 거의 없다.
    2. 조사와 어미는 사용 빈도에 따라 도빈도어와 저빈도어로 구분 된다.
    3. 문법형태소는 형태소 분석 등 한국어 분석 시스템에서 중요한 역할을 한다.

14.2 조사/어미의 출현빈도

    1. 조사/어미 빈도조사
        * 한국어 형태소 분석기를 이용하여 말뭉치의 각 단어에 대하여 현태소 분석을 한다.
        * 형태소 분석된 단어 중에서 추정된 결과 및 분석실패 어절을 제외하고, 분석 성공 및 복합명사로 추정된 단어에 대하여 조사와 어미를 추출한다.
        * 추출된 조사를 출현 빈도에 따라 정렬하여 각 조사의 츨현 횟수(단순 빈도) 및 모든 조사의 출현횟수 합계에 대한 각 조사의 상대적 출현빈도
            (상대빈도) 를 계산한다. 어미에 대해서도 동일한 방법으로 단순빈도와 상대빈도를 계산한다.

    2. 출현빈도 분석

    3. 문법 형태소 사전의 구성

14.3 조사와 어말어미의 인식

    1. 조사 인식
        * 자음으로 끝나는 체언하고만 결합하는 조사 : 이, 은, 을, 과, 아
        * 모음으로 끝나는 체언하고만 결합하는 조사 : 가, 는, 를, 와, 고, 다, 든, 라, 랑, 며, 야, 여

    2. 어말어미 인식

'검색엔진 > 형태소' 카테고리의 다른 글

16. 불규칙 용언  (0) 2016.06.14
15. 선어말 어미  (0) 2016.06.09
13. 형태소 분석과 후보 생성  (0) 2016.06.01
12. 한국어 형태소 분석 기법  (0) 2016.06.01
11. 형태소 분석 방법론  (0) 2016.06.01