검색엔진/형태소

14. 조사/어미의 음절 특성

문죄송 2016. 6. 9. 11:32

14.1 문법 형태소의 특성

    1. 복합조사와 복합어미를 포함한 조사와 어미는 미등록어가 거의 없다.
    2. 조사와 어미는 사용 빈도에 따라 도빈도어와 저빈도어로 구분 된다.
    3. 문법형태소는 형태소 분석 등 한국어 분석 시스템에서 중요한 역할을 한다.

14.2 조사/어미의 출현빈도

    1. 조사/어미 빈도조사
        * 한국어 형태소 분석기를 이용하여 말뭉치의 각 단어에 대하여 현태소 분석을 한다.
        * 형태소 분석된 단어 중에서 추정된 결과 및 분석실패 어절을 제외하고, 분석 성공 및 복합명사로 추정된 단어에 대하여 조사와 어미를 추출한다.
        * 추출된 조사를 출현 빈도에 따라 정렬하여 각 조사의 츨현 횟수(단순 빈도) 및 모든 조사의 출현횟수 합계에 대한 각 조사의 상대적 출현빈도
            (상대빈도) 를 계산한다. 어미에 대해서도 동일한 방법으로 단순빈도와 상대빈도를 계산한다.

    2. 출현빈도 분석

    3. 문법 형태소 사전의 구성

14.3 조사와 어말어미의 인식

    1. 조사 인식
        * 자음으로 끝나는 체언하고만 결합하는 조사 : 이, 은, 을, 과, 아
        * 모음으로 끝나는 체언하고만 결합하는 조사 : 가, 는, 를, 와, 고, 다, 든, 라, 랑, 며, 야, 여

    2. 어말어미 인식