본문 바로가기
검색엔진/형태소

23. 용어 가중치 부여 기법

by 문죄송 2016. 6. 15.

23.1 개요

23.2 주제어 추출 기법

    1. 어절 단위 : 용어의 특성 정보
        복합명사, 미등록어
        1음절명사, 보통명사
        명사의 길이
        '지금/현재/작년' 등 시간성 명사
        조사 유형 : '은/는/이/가/을/를/의/만/도/에' 등
   
    2. 문장 단위 : 용어의 구문록적 기능
        복합어 구성 여부
        주절 혹은 종속절의 주어/목적어/보어/관형어 등

    3. 문서 단위 : 용어가 출현한 문장의 특성
        문장의 위치 : 제목, 앞 부분, 뒷 부분. 중간 부분
        문장의 중요도 : 접속부사 등 수사 어구에 의한 문장의 중요도

    4. 기타
        용어의 출현빈도
        Coreference 관계에 의한 용어의 중요도

22.3 경험적 방법에 의한 가중치 부여
    
    각 용어의 유형에 대한 가중치를 경험적인 방법으로 결정하는 것

22.4 실험 및 평가

'검색엔진 > 형태소' 카테고리의 다른 글

25. 수사 어절 정규화  (0) 2016.06.15
24. 복합명사 분해  (0) 2016.06.15
22. 색인어 추출 기법  (0) 2016.06.15
21. 복수어 단위 형태소 분석  (0) 2016.06.15
20. 형태론적 중의성 해결  (0) 2016.06.14