23.1 개요
23.2 주제어 추출 기법
1. 어절 단위 : 용어의 특성 정보
복합명사, 미등록어
1음절명사, 보통명사
명사의 길이
'지금/현재/작년' 등 시간성 명사
조사 유형 : '은/는/이/가/을/를/의/만/도/에' 등
2. 문장 단위 : 용어의 구문록적 기능
복합어 구성 여부
주절 혹은 종속절의 주어/목적어/보어/관형어 등
3. 문서 단위 : 용어가 출현한 문장의 특성
문장의 위치 : 제목, 앞 부분, 뒷 부분. 중간 부분
문장의 중요도 : 접속부사 등 수사 어구에 의한 문장의 중요도
4. 기타
용어의 출현빈도
Coreference 관계에 의한 용어의 중요도
22.3 경험적 방법에 의한 가중치 부여
각 용어의 유형에 대한 가중치를 경험적인 방법으로 결정하는 것
22.4 실험 및 평가
'검색엔진 > 형태소' 카테고리의 다른 글
25. 수사 어절 정규화 (0) | 2016.06.15 |
---|---|
24. 복합명사 분해 (0) | 2016.06.15 |
22. 색인어 추출 기법 (0) | 2016.06.15 |
21. 복수어 단위 형태소 분석 (0) | 2016.06.15 |
20. 형태론적 중의성 해결 (0) | 2016.06.14 |