7.1. 검색 모델 개요
정보 검색 연구의 주된 목적은 텍스트가 사람의 정보요구에대해 적합한지를 판별하는 인간의 일련의 과정을 이해하고 형식화 하는데 있었다.
수학적 검색 모델의 형태로 적합성에 대한 이론을 제시할수 있고 인간의 행동과 견주어 그 이론을 검증해 볼 수 있다.
7.1.1. 불리언 검색
불리언 검색 모델은 초기의 검색엔진에서 사용되었고 오늘날에도 여전히 사용되고 있다. 또다은 용어로는 완전 일치 검색이라고 알려져 있으며, 이는
문서가 질의와 정확하다면 검색되고 그렇지않으면 검색되지 않는다. 모델의 결과가 예측 가능하고, 사용자들에게 설명하기 쉽고, 메타데이터를
직관적으로 포함할 수 있지만, 효과성이 전적으로 사용자에게 달려 있다는것이 단점이다.
7.1.2. 벡터 공간 모델
단어 가중치 부여, 순위 부여, 적합성 피드백의 구현을 위한 간단하면서도 직관적으로 매력적인 프레임워크.
7.2. 확률 기반 모델
질의에 대한 문서의 적합성이 다른 문서에 독립적이라는 가정과 같이 몇가지를 가정하면, 적합 확률에 따른 순위 부여가 어떤 주어진 순위에서
정확률을 최대화 할 수 있다.
7.2.1. 분류로서의 정보 검색
새로운 문서가 주어지면, 검색엔진이 할 일은 문서가 적합 문서 집합에 속하는지 부적합 문서 집합에 속하는지를 결정한다. 즉 시스템은
문서를 적합이나 부적합으로 분류하고, 적합하다면 그것을 검색한다.
7.3. 언어 모델에 기반한 순위 부여
언어 모델은 음성인식, 기계번역, 필기인식과 같은 다양한 언어 기술에서 텍스트를 표현하는데 사용되며, 언어 콜렉션에 대한 색인 어휘 내의 모든
단어들의 출현 확률을 연관짓는데 사용된다.
7.3.1. 질의 가능도 순위 부여
질의 가능도 검색모델에서는, 질의 텍스트가 문서 언어 모델에 의해 생성될 확률에 따라 순위를 부여한다. 즉, 문서를 표현하는 단어에서 질의 단어들을 꺼낼수 있을 확률을 계산한다.
7.3.2. 적합성 모델과 의사 적합성 피드백
질의의 주제를 언어로 표현하는 것
7.4 복합 질의와 증거 결합
문서의 잠재적인 적합성에 대한 많은 증거들의 결합
7.4.1. 추론 네트워크 모델
사건 집합과 이 사건들 사이의 의존성을 명시하는데 사용되는 확률 모델
7.4.2. Galago 질의 언어
galago 질의 언어는 다양한 검색 애플리케이션을 위햐 그런 언어들의 가장 유용한 측면들에 초점을 맞추고, 임의의 자질을 사용할수 있는 기능
7.5. 웹검색
7.6. 기계학습과 정보 검색
7.6.1. 순위 부여 학습
7.6.2. 주제 모델과 어휘 불일치
7.7. 애플리케이션 기반 모델
매우 다양한 검색 모델과 순위부여 알고리즘, 검색 애플리케이션에 대한 순위부여 알고이즘의 커스터마이징을 위해 질의, 문서, 접합성 판단으로
이루어진 테스트컬렉션 구축,
문서를 표현하는 게에 어떤 증거나 자질이 사용될수 있는지 확인
'검색엔진 > 정보검색' 카테고리의 다른 글
9. 분류, 필터링, 스팸 (0) | 2016.04.26 |
---|---|
8. 검색엔진의 평가 (0) | 2016.04.26 |
6. 질의와 인터페이스 (0) | 2016.04.14 |
5. 색인을 이용한 순위부여 (0) | 2016.04.07 |
4. 텍스트 처리 (0) | 2016.03.28 |