1.1 정보검색이란?
직관적인 레코드를 비교보다 질의어와 텍스트를 비교한다는것은 훨씬 어려운 일
이 비교를 정확히 수행하는 컴퓨터 알고리즘을 설계하는 일이 정보검색의 핵심
어플리케이션의 종류
웹검색 : 웹문서를 검색
기업용검색 : 기업인트라넷에 산재되어 있는 다량의 다양한 컴퓨터 파일들에서 필요한 정보를 찾아낸다.
데스크톱 검색 : 기업용 검색의 개인버전, 개인 컴퓨터에 저장된 파일을 검색
p2p 검색 : 어떠한 중앙집중의 제어 없이 컴퓨터의 네트워크에서 정보를 검색
태스크의 종류
질의기반검색 : 질의를 통한 문서검색
필터링 : 관심사를 검출하여 알림
분류 : 정의된 레이블이나 클래스집합에 문서를 자동으로 할당
질의 응답 : 질의검색 보다 좀더 명확한 질문에 대한처리. 문서의 리스트가 아닌 텍스트에서 발견되는 특정응답을 반환
1.2 주요쟁점
적합성 : 순위 부여 알고리즘을 통해 판단
평가 : 문서 순위 부여의 품질은 사용자의 기대와 얼마나 잘 일치하느냐에 달렸다.
사용자와 정보요구 : 특정성의 결여에도 불구하고 한단어 질의는 웹검색에서 매우흔하다.
질의추천, 질의확장 적합성피드백 같은 기술로 상호작용과 문맥을 사용하여 초기질의를 정련한다.
'검색엔진 > 정보검색' 카테고리의 다른 글
6. 질의와 인터페이스 (0) | 2016.04.14 |
---|---|
5. 색인을 이용한 순위부여 (0) | 2016.04.07 |
4. 텍스트 처리 (0) | 2016.03.28 |
3.문서수집 (0) | 2016.02.18 |
2. 검색엔진의 구조 (0) | 2016.02.12 |