쿼리 벡터1 [Information Retrieval] 정보 검색 6. Scoring, Term Weighting, and the Vector Space Model 1. Problems with Boolean Search - 결과가 너무 많음단순히 포함한다는 조건만으로 너무 많이 도출. 사용성 악화- 조건을 충족하거나 충족하지 않는 이분법적 방식결과의 순위 매기기 불가능. 중요한 결과와 덜 중요한 결과 구분 불가 2. 순위 기반 검색의 기초 - Scoring* 순위 기반 검색 장점- 검색 결과가 많더라도 정렬해서 보여줄 수 있음- 사용자도 더 중요한 문서를 쉽고 찾게 확인 가능 * 순서 부여 방법- 특정 쿼리와 문서가 얼마나 잘 일치하는지 문서마다 점수 부여 [0,1]- 점수가 높을수록 관련성 높은 문서 * 쿼리와 문서의 매칭 점수 계산- (쿼리, 문서) 쌍에 점수를 부여해서 그 점수 기반으로 관련성 계산- 쿼리 텀이 문서에 없다면 점수는 0점- 쿼리 텀이 문서 안.. 2024. 10. 31. 이전 1 다음 728x90