binary tree1 [Information Retrieval] 정보 검색 3. Dictionaries and Tolerant Retrieval 1. dictionary data structure사전에는 term , document frequency, postings list 를 저장하고 있음brutus 라는 단어는 1, 2, 4, 11, 31 등의 문서에서 나오고 단어가 등장하는 문서의 id는 postings list에 저장함 * a simple dictionary각 단어에 대해 구조체를 정의하고 구조체 내에 term 단어, docFreq 문서 빈도, postings 포스팅 리스트를 저장함 검색할 때 요소를 빠르게 찾기 위해서 메모리에 효율적으로 저장해야하고그 방법으로는 해시 테이블과 트리가 있음 * hash table각 단어를 고유한 정수로 변환하는 해싱을 통해 얻은 그 정수를 인덱스로 데이터를 저장 장점 - 트리보다 더 빠르게 검색 가능 단.. 2024. 10. 27. 이전 1 다음 728x90