[SOSP'23] SPFresh: Incremental In-Place Update for Billion-Scale Vector Search
·
[ Laboratory ]/Paper review
SPFresh: Incremental In-Place Update for Billion-Scale Vector Search https://dl.acm.org/doi/10.1145/3600006.3613166https://sosp2023.mpi-sws.org/program.html >> Data and databases summarySPFresh는 ANNS 시스템에서 리얼타임 벡터 인덱스 업데이트가 가능한 효율적 방법이다. ANNS 방식을 사용하는 대규모 벡터 데이터셋에서 지속적으로 데이터가 업데이트될 때 기존 시스템이 가지는 한계를 해결하기 위해 제안되었다. 기존 시스템들은 업데이트에 드는 cost를 줄이기 위해 secondary index를 사용하였기 때문에 main index에 주기적으로 merge..
[VLDB'25] VStream: A Distributed Streaming Vector Search System
·
[ Laboratory ]/Paper review
VStream: A Distributed Streaming Vector Search System https://dl.acm.org/doi/10.14778/3725688.3725692https://vldb.org/2025/?program-schedule-2025 >> Research 46: Vector Data Management III summary비정형 데이터 표현을 위해 사용된 기존 벡터 검색 시스템은 batch 기반으로 동작하기 때문에 빠르게 변하는 스트림 데이터를 바로 쿼리에 활용할 수 없어서 검색 최신성이 떨어지고 실시간 서비스에 대한 품질이 저하된다. 그래서 VStream이라는 스트리밍 벡터 검색 시스템을 제안한다. VStream의 핵심 요소는 다이나믹 파티셔너와 계층적인 스토리지, 파이..