[SOSP'23] SPFresh: Incremental In-Place Update for Billion-Scale Vector Search
·
[ Laboratory ]/Paper review
SPFresh: Incremental In-Place Update for Billion-Scale Vector Search https://dl.acm.org/doi/10.1145/3600006.3613166https://sosp2023.mpi-sws.org/program.html >> Data and databases summarySPFresh는 ANNS 시스템에서 리얼타임 벡터 인덱스 업데이트가 가능한 효율적 방법이다. ANNS 방식을 사용하는 대규모 벡터 데이터셋에서 지속적으로 데이터가 업데이트될 때 기존 시스템이 가지는 한계를 해결하기 위해 제안되었다. 기존 시스템들은 업데이트에 드는 cost를 줄이기 위해 secondary index를 사용하였기 때문에 main index에 주기적으로 merge..
[SOSP'25] HedraRAG: Co-Optimizing Generation and Retrieval for Heterogeneous RAG Workflows
·
[ Laboratory ]/Paper review
HedraRAG: Coordinating LLM Generation and Database Retrieval in Heterogeneous RAG Servinghttps://dl.acm.org/doi/10.1145/3731569.3764806https://sigops.org/s/conferences/sosp/2025/schedule.html summaryLLM이 답변을 제공하기 위해서는 검색과 생성의 단계를 거치게 되는데 검색과 생성은 각각 CPU와 GPU를 사용하기 때문에 작업 단계마다 사용하는 하드웨어 자원이 다르다. 작업이 단순했던 과거와 달리 점점 더 다단계 추론이 복잡해지고 목적에 따라 워크플로우의 구조가 다양해지기 때문에 리소스를 효율적으로 사용하기 어렵다. 또한 LLM은 토큰을 조금씩 생성해..
[SOSP'25] How to Copy Memory? Coordinated Asynchronous Copy as a First-Class OS Service
·
[ Laboratory ]/Paper review
How to Copy Memory? Coordinated Asynchronous Copy as a First-Class OS Servicehttps://dl.acm.org/doi/10.1145/3731569.3764800https://sigops.org/s/conferences/sosp/2025/schedule.htmlACM의 SIGPOPS Symposium on Operating System Principles에서 Best paper로 선정된 논문이다.summary메모리 복사 최적화에 대한 연구는 계속 진행되어 왔지만 메모리 복사는 여전히 현대의 운영체제와 애플리케이션 전반에서 성능 병목의 메인 원인이다. 기존의 복사 최적화 기법들은 특정 환경이나 임계값 이상의 데이터 크기에서만 효과를 보여 일반적인 ..