RAGAI Engineering

pgvector, Pinecone, Weaviate: 2026년 어떻게 고를 것인가

AI 아키텍트의 시각으로 2026년 벡터 데이터베이스를 어떻게 골라야 하는지 정리한 가이드입니다. pgvector로 시작하고, 필요해질 때 마이그레이션하세요. 어떤 옵션이 어떤 상황에서 우위인지, 성능 수치는 무엇을 의미하는지 다룹니다.

9 min read

섹션 01 · 선택

RAG에서 벡터 DB 선택이 중요한 이유

벡터 데이터베이스는 RAG 파이프라인의 검색 레이어입니다. 그 성능, 운영 모델, 규모별 비용이 RAG 시스템의 신뢰성·유지보수성·경제성을 결정합니다.

빠른 답변

짧게 답하면: Postgres를 이미 운영 중이라면 pgvector로 시작하세요 — 약 1,000만 벡터까지 프로덕션 등급이며 추가 비용이 들지 않습니다. 그 한계를 넘어 매니지드 규모가 필요해지면 Pinecone을 쓰세요. 네이티브 하이브리드 검색이나 대규모에서의 자체 호스팅 통제가 필요하다면 Weaviate를 쓰세요.

많은 엔지니어가 모든 옵션을 모든 차원에서 동시에 줄 세우는 비교 글을 읽고 벡터 DB를 고릅니다. 더 유용한 프레임은 마이그레이션 경로입니다. 무엇으로 시작해야 하고, 어떤 신호가 마이그레이션을 트리거해야 하는가.

답은 거의 언제나 pgvector입니다. 기존 데이터베이스 안에서 동작하는 Postgres 확장이며, 새 인프라도, 새 운영 부담도, 추가 비용도 없습니다. 기존 백업, 모니터링, 접근 통제가 그대로 적용됩니다. 1,000만 벡터 미만 — 시드부터 시리즈 A까지의 사용 사례 대부분을 포괄합니다 — 에서는 전용 벡터 스토어와 비교해 성능에서 충분히 경쟁력 있습니다.

섹션 02 · 옵션 1

pgvector: 특별한 이유가 없다면 여기서 시작하세요

pgvector는 PostgreSQL에 벡터 저장과 HNSW 인덱스 지원을 추가합니다. 벡터를 기존 데이터 옆 컬럼에 저장하고, 벡터 거리 연산자가 포함된 SQL로 쿼리합니다. 벡터, 메타데이터, 관계형 데이터 — 전체 스택이 하나의 데이터베이스, 하나의 커넥션, 하나의 백업, 하나의 모니터링 셋업 안에 살아갑니다.

pgvector를 써야 할 때

이미 Postgres를 운영 중이고 데이터셋이 1,000만 벡터 미만이며 인프라 복잡도를 최소화하고 싶을 때입니다. Supabase, Neon, RDS 모두 pgvector를 네이티브로 지원합니다. Instacart를 비롯한 회사들이 상당한 규모로 pgvector를 프로덕션에서 운영하고 있습니다.

pgvector에서 벗어나야 할 때

데이터셋이 1,000만~5,000만 벡터를 넘어 싱글 노드 Postgres가 지연 시간 저하를 보일 때입니다. BM25 인덱스를 직접 조립하지 않고도 쓸 수 있는 네이티브 하이브리드 검색이 필요할 때, 그리고 대규모에서 멀티테넌트 벡터 격리가 필요해질 때도 마찬가지입니다.

100만 벡터 규모의 성능은 이렇습니다. pgvector는 HNSW 기준 95퍼센트 recall에서 약 640 QPS를 달성합니다. 전용 벡터 스토어는 같은 recall에서 1,600 QPS 이상을 달성합니다. 100만 벡터 규모에서는 이 차이가 결정적이지 않은 경우가 많습니다 — 쿼리 지연 시간이 낮고 처리량이 병목이 되는 경우가 드뭅니다. 5,000만 벡터 규모에서는 이 격차가 커집니다.

섹션 03 · 옵션 2

Pinecone: 1억 벡터 이상으로 가는 매니지드 경로

Pinecone은 풀 매니지드, 서버리스 벡터 데이터베이스입니다. 인덱스를 만들고 벡터를 삽입한 뒤 쿼리합니다 — 구성하거나 유지보수할 인프라가 없습니다. 운영 변경 없이 수억 벡터까지 투명하게 확장됩니다. 세 옵션 가운데 SLA와 지원이 가장 강력합니다.

Pinecone을 써야 할 때

pgvector의 실질적 한계를 넘어 확장하면서 인프라 운영에 투자하지 않고 가장 빠르게 프로덕션 규모에 도달하고자 할 때입니다. pgvector에서 Pinecone으로 옮긴 팀들은 이 전환이 며칠이 아니라 몇 시간이 걸렸다고 보고합니다 — API 표면이 단순합니다.

다른 옵션을 검토해야 할 때

비용이 핵심 제약일 때입니다. Pinecone의 서버리스 가격은 중간 규모에서는 경쟁력이 있지만 대규모에서는 자체 호스팅 대안보다 높습니다. 인프라를 안정적으로 운영할 수 있는 팀이라면 Qdrant나 Weaviate 자체 호스팅이 매우 높은 볼륨에서 쿼리당 비용이 더 저렴합니다.

섹션 04 · 옵션 3

Weaviate: 네이티브 하이브리드 검색과 자체 호스팅 통제

Weaviate는 BM25와 벡터 유사도를 Reciprocal Rank Fusion으로 결합한 하이브리드 검색을 네이티브로 제공합니다. 벡터 인덱스 옆에 별도 BM25 인덱스를 따로 조립할 필요가 없습니다. 하이브리드 검색이 필요한 프로덕션 RAG 시스템 — 사실상 대부분 — 에는 운영적으로 큰 이점입니다.

Weaviate를 써야 할 때

직접 조립하지 않고 네이티브 하이브리드 검색을 써야 할 때입니다. 데이터 주권, 컴플라이언스, 비용 측면에서 자체 호스팅 옵션이 필요할 때, 또는 테넌트별로 벡터 공간을 격리해야 하는 멀티테넌트 RAG 시스템을 만들 때도 적합합니다.

다른 옵션을 검토해야 할 때

가능한 한 단순한 매니지드 서비스를 원하고 자체 호스팅이 필요하지 않을 때입니다. Weaviate의 매니지드 클라우드도 좋지만, 운영에 일절 관여하지 않고 풀 매니지드를 원하는 팀에는 Pinecone의 API가 더 단순하고 SLA가 더 강력합니다.

섹션 05 · 정면 비교

프로덕션에서 의미 있는 수치

벡터 DB 비교 — pgvector vs Pinecone vs Weaviate (2026)
차원pgvectorPineconeWeaviate
배포 모델자체 호스팅(Postgres 확장)풀 매니지드, 서버리스자체 호스팅 또는 매니지드 클라우드
하이브리드 검색수동(BM25 인덱스와 조립)지원(2025년 추가)네이티브 — 기본 제공
100만 벡터 성능약 640 QPS, 95퍼센트 recall약 1,600+ QPS, 95퍼센트 recall약 1,600+ QPS, 95퍼센트 recall
실질적 확장 한계약 1,000만~5,000만 벡터(싱글 노드)수억 벡터자체 호스팅: 노드 의존; 매니지드: 높음
비용 모델무료(Postgres 비용)사용량 기반(월 약 70달러부터)자체 호스팅 무료; 매니지드 가격제
멀티테넌트 지원스키마 단위 격리네임스페이스 기반클래스 단위 격리 — 강력
Postgres에서의 마이그레이션이미 그 안에 있음수 시간며칠

100만 벡터 규모에서는 세 옵션 사이의 품질 차이가 작습니다 — 모두 기본 설정으로 95퍼센트 recall에 도달합니다. 운영 모델 선호와 하이브리드 검색 요건을 기준으로 선택하세요. 5,000만 벡터 규모에서는 pgvector가 세심한 튜닝을 필요로 하며 마이그레이션이 필요할 수 있습니다. Pinecone과 Weaviate는 변경 없이 처리합니다.

벡터 DB 마이그레이션 경로: 1,000만 벡터 미만에서는 pgvector로 시작, 1,000만 벡터에서 평가, 규모나 하이브리드 검색 요건이 pgvector의 한계를 넘으면 Pinecone 또는 Weaviate로 마이그레이션.
왼쪽에서 오른쪽으로 이어지는 마이그레이션 경로. 대부분의 팀은 pgvector를 떠나지 않습니다 — 워크로드가 한계 안에 안전하게 머무르기 때문입니다. 마이그레이션은 미리 가정해서가 아니라 사용량이 요구할 때 수행하세요.

FAQ

자주 묻는 질문

새 RAG 애플리케이션에서 pgvector와 Pinecone 중 무엇을 골라야 하나요?

이미 Postgres를 운영 중이라면 pgvector로 시작하세요. 1,000만 벡터 미만에서는 프로덕션급 안정성을 보이며, 추가 비용이 거의 없고 데이터를 한 곳에 모아 관리할 수 있습니다. pgvector의 한계를 넘으면 Pinecone으로 옮기는 것이 자연스럽습니다 — 마이그레이션이 어렵지 않고, 매니지드 서비스인 Pinecone이 대규모 운영 비용을 줄여 줍니다.

100만 벡터 규모에서 pgvector와 Pinecone의 성능 차이는?

100만 벡터, 95퍼센트 recall 기준에서 pgvector는 약 640 QPS, Pinecone과 Weaviate 같은 전용 벡터 스토어는 1,600 QPS 이상을 보입니다. 그러나 대부분의 프로덕션 RAG 시스템에서는 이 차이가 결정적이지 않습니다. 양쪽 모두 쿼리 지연 시간이 허용 범위 안에 들어옵니다.

pgvector는 하이브리드 검색을 지원하나요?

기본적으로는 지원하지 않습니다. pgvector는 벡터 유사도 검색을 담당합니다. 키워드 검색을 추가하려면 Postgres에서 별도의 BM25나 풀텍스트 인덱스를 구성하고 결과를 직접 병합해야 합니다. Weaviate는 기본 제공이며, Pinecone은 2025년에 하이브리드 검색을 추가했습니다.

pgvector에서 Pinecone이나 Weaviate로 옮겨야 할 시점은?

데이터셋이 1,000만~5,000만 벡터를 넘어 pgvector의 지연 시간이 떨어지기 시작했을 때, 직접 조립하지 않은 네이티브 하이브리드 검색이 필요해졌을 때, 대규모에서 멀티테넌트 벡터 격리가 필요해졌을 때 옮기세요. 아직 도달하지 않은 규모를 미리 가정하고 옮길 필요는 없습니다.

자주 묻는 질문

새 RAG 애플리케이션에서 pgvector와 Pinecone 중 무엇을 골라야 하나요?
이미 Postgres를 운영 중이라면 pgvector로 시작하세요. 1,000만 벡터 미만에서는 프로덕션급 안정성을 보이며, 추가 비용이 거의 없고 데이터를 한 곳에 모아 관리할 수 있습니다. pgvector의 한계를 넘으면 Pinecone으로 옮기는 것이 자연스럽습니다 — 마이그레이션이 어렵지 않고, 매니지드 서비스인 Pinecone이 대규모 운영 비용을 줄여 줍니다.
100만 벡터 규모에서 pgvector와 Pinecone의 성능 차이는?
100만 벡터, 95퍼센트 recall 기준에서 pgvector는 약 640 QPS, Pinecone과 Weaviate 같은 전용 벡터 스토어는 1,600 QPS 이상을 보입니다. 그러나 대부분의 프로덕션 RAG 시스템에서는 이 차이가 결정적이지 않습니다. 양쪽 모두 쿼리 지연 시간이 허용 범위 안에 들어옵니다.
pgvector는 하이브리드 검색을 지원하나요?
기본적으로는 지원하지 않습니다. pgvector는 벡터 유사도 검색을 담당합니다. 키워드 검색을 추가하려면 Postgres에서 별도의 BM25나 풀텍스트 인덱스를 구성하고 결과를 직접 병합해야 합니다. Weaviate는 기본 제공이며, Pinecone은 2025년에 하이브리드 검색을 추가했습니다.
pgvector에서 Pinecone이나 Weaviate로 옮겨야 할 시점은?
데이터셋이 1,000만~5,000만 벡터를 넘어 pgvector의 지연 시간이 떨어지기 시작했을 때, 직접 조립하지 않은 네이티브 하이브리드 검색이 필요해졌을 때, 대규모에서 멀티테넌트 벡터 격리가 필요해졌을 때 옮기세요. 아직 도달하지 않은 규모를 미리 가정하고 옮길 필요는 없습니다.