RAGAI Engineering

pgvector, Pinecone ou Weaviate: como escolher em 2026

O guia de um arquiteto de IA para escolher um banco vetorial em 2026. Comece em pgvector, migre quando precisar. Aqui está quando cada opção vence e o que os números de performance realmente mostram.

2026-05-039 min read

Pontos principais

Comece com pgvector se você já roda Postgres e seu dataset tem menos de 10 milhões de vetores. É grau de produção, gratuito e não custa nada para somar ao seu banco existente.
Pinecone é o caminho totalmente gerenciado para mais de 100 milhões de vetores. Sem infraestrutura para operar, o tempo mais rápido até produção e o SLA mais forte. O custo é mais alto que o de alternativas self-hosted.
Weaviate entrega busca híbrida nativamente, suporta self-hosting e é a opção mais forte para deploys multi-tenant e cargas de retrieval híbrido em larga escala.
Com 1 milhão de vetores, os três alcançam 95 por cento de recall com configurações default. As diferenças que importam em produção são o modelo operacional (gerenciado vs self-hosted), o suporte a busca híbrida e o custo na sua escala.
Não complique a escolha demais. pgvector dá conta da maioria dos workloads de RAG em nível de agência até a Série A. Migre quando o uso de fato exigir — não em antecipação a uma escala que talvez você nunca alcance.

Seção 01 · A decisão

Por que a escolha do banco vetorial importa para RAG

Seu banco vetorial é a camada de retrieval do seu pipeline de RAG. Sua performance, modelo operacional e custo em escala determinam se o seu sistema de RAG é confiável, manutenível e economicamente viável.

Resposta rápida

A resposta curta: Comece com pgvector se você roda Postgres — é grau de produção até cerca de 10 milhões de vetores e não custa nada para adicionar. Use Pinecone quando precisar de escala gerenciada além disso. Use Weaviate quando precisar de busca híbrida nativa ou de controle self-hosted em larga escala.

A maior parte dos engenheiros escolhe um banco vetorial lendo artigos comparativos que classificam todas as opções em todas as dimensões ao mesmo tempo. O frame mais útil é o caminho de migração: por qual opção você deve começar e o que deve disparar uma migração?

A resposta é quase sempre pgvector primeiro. É uma extensão do Postgres que roda dentro do seu banco existente. Sem nova infraestrutura. Sem nova carga de ops. Sem custo adicional. Seus backups, monitoramento e controles de acesso já existentes cobrem tudo. Abaixo de 10 milhões de vetores — o que cobre a vasta maioria dos casos de uso entre seed e Série A — a performance é competitiva com bancos vetoriais dedicados.

Seção 02 · Opção 1

pgvector: comece aqui, a não ser que tenha um motivo para não fazer

O pgvector adiciona armazenamento de vetores e suporte a índice HNSW ao PostgreSQL. Você guarda vetores em uma coluna ao lado dos seus dados existentes. As queries usam SQL com um operador de distância vetorial. A stack inteira — vetores, metadados, dados relacionais — vive em um só banco com uma só conexão, um só backup, um só setup de monitoramento.

Use pgvector quando

Você já roda Postgres. Seu dataset está abaixo de 10 milhões de vetores. Você quer minimizar a complexidade de infraestrutura. Supabase, Neon e RDS suportam pgvector nativamente. Empresas como a Instacart rodam pgvector em produção em escala significativa.

Migre para fora do pgvector quando

Seu dataset ultrapassar 10 a 50 milhões de vetores e o Postgres em nó único começar a apresentar degradação de latência. Você precisar de busca híbrida nativa sem compor manualmente com um índice BM25. Você precisar de isolamento vetorial multi-tenant em escala.

Performance com 1 milhão de vetores: o pgvector atinge cerca de 640 QPS com HNSW a 95 por cento de recall. Bancos vetoriais dedicados atingem 1.600 QPS ou mais no mesmo nível de recall. Com 1 milhão de vetores, essa diferença raramente importa — a latência de query é baixa e o throughput raramente é o gargalo. Com 50 milhões de vetores, a diferença vira algo significativo.

Seção 03 · Opção 2

Pinecone: o caminho gerenciado para mais de 100 milhões de vetores

Pinecone é um banco vetorial totalmente gerenciado e serverless. Você cria um índice, insere vetores e faz queries — sem infraestrutura para configurar ou manter. Escala de forma transparente até centenas de milhões de vetores sem mudanças operacionais. O SLA e o suporte são os mais fortes das três opções.

Use Pinecone quando

Você precisa escalar além do teto prático do pgvector e quer o tempo mais rápido até produção em escala sem investir em operações de infraestrutura. Times que migraram de pgvector para Pinecone relatam transições de horas, não dias — a superfície da API é direta.

Considere alternativas quando

Custo é uma restrição central. O preço serverless da Pinecone é competitivo em escala moderada, mas mais alto que o de alternativas self-hosted em larga escala. Se você consegue operar infraestrutura de forma confiável, Qdrant ou Weaviate self-hosted saem mais baratos por query em volumes muito altos.

Seção 04 · Opção 3

Weaviate: busca híbrida nativa e controle self-hosted

O Weaviate entrega busca híbrida — BM25 mais similaridade vetorial, fundidos com Reciprocal Rank Fusion — nativamente. Você não precisa compor um índice BM25 separado ao lado do seu índice vetorial. Para sistemas de RAG em produção que precisam de retrieval híbrido (ou seja, a maioria deles), isso é uma vantagem operacional significativa.

Use Weaviate quando

Você precisa de busca híbrida nativa sem compor manualmente. Você quer uma opção self-hosted por soberania de dados, compliance ou custo. Você está construindo um sistema de RAG multi-tenant em que os espaços vetoriais precisam ser isolados por tenant.

Considere alternativas quando

Você quer o serviço gerenciado mais simples possível e não precisa de self-hosting. A oferta de cloud gerenciada do Weaviate é boa, mas a Pinecone tem uma API mais simples e um SLA mais forte para times que querem totalmente gerenciado, sem envolvimento operacional.

Seção 05 · Frente a frente

Os números que importam em produção

Comparativo de banco vetorial — pgvector vs Pinecone vs Weaviate (2026)
Dimensão	pgvector	Pinecone	Weaviate
Modelo de deploy	Self-hosted (extensão do Postgres)	Totalmente gerenciado, serverless	Self-hosted ou cloud gerenciada
Busca híbrida	Manual (compor com índice BM25)	Suportada (adicionada em 2025)	Nativa — pronta para uso
Performance com 1M de vetores	cerca de 640 QPS, 95 por cento de recall	cerca de 1.600+ QPS, 95 por cento de recall	cerca de 1.600+ QPS, 95 por cento de recall
Teto prático de escala	cerca de 10 a 50M de vetores (nó único)	Centenas de milhões	Self-hosted: depende do nó; Gerenciado: alto
Modelo de custo	Gratuito (custos do Postgres)	Baseado em uso (a partir de cerca de 70 dólares/mês)	Self-hosted gratuito; preço gerenciado
Suporte multi-tenant	Isolamento em nível de schema	Baseado em namespaces	Isolamento em nível de classe — forte
Migração a partir do Postgres	Já está lá	Horas	Dias

Com 1 milhão de vetores, as diferenças de qualidade entre os três são pequenas — todos chegam a 95 por cento de recall com configurações default. Escolha pela sua preferência de modelo operacional e pelos requisitos de busca híbrida. Com 50 milhões de vetores, o pgvector exige tuning cuidadoso e pode precisar de uma migração; Pinecone e Weaviate aguentam sem mudanças.

Caminho de migração de banco vetorial: comece em pgvector abaixo de 10M de vetores, avalie a 10M, migre para Pinecone ou Weaviate quando os requisitos de escala ou de busca híbrida ultrapassarem o que o pgvector entrega. — O caminho de migração da esquerda para a direita. A maioria dos times nunca sai do pgvector — o workload fica bem dentro do teto. Migre quando o uso exigir, não em antecipação.

FAQ

Perguntas frequentes

Devo usar pgvector ou Pinecone em uma nova aplicação RAG?

Comece com pgvector se já roda Postgres. É grau de produção para datasets abaixo de 10 milhões de vetores, custa zero a mais e mantém os dados em um lugar só. Migre para Pinecone quando ultrapassar o teto do pgvector — a migração é simples e o serviço gerenciado da Pinecone elimina a operação de infraestrutura em escala.

Qual a diferença de performance entre pgvector e Pinecone com 1 milhão de vetores?

Com 1 milhão de vetores e 95 por cento de recall, o pgvector entrega cerca de 640 QPS, enquanto bases dedicadas como Pinecone e Weaviate entregam 1.600 QPS ou mais. Na maioria dos sistemas RAG em produção, essa diferença não é determinante — a latência fica dentro de margens aceitáveis em ambos.

O pgvector suporta busca híbrida?

Não nativamente. O pgvector trata busca por similaridade vetorial. Para adicionar busca por palavras-chave, é preciso compor um índice BM25 ou full-text à parte no Postgres e fundir os resultados manualmente. Weaviate entrega busca híbrida pronta. Pinecone adicionou em 2025.

Quando migrar de pgvector para Pinecone ou Weaviate?

Migre quando o dataset passar de 10 a 50 milhões de vetores e o pgvector apresentar degradação de latência, quando precisar de busca híbrida nativa sem montagem manual ou quando precisar de isolamento multi-tenant em escala. Não migre antecipando uma carga que ainda não existe.

Perguntas frequentes

Devo usar pgvector ou Pinecone em uma nova aplicação RAG?: Comece com pgvector se já roda Postgres. É grau de produção para datasets abaixo de 10 milhões de vetores, custa zero a mais e mantém os dados em um lugar só. Migre para Pinecone quando ultrapassar o teto do pgvector — a migração é simples e o serviço gerenciado da Pinecone elimina a operação de infraestrutura em escala.
Qual a diferença de performance entre pgvector e Pinecone com 1 milhão de vetores?: Com 1 milhão de vetores e 95 por cento de recall, o pgvector entrega cerca de 640 QPS, enquanto bases dedicadas como Pinecone e Weaviate entregam 1.600 QPS ou mais. Na maioria dos sistemas RAG em produção, essa diferença não é determinante — a latência fica dentro de margens aceitáveis em ambos.
O pgvector suporta busca híbrida?: Não nativamente. O pgvector trata busca por similaridade vetorial. Para adicionar busca por palavras-chave, é preciso compor um índice BM25 ou full-text à parte no Postgres e fundir os resultados manualmente. Weaviate entrega busca híbrida pronta. Pinecone adicionou em 2025.
Quando migrar de pgvector para Pinecone ou Weaviate?: Migre quando o dataset passar de 10 a 50 milhões de vetores e o pgvector apresentar degradação de latência, quando precisar de busca híbrida nativa sem montagem manual ou quando precisar de isolamento multi-tenant em escala. Não migre antecipando uma carga que ainda não existe.