RAGAI Engineering

pgvector, Pinecone ou Weaviate: como escolher em 2026

O guia de um arquiteto de IA para escolher um banco vetorial em 2026. Comece em pgvector, migre quando precisar. Aqui está quando cada opção vence e o que os números de performance realmente mostram.

9 min read

Seção 01 · A decisão

Por que a escolha do banco vetorial importa para RAG

Seu banco vetorial é a camada de retrieval do seu pipeline de RAG. Sua performance, modelo operacional e custo em escala determinam se o seu sistema de RAG é confiável, manutenível e economicamente viável.

Resposta rápida

A resposta curta: Comece com pgvector se você roda Postgres — é grau de produção até cerca de 10 milhões de vetores e não custa nada para adicionar. Use Pinecone quando precisar de escala gerenciada além disso. Use Weaviate quando precisar de busca híbrida nativa ou de controle self-hosted em larga escala.

A maior parte dos engenheiros escolhe um banco vetorial lendo artigos comparativos que classificam todas as opções em todas as dimensões ao mesmo tempo. O frame mais útil é o caminho de migração: por qual opção você deve começar e o que deve disparar uma migração?

A resposta é quase sempre pgvector primeiro. É uma extensão do Postgres que roda dentro do seu banco existente. Sem nova infraestrutura. Sem nova carga de ops. Sem custo adicional. Seus backups, monitoramento e controles de acesso já existentes cobrem tudo. Abaixo de 10 milhões de vetores — o que cobre a vasta maioria dos casos de uso entre seed e Série A — a performance é competitiva com bancos vetoriais dedicados.

Seção 02 · Opção 1

pgvector: comece aqui, a não ser que tenha um motivo para não fazer

O pgvector adiciona armazenamento de vetores e suporte a índice HNSW ao PostgreSQL. Você guarda vetores em uma coluna ao lado dos seus dados existentes. As queries usam SQL com um operador de distância vetorial. A stack inteira — vetores, metadados, dados relacionais — vive em um só banco com uma só conexão, um só backup, um só setup de monitoramento.

Use pgvector quando

Você já roda Postgres. Seu dataset está abaixo de 10 milhões de vetores. Você quer minimizar a complexidade de infraestrutura. Supabase, Neon e RDS suportam pgvector nativamente. Empresas como a Instacart rodam pgvector em produção em escala significativa.

Migre para fora do pgvector quando

Seu dataset ultrapassar 10 a 50 milhões de vetores e o Postgres em nó único começar a apresentar degradação de latência. Você precisar de busca híbrida nativa sem compor manualmente com um índice BM25. Você precisar de isolamento vetorial multi-tenant em escala.

Performance com 1 milhão de vetores: o pgvector atinge cerca de 640 QPS com HNSW a 95 por cento de recall. Bancos vetoriais dedicados atingem 1.600 QPS ou mais no mesmo nível de recall. Com 1 milhão de vetores, essa diferença raramente importa — a latência de query é baixa e o throughput raramente é o gargalo. Com 50 milhões de vetores, a diferença vira algo significativo.

Seção 03 · Opção 2

Pinecone: o caminho gerenciado para mais de 100 milhões de vetores

Pinecone é um banco vetorial totalmente gerenciado e serverless. Você cria um índice, insere vetores e faz queries — sem infraestrutura para configurar ou manter. Escala de forma transparente até centenas de milhões de vetores sem mudanças operacionais. O SLA e o suporte são os mais fortes das três opções.

Use Pinecone quando

Você precisa escalar além do teto prático do pgvector e quer o tempo mais rápido até produção em escala sem investir em operações de infraestrutura. Times que migraram de pgvector para Pinecone relatam transições de horas, não dias — a superfície da API é direta.

Considere alternativas quando

Custo é uma restrição central. O preço serverless da Pinecone é competitivo em escala moderada, mas mais alto que o de alternativas self-hosted em larga escala. Se você consegue operar infraestrutura de forma confiável, Qdrant ou Weaviate self-hosted saem mais baratos por query em volumes muito altos.

Seção 04 · Opção 3

Weaviate: busca híbrida nativa e controle self-hosted

O Weaviate entrega busca híbrida — BM25 mais similaridade vetorial, fundidos com Reciprocal Rank Fusion — nativamente. Você não precisa compor um índice BM25 separado ao lado do seu índice vetorial. Para sistemas de RAG em produção que precisam de retrieval híbrido (ou seja, a maioria deles), isso é uma vantagem operacional significativa.

Use Weaviate quando

Você precisa de busca híbrida nativa sem compor manualmente. Você quer uma opção self-hosted por soberania de dados, compliance ou custo. Você está construindo um sistema de RAG multi-tenant em que os espaços vetoriais precisam ser isolados por tenant.

Considere alternativas quando

Você quer o serviço gerenciado mais simples possível e não precisa de self-hosting. A oferta de cloud gerenciada do Weaviate é boa, mas a Pinecone tem uma API mais simples e um SLA mais forte para times que querem totalmente gerenciado, sem envolvimento operacional.

Seção 05 · Frente a frente

Os números que importam em produção

Comparativo de banco vetorial — pgvector vs Pinecone vs Weaviate (2026)
DimensãopgvectorPineconeWeaviate
Modelo de deploySelf-hosted (extensão do Postgres)Totalmente gerenciado, serverlessSelf-hosted ou cloud gerenciada
Busca híbridaManual (compor com índice BM25)Suportada (adicionada em 2025)Nativa — pronta para uso
Performance com 1M de vetorescerca de 640 QPS, 95 por cento de recallcerca de 1.600+ QPS, 95 por cento de recallcerca de 1.600+ QPS, 95 por cento de recall
Teto prático de escalacerca de 10 a 50M de vetores (nó único)Centenas de milhõesSelf-hosted: depende do nó; Gerenciado: alto
Modelo de custoGratuito (custos do Postgres)Baseado em uso (a partir de cerca de 70 dólares/mês)Self-hosted gratuito; preço gerenciado
Suporte multi-tenantIsolamento em nível de schemaBaseado em namespacesIsolamento em nível de classe — forte
Migração a partir do PostgresJá está láHorasDias

Com 1 milhão de vetores, as diferenças de qualidade entre os três são pequenas — todos chegam a 95 por cento de recall com configurações default. Escolha pela sua preferência de modelo operacional e pelos requisitos de busca híbrida. Com 50 milhões de vetores, o pgvector exige tuning cuidadoso e pode precisar de uma migração; Pinecone e Weaviate aguentam sem mudanças.

Caminho de migração de banco vetorial: comece em pgvector abaixo de 10M de vetores, avalie a 10M, migre para Pinecone ou Weaviate quando os requisitos de escala ou de busca híbrida ultrapassarem o que o pgvector entrega.
O caminho de migração da esquerda para a direita. A maioria dos times nunca sai do pgvector — o workload fica bem dentro do teto. Migre quando o uso exigir, não em antecipação.

FAQ

Perguntas frequentes

Devo usar pgvector ou Pinecone em uma nova aplicação RAG?

Comece com pgvector se já roda Postgres. É grau de produção para datasets abaixo de 10 milhões de vetores, custa zero a mais e mantém os dados em um lugar só. Migre para Pinecone quando ultrapassar o teto do pgvector — a migração é simples e o serviço gerenciado da Pinecone elimina a operação de infraestrutura em escala.

Qual a diferença de performance entre pgvector e Pinecone com 1 milhão de vetores?

Com 1 milhão de vetores e 95 por cento de recall, o pgvector entrega cerca de 640 QPS, enquanto bases dedicadas como Pinecone e Weaviate entregam 1.600 QPS ou mais. Na maioria dos sistemas RAG em produção, essa diferença não é determinante — a latência fica dentro de margens aceitáveis em ambos.

O pgvector suporta busca híbrida?

Não nativamente. O pgvector trata busca por similaridade vetorial. Para adicionar busca por palavras-chave, é preciso compor um índice BM25 ou full-text à parte no Postgres e fundir os resultados manualmente. Weaviate entrega busca híbrida pronta. Pinecone adicionou em 2025.

Quando migrar de pgvector para Pinecone ou Weaviate?

Migre quando o dataset passar de 10 a 50 milhões de vetores e o pgvector apresentar degradação de latência, quando precisar de busca híbrida nativa sem montagem manual ou quando precisar de isolamento multi-tenant em escala. Não migre antecipando uma carga que ainda não existe.

Perguntas frequentes

Devo usar pgvector ou Pinecone em uma nova aplicação RAG?
Comece com pgvector se já roda Postgres. É grau de produção para datasets abaixo de 10 milhões de vetores, custa zero a mais e mantém os dados em um lugar só. Migre para Pinecone quando ultrapassar o teto do pgvector — a migração é simples e o serviço gerenciado da Pinecone elimina a operação de infraestrutura em escala.
Qual a diferença de performance entre pgvector e Pinecone com 1 milhão de vetores?
Com 1 milhão de vetores e 95 por cento de recall, o pgvector entrega cerca de 640 QPS, enquanto bases dedicadas como Pinecone e Weaviate entregam 1.600 QPS ou mais. Na maioria dos sistemas RAG em produção, essa diferença não é determinante — a latência fica dentro de margens aceitáveis em ambos.
O pgvector suporta busca híbrida?
Não nativamente. O pgvector trata busca por similaridade vetorial. Para adicionar busca por palavras-chave, é preciso compor um índice BM25 ou full-text à parte no Postgres e fundir os resultados manualmente. Weaviate entrega busca híbrida pronta. Pinecone adicionou em 2025.
Quando migrar de pgvector para Pinecone ou Weaviate?
Migre quando o dataset passar de 10 a 50 milhões de vetores e o pgvector apresentar degradação de latência, quando precisar de busca híbrida nativa sem montagem manual ou quando precisar de isolamento multi-tenant em escala. Não migre antecipando uma carga que ainda não existe.