pgvector, Pinecone ou Weaviate: como escolher em 2026
O guia de um arquiteto de IA para escolher um banco vetorial em 2026. Comece em pgvector, migre quando precisar. Aqui está quando cada opção vence e o que os números de performance realmente mostram.
Seção 01 · A decisão
Por que a escolha do banco vetorial importa para RAG
Seu banco vetorial é a camada de retrieval do seu pipeline de RAG. Sua performance, modelo operacional e custo em escala determinam se o seu sistema de RAG é confiável, manutenível e economicamente viável.
Resposta rápida
A resposta curta: Comece com pgvector se você roda Postgres — é grau de produção até cerca de 10 milhões de vetores e não custa nada para adicionar. Use Pinecone quando precisar de escala gerenciada além disso. Use Weaviate quando precisar de busca híbrida nativa ou de controle self-hosted em larga escala.
A maior parte dos engenheiros escolhe um banco vetorial lendo artigos comparativos que classificam todas as opções em todas as dimensões ao mesmo tempo. O frame mais útil é o caminho de migração: por qual opção você deve começar e o que deve disparar uma migração?
A resposta é quase sempre pgvector primeiro. É uma extensão do Postgres que roda dentro do seu banco existente. Sem nova infraestrutura. Sem nova carga de ops. Sem custo adicional. Seus backups, monitoramento e controles de acesso já existentes cobrem tudo. Abaixo de 10 milhões de vetores — o que cobre a vasta maioria dos casos de uso entre seed e Série A — a performance é competitiva com bancos vetoriais dedicados.
Seção 02 · Opção 1
pgvector: comece aqui, a não ser que tenha um motivo para não fazer
O pgvector adiciona armazenamento de vetores e suporte a índice HNSW ao PostgreSQL. Você guarda vetores em uma coluna ao lado dos seus dados existentes. As queries usam SQL com um operador de distância vetorial. A stack inteira — vetores, metadados, dados relacionais — vive em um só banco com uma só conexão, um só backup, um só setup de monitoramento.
Use pgvector quando
Você já roda Postgres. Seu dataset está abaixo de 10 milhões de vetores. Você quer minimizar a complexidade de infraestrutura. Supabase, Neon e RDS suportam pgvector nativamente. Empresas como a Instacart rodam pgvector em produção em escala significativa.
Migre para fora do pgvector quando
Seu dataset ultrapassar 10 a 50 milhões de vetores e o Postgres em nó único começar a apresentar degradação de latência. Você precisar de busca híbrida nativa sem compor manualmente com um índice BM25. Você precisar de isolamento vetorial multi-tenant em escala.
Performance com 1 milhão de vetores: o pgvector atinge cerca de 640 QPS com HNSW a 95 por cento de recall. Bancos vetoriais dedicados atingem 1.600 QPS ou mais no mesmo nível de recall. Com 1 milhão de vetores, essa diferença raramente importa — a latência de query é baixa e o throughput raramente é o gargalo. Com 50 milhões de vetores, a diferença vira algo significativo.
Seção 03 · Opção 2
Pinecone: o caminho gerenciado para mais de 100 milhões de vetores
Pinecone é um banco vetorial totalmente gerenciado e serverless. Você cria um índice, insere vetores e faz queries — sem infraestrutura para configurar ou manter. Escala de forma transparente até centenas de milhões de vetores sem mudanças operacionais. O SLA e o suporte são os mais fortes das três opções.
Use Pinecone quando
Você precisa escalar além do teto prático do pgvector e quer o tempo mais rápido até produção em escala sem investir em operações de infraestrutura. Times que migraram de pgvector para Pinecone relatam transições de horas, não dias — a superfície da API é direta.
Considere alternativas quando
Custo é uma restrição central. O preço serverless da Pinecone é competitivo em escala moderada, mas mais alto que o de alternativas self-hosted em larga escala. Se você consegue operar infraestrutura de forma confiável, Qdrant ou Weaviate self-hosted saem mais baratos por query em volumes muito altos.
Seção 04 · Opção 3
Weaviate: busca híbrida nativa e controle self-hosted
O Weaviate entrega busca híbrida — BM25 mais similaridade vetorial, fundidos com Reciprocal Rank Fusion — nativamente. Você não precisa compor um índice BM25 separado ao lado do seu índice vetorial. Para sistemas de RAG em produção que precisam de retrieval híbrido (ou seja, a maioria deles), isso é uma vantagem operacional significativa.
Use Weaviate quando
Você precisa de busca híbrida nativa sem compor manualmente. Você quer uma opção self-hosted por soberania de dados, compliance ou custo. Você está construindo um sistema de RAG multi-tenant em que os espaços vetoriais precisam ser isolados por tenant.
Considere alternativas quando
Você quer o serviço gerenciado mais simples possível e não precisa de self-hosting. A oferta de cloud gerenciada do Weaviate é boa, mas a Pinecone tem uma API mais simples e um SLA mais forte para times que querem totalmente gerenciado, sem envolvimento operacional.
Seção 05 · Frente a frente
Os números que importam em produção
| Dimensão | pgvector | Pinecone | Weaviate |
|---|---|---|---|
| Modelo de deploy | Self-hosted (extensão do Postgres) | Totalmente gerenciado, serverless | Self-hosted ou cloud gerenciada |
| Busca híbrida | Manual (compor com índice BM25) | Suportada (adicionada em 2025) | Nativa — pronta para uso |
| Performance com 1M de vetores | cerca de 640 QPS, 95 por cento de recall | cerca de 1.600+ QPS, 95 por cento de recall | cerca de 1.600+ QPS, 95 por cento de recall |
| Teto prático de escala | cerca de 10 a 50M de vetores (nó único) | Centenas de milhões | Self-hosted: depende do nó; Gerenciado: alto |
| Modelo de custo | Gratuito (custos do Postgres) | Baseado em uso (a partir de cerca de 70 dólares/mês) | Self-hosted gratuito; preço gerenciado |
| Suporte multi-tenant | Isolamento em nível de schema | Baseado em namespaces | Isolamento em nível de classe — forte |
| Migração a partir do Postgres | Já está lá | Horas | Dias |
Com 1 milhão de vetores, as diferenças de qualidade entre os três são pequenas — todos chegam a 95 por cento de recall com configurações default. Escolha pela sua preferência de modelo operacional e pelos requisitos de busca híbrida. Com 50 milhões de vetores, o pgvector exige tuning cuidadoso e pode precisar de uma migração; Pinecone e Weaviate aguentam sem mudanças.
FAQ
Perguntas frequentes
Devo usar pgvector ou Pinecone em uma nova aplicação RAG?
Comece com pgvector se já roda Postgres. É grau de produção para datasets abaixo de 10 milhões de vetores, custa zero a mais e mantém os dados em um lugar só. Migre para Pinecone quando ultrapassar o teto do pgvector — a migração é simples e o serviço gerenciado da Pinecone elimina a operação de infraestrutura em escala.
Qual a diferença de performance entre pgvector e Pinecone com 1 milhão de vetores?
Com 1 milhão de vetores e 95 por cento de recall, o pgvector entrega cerca de 640 QPS, enquanto bases dedicadas como Pinecone e Weaviate entregam 1.600 QPS ou mais. Na maioria dos sistemas RAG em produção, essa diferença não é determinante — a latência fica dentro de margens aceitáveis em ambos.
O pgvector suporta busca híbrida?
Não nativamente. O pgvector trata busca por similaridade vetorial. Para adicionar busca por palavras-chave, é preciso compor um índice BM25 ou full-text à parte no Postgres e fundir os resultados manualmente. Weaviate entrega busca híbrida pronta. Pinecone adicionou em 2025.
Quando migrar de pgvector para Pinecone ou Weaviate?
Migre quando o dataset passar de 10 a 50 milhões de vetores e o pgvector apresentar degradação de latência, quando precisar de busca híbrida nativa sem montagem manual ou quando precisar de isolamento multi-tenant em escala. Não migre antecipando uma carga que ainda não existe.
Perguntas frequentes
- Devo usar pgvector ou Pinecone em uma nova aplicação RAG?
- Comece com pgvector se já roda Postgres. É grau de produção para datasets abaixo de 10 milhões de vetores, custa zero a mais e mantém os dados em um lugar só. Migre para Pinecone quando ultrapassar o teto do pgvector — a migração é simples e o serviço gerenciado da Pinecone elimina a operação de infraestrutura em escala.
- Qual a diferença de performance entre pgvector e Pinecone com 1 milhão de vetores?
- Com 1 milhão de vetores e 95 por cento de recall, o pgvector entrega cerca de 640 QPS, enquanto bases dedicadas como Pinecone e Weaviate entregam 1.600 QPS ou mais. Na maioria dos sistemas RAG em produção, essa diferença não é determinante — a latência fica dentro de margens aceitáveis em ambos.
- O pgvector suporta busca híbrida?
- Não nativamente. O pgvector trata busca por similaridade vetorial. Para adicionar busca por palavras-chave, é preciso compor um índice BM25 ou full-text à parte no Postgres e fundir os resultados manualmente. Weaviate entrega busca híbrida pronta. Pinecone adicionou em 2025.
- Quando migrar de pgvector para Pinecone ou Weaviate?
- Migre quando o dataset passar de 10 a 50 milhões de vetores e o pgvector apresentar degradação de latência, quando precisar de busca híbrida nativa sem montagem manual ou quando precisar de isolamento multi-tenant em escala. Não migre antecipando uma carga que ainda não existe.