RAGAI Engineering

pgvector・Pinecone・Weaviate: 2026年の選び方

AIアーキテクトの目線で、2026年にベクトルDBをどう選ぶかをまとめました。まずは pgvector で始め、必要になってから移行する。それぞれが優位になる条件と、実際のパフォーマンス数値の意味を解説します。

2026-05-039 min read

要点

すでに Postgres を運用していて、データセットが1,000万ベクトル未満なら pgvector から始めてください。本番運用に耐え、追加費用ゼロで既存DBに足せます。
Pinecone は1億ベクトル超までのフルマネージドな道筋です。運用するインフラがなく、本番までの時間が最も短く、SLAが最も強固です。コストはセルフホストの選択肢より高めです。
Weaviate はハイブリッド検索を標準提供し、セルフホストにも対応。マルチテナント運用や大規模なハイブリッド検索ワークロードでもっとも強い選択肢です。
100万ベクトル時点では、3つともデフォルト設定で95パーセント再現率に到達します。本番で効くのは運用モデル(マネージド vs セルフホスト)、ハイブリッド検索のサポート、そして自社規模でのコストです。
選択を過剰に複雑化しないでください。pgvector はシリーズAまでのエージェンシーグレードのRAGワークロードの大半をさばきます。利用実態が要求し始めてから移行する。到達するか分からないスケールを見越して先回りしないことです。

Section 01 · 決断

RAGにとってベクトルDBの選定が重要な理由

ベクトルDBはRAGパイプラインの検索レイヤーです。その性能、運用モデル、スケール時のコストが、RAGシステムの信頼性、保守性、経済性を決めます。

クイックアンサー

短い答え: Postgres を運用しているなら pgvector から。約1,000万ベクトルまで本番運用に耐え、追加費用ゼロで足せます。それを超えるマネージドスケールが必要なら Pinecone。ネイティブのハイブリッド検索や大規模でのセルフホスト制御が要るなら Weaviate を使います。

多くのエンジニアは、すべての観点を同時にランク付けする比較記事を読んでベクトルDBを選びます。より有用な枠組みは移行パスです。最初に何を選び、何が来たら移行のトリガーとするか、です。

答えはほぼ常に「まず pgvector」です。pgvector は既存のデータベース内で動く Postgres 拡張です。新規インフラなし。新しい運用負荷なし。追加費用なし。既存のバックアップ、モニタリング、アクセス制御がそのまま効きます。1,000万ベクトル未満 — シードからシリーズAまでのユースケースの大半を覆う規模 — であれば、専用ベクトルストアと比べても性能は競争力があります。

Section 02 · 選択肢1

pgvector: 特別な理由がない限りここから始める

pgvector は PostgreSQL にベクトル格納と HNSW インデックスのサポートを追加します。既存データと同じテーブルのカラムにベクトルを保存します。クエリはベクトル距離演算子付きの SQL です。スタック全体 — ベクトル、メタデータ、リレーショナルデータ — がひとつのDB、ひとつの接続、ひとつのバックアップ、ひとつのモニタリング設定に収まります。

pgvector を使うべきとき

すでに Postgres を運用している。データセットが1,000万ベクトル未満。インフラの複雑さを最小化したい。Supabase、Neon、RDS はいずれも pgvector をネイティブにサポートしています。Instacart などの企業は pgvector を相当な規模で本番運用しています。

pgvector から離れるとき

データセットが1,000万〜5,000万ベクトルを超え、シングルノード Postgres のレイテンシが悪化してきた。BM25 インデックスを手動で組み合わせず、ネイティブのハイブリッド検索が必要になった。大規模でのマルチテナントのベクトル分離が必要になった。

100万ベクトルでの性能: pgvector は HNSW + 95パーセント再現率で約640QPS。専用ベクトルストアは同じ再現率で1,600QPS以上を出します。100万ベクトルではこの差はほぼ問題になりません。クエリレイテンシは低く、スループットがボトルネックになることもまずありません。5,000万ベクトルになると、その差は大きくなります。

Section 03 · 選択肢2

Pinecone: 1億ベクトル超までのマネージドな道筋

Pinecone はフルマネージドのサーバーレスベクトルDBです。インデックスを作り、ベクトルを投入し、クエリするだけ。設定や保守すべきインフラはありません。数億ベクトルまで運用変更なしに透過的にスケールします。SLAとサポートは3つの選択肢で最も強固です。

Pinecone を使うべきとき

pgvector の実用上限を越えてスケールする必要があり、インフラ運用に投資せず、スケール状態の本番までの時間を最短化したいとき。pgvector から Pinecone に移行したチームは、移行が日単位ではなく時間単位で済んだと報告しています。API表面が分かりやすいためです。

代替を検討すべきとき

コストが最重要の制約であるとき。Pinecone のサーバーレス価格は中規模では競争力がありますが、大規模ではセルフホストの選択肢より高くつきます。インフラを安定運用できるなら、Qdrant や Weaviate のセルフホストのほうが超大量クエリではクエリあたりコストが安くなります。

Section 04 · 選択肢3

Weaviate: ハイブリッド検索ネイティブとセルフホストの制御

Weaviate はハイブリッド検索 — BM25 とベクトル類似度を Reciprocal Rank Fusion で融合する方式 — をネイティブで提供します。ベクトルインデックスとは別に BM25 インデックスを並べる必要がありません。ハイブリッド検索を必要とする本番RAGシステム(その多くがそうです)にとって、これは大きな運用上の優位性です。

Weaviate を使うべきとき

ハイブリッド検索を手動で組み合わせずネイティブに使いたい。データ主権、コンプライアンス、コストのためにセルフホストの選択肢が欲しい。テナントごとにベクトル空間を分離する必要があるマルチテナントRAGシステムを構築している。

代替を検討すべきとき

可能な限り単純なマネージドサービスを使いたく、セルフホストが不要なとき。Weaviate のマネージドクラウドは良好ですが、運用に関与せずフルマネージドを使いたいチームには Pinecone のほうがAPIがシンプルでSLAも強固です。

Section 05 · 直接比較

本番で効く数字

ベクトルDB比較 — pgvector vs Pinecone vs Weaviate(2026年)
観点	pgvector	Pinecone	Weaviate
デプロイモデル	セルフホスト(Postgres拡張)	フルマネージド、サーバーレス	セルフホストまたはマネージドクラウド
ハイブリッド検索	手動(BM25インデックスと組合せ)	対応(2025年に追加)	ネイティブ — 標準提供
100万ベクトル時の性能	約640QPS、95%再現率	1,600QPS以上、95%再現率	1,600QPS以上、95%再現率
実用上限	約1,000万〜5,000万ベクトル(シングルノード)	数億ベクトル	セルフホスト: ノード依存 / マネージド: 高い
コストモデル	無料(Postgresのコスト)	従量課金(月額70ドル前後から)	セルフホスト無料 / マネージドは価格設定あり
マルチテナント対応	スキーマレベルの分離	ネームスペースベース	クラスレベルの分離 — 強い
Postgres からの移行	すでに同居	数時間	数日

100万ベクトルでは、3者の品質差は小さく、デフォルト設定で全て95パーセント再現率に到達します。運用モデルの好みとハイブリッド検索の要件で選んでください。5,000万ベクトルでは、pgvector は綿密なチューニングが必要となり、移行が必要になることもあります。Pinecone と Weaviate は変更なしでさばけます。

ベクトルDBの移行パス: 1,000万ベクトル未満では pgvector で開始、1,000万時点で評価、スケールやハイブリッド検索の要件が pgvector の能力を超えたら Pinecone か Weaviate へ移行。 — 左から右への移行パス。多くのチームは pgvector を出ない — ワークロードがその上限に十分収まるからだ。利用実態が要求してから移行する。先回りはしない。

FAQ

よくある質問

新規RAGアプリには pgvector と Pinecone のどちらを使うべきですか?

すでに Postgres を運用しているなら pgvector から始めるのが推奨です。1,000万ベクトル未満であれば本番運用に十分耐え、追加費用ゼロでデータも一元管理できます。pgvector の上限を超えたら Pinecone への移行を検討します。移行は素直で、規模が大きくなるほど Pinecone のマネージドサービスの運用負荷削減効果が効いてきます。

1,000万ベクトル規模での pgvector と Pinecone のパフォーマンス差は?

100万ベクトル・95パーセント再現率では、pgvector は約640QPS、Pinecone や Weaviate のような専用ベクトルストアは1,600QPS以上を出します。本番のRAGシステムの大半では、この差は決定打になりません。クエリレイテンシはどちらも許容範囲内に収まります。

pgvector はハイブリッド検索に対応していますか?

ネイティブには対応していません。pgvector はベクトル類似度検索を担当します。キーワード検索を加えたい場合、Postgres 上で BM25 や全文検索インデックスを別途構成し、結果を手動でマージする必要があります。Weaviate は最初からハイブリッド検索を標準提供し、Pinecone は2025年に対応しました。

pgvector から Pinecone や Weaviate に移行すべきタイミングは?

データセットが1,000万〜5,000万ベクトルを超え、pgvector のレイテンシが悪化してきたとき、ネイティブのハイブリッド検索が必要になったとき、大規模なマルチテナントのベクトル分離が必要になったとき。まだ到達していない規模を見越して先回り移行する必要はありません。

よくある質問

新規RAGアプリには pgvector と Pinecone のどちらを使うべきですか?: すでに Postgres を運用しているなら pgvector から始めるのが推奨です。1,000万ベクトル未満であれば本番運用に十分耐え、追加費用ゼロでデータも一元管理できます。pgvector の上限を超えたら Pinecone への移行を検討します。移行は素直で、規模が大きくなるほど Pinecone のマネージドサービスの運用負荷削減効果が効いてきます。
1,000万ベクトル規模での pgvector と Pinecone のパフォーマンス差は?: 100万ベクトル・95パーセント再現率では、pgvector は約640QPS、Pinecone や Weaviate のような専用ベクトルストアは1,600QPS以上を出します。本番のRAGシステムの大半では、この差は決定打になりません。クエリレイテンシはどちらも許容範囲内に収まります。
pgvector はハイブリッド検索に対応していますか?: ネイティブには対応していません。pgvector はベクトル類似度検索を担当します。キーワード検索を加えたい場合、Postgres 上で BM25 や全文検索インデックスを別途構成し、結果を手動でマージする必要があります。Weaviate は最初からハイブリッド検索を標準提供し、Pinecone は2025年に対応しました。
pgvector から Pinecone や Weaviate に移行すべきタイミングは?: データセットが1,000万〜5,000万ベクトルを超え、pgvector のレイテンシが悪化してきたとき、ネイティブのハイブリッド検索が必要になったとき、大規模なマルチテナントのベクトル分離が必要になったとき。まだ到達していない規模を見越して先回り移行する必要はありません。