pgvectorのメリットと実践構築方法

RAG実装に専用Vector DB。PostgreSQLの拡張機能pgvectorを使えば、既存のデータベースでベクトル検索が可能に。SQLAlchemy + Pydanticで型安全な実装ができ、通常のテーブルとJOINも自由自在。インフラ追加なし、コスト削減、運用シンプル化を実現する実践的な構築方法を解説します。

1. RAG のフレームワーク一覧

RAG（Retrieval-Augmented Generation）は、LLM に外部知識を与えて回答精度を上げる手法。基本フローは以下の通り。

ドキュメント → チャンク分割 → Embedding → ベクトルDB に格納
                                                    ↓
ユーザー質問 → Embedding → 類似検索 → コンテキスト付きで LLM に渡す

主要フレームワーク比較

フレームワーク	特徴	向いているケース
LangChain	最も広く使われる。チェーン構造でパイプラインを組める。プラグインが豊富	複雑な RAG パイプライン、エージェント構築
LlamaIndex	データ接続に特化。100以上のデータソースコネクタ	多様なデータソースの統合

演算子	距離関数	用途
`<->`	L2（ユークリッド）距離	一般的な距離計算
`<=>`	コサイン距離	テキスト Embedding の類似度（最も一般的）
`<#>`	負の内積	正規化済みベクトルで高速な類似度計算
`<+>`	L1（マンハッタン）距離	特殊な用途

インデックス	特徴	推奨場面
HNSW	高速なクエリ、高い再現率。メモリ使用量大	本番環境のデフォルト
IVFFlat	高速なビルド、低メモリ。学習ステップが必要	大量データの初期インデックス
なし（exact）	完全な再現率。全行スキャン	数千行以下の小規模データ

比較項目	pgvector	Pinecone / Weaviate / Milvus
インフラ	既存の PostgreSQL に追加	別サービスの管理が必要
コスト	無料（OSS）	有料 or セルフホスト
ACID	PostgreSQL の ACID 準拠	製品によって異なる
JOIN	通常のテーブルと JOIN 可能	不可（別DBなので）
フィルタ	WHERE 句でそのまま絞り込み	メタデータフィルタ（制約あり）
バックアップ	pg_dump で一括	別途バックアップ戦略が必要

値	挙動	評価
0.3〜0.4	ほぼ無関係なチャンクも拾う	低すぎる
0.45〜0.55	ローカル Embedding モデル向き（embeddinggemma, mxbai-embed-large）	推奨
0.55〜0.65	OpenAI ada-002 等の高品質モデル向き	モデル次第
0.7+	非常に厳格。関連チャンクも落とすリスク	高すぎる

値	用途
3〜5	リランカーなし。LLM のコンテキストを圧迫しない
10〜20	リランカーあり。大量に取得して上位を選別
20+	ノイズが増えて LLM の精度が下がる

pgvectorのメリットと実践構築方法

1. RAG のフレームワーク一覧

主要フレームワーク比較

ご紹介

ニュースリリース

なぜ自前実装 + pgvector か

2. pgvector とは

基本概念

対応する距離関数

インデックスの種類

最新バージョン（v0.8.1）

3. pgvector のメリット

専用 Vector DB が不要

Python パッケージで完結

既存データとの統合

4. Python pgvector + SQLAlchemy + Pydantic での安全な実装

依存パッケージ

SQLAlchemy モデル定義

Pydantic スキーマ

Embedding の保存

コサイン類似度検索

ドキュメント一覧取得（GROUP BY + JSONB）

削除

コネクションプールの恩恵

5. パラメータの推奨値

similarity_threshold（類似度閾値）

top_k（取得件数）

HNSW インデックス

クエリ時パラメータ

距離関数の選び方

設定まとめ

参考リンク

パラメータ	デフォルト	推奨	説明
`m`	16	16	レイヤーあたりの最大接続数。大きいほど再現率が上がるがメモリ増加
`ef_construction`	64	128	グラフ構築時の候補リストサイズ。RAG では品質重視で高めに設定

設定	推奨値	備考
`similarity_threshold`	0.45〜0.55	ローカル Embedding モデル使用時
`top_k`	5	リランカーなしの場合
HNSW `m`	16	デフォルトで十分
HNSW `ef_construction`	128	デフォルト(64)より高めで品質確保
`hnsw.ef_search`	100	デフォルト(40)より高めで再現率確保
`hnsw.iterative_scan`	`strict_order`	WHERE フィルタ併用時に必須
距離関数	cosine (`<=>`)	正規化済みなら inner product (`<#>`)