クラウドキャリアフリーランス
news 2026/6/16

Amazon S3 Vectors が GA — OpenSearchとの使い分けとRAGのコスト最適化

2025年12月にGAしたAmazon S3 Vectorsを、AWSフリーランス実務の視点で解説。ベクトルをネイティブ保存できる初のオブジェクトストレージの位置づけ、3要素の料金構造、次元数や制限、OpenSearchとの使い分け・ハイブリッド設計までRAG実装目線で整理します。

  • #Amazon S3
  • #S3 Vectors
  • #ベクトル検索
  • #RAG
  • #OpenSearch
  • #生成AI

RAGや生成AIアプリを作っていると、一度はぶつかるのが「ベクトルストアを何にするか」という選定の悩みではないでしょうか。専用のベクトルDBは高い、かといって OpenSearch はオーバースペックかもしれない。そんな迷いに、もう一つの選択肢が加わりました。Amazon S3 Vectors です。2025年12月にGA(一般提供開始)した、ベクトルをネイティブに保存・検索できる「初のオブジェクトストレージ」です。

この記事では、S3 Vectors の立ち位置から料金の考え方、次元数などの制限、そして本題の OpenSearch との使い分け/ハイブリッド階層設計 まで、「自分のワークロードならどれを選ぶか」を判断できるよう整理してみましょう。なお「ベクトル検索」とは、文章や画像を数値の並び(埋め込み=embedding)に変換し、意味の近いものを類似度で探す検索のことです。

S3 Vectors とは — 何を解決するか

S3 Vectors は、AWSの言葉を借りれば「ベクトルのネイティブな保存・クエリをサポートする初のクラウドオブジェクトストレージ」です。ふだんファイルを置いているあの S3 に、ベクトル専用のバケット(vector bucket)を作り、ベクトルを置いて類似検索ができる、というイメージですね。

解決するのは、ひとことで言えば ベクトル保存のコスト障壁 です。これまで大量のベクトルを保持するには専用のベクトルDBや常時稼働の検索クラスタが必要で、データ量が増えるほどコストがかさみました。S3 Vectors は専用インフラのプロビジョニング(事前のサーバー確保)が不要で、S3にベクトルを置くだけで使えます。

得意なのは「大量・長期・低頻度アクセス」のベクトルです。巨大なナレッジの意味検索、コスト制約のあるRAG、AIエージェントの長期記憶といった領域ですね。秒間に大量のクエリをさばく用途ではなく、「たくさんのベクトルを、安く、長く持っておく層」だと捉えると位置づけがすっきりします。なお Amazon Bedrock Knowledge Bases のベクトルストアとしても利用でき、Bedrock で組むRAGの保存層に選べます。

スケール・性能・実務で効く制限

GAで変わったのは、まずスケールです。プレビュー時の約40倍に伸び、1インデックスあたり最大20億ベクトルまで扱えるようになりました。性能面は、低頻度のクエリで1秒未満、高頻度なクエリで約100ミリ秒以下のレイテンシ(応答にかかる時間)。距離関数はコサインとユークリッドに対応します。

設計時に引っかかりやすい主な制限を表にしました。

項目値(実務での意味)
次元数 / ベクトル1〜4,096 ← 使う埋め込みモデルの出力次元がこの範囲か要確認
ベクトル数 / インデックス最大 20億
ベクトルインデックス数 / バケット最大 10,000
メタデータ合計 / ベクトル最大 40KB(filterable+non-filterable)
filterable メタデータ / ベクトル最大 2KB ← 絞り込み用メタデータは軽量に設計
メタデータキー数 / ベクトル最大 50
クエリの Top-K(返却件数)最大 100
PutVectors+DeleteVectors / 秒・インデックス最大 1,000

とくに注意したいのは2点です。ひとつは次元数の上限4,096。お使いの埋め込みモデル(Titan / Cohere / OpenAI系など)の出力次元がこの範囲か、最初に確認しましょう。もうひとつは filterable メタデータの2KB制約。「filterable メタデータ」とは検索時の絞り込み条件に使えるメタデータで、容量上限があるためフィルタ設計は軽量に保つのがコツです。

GA状況と料金 — 3要素の従量課金

S3 Vectors は 2025年12月2日にGAし、プレビュー時の5リージョンから14リージョンへ拡大しました。なお、対応リージョンに東京(ap-northeast-1)が含まれるかは本稿執筆時点で確証が取れていないため、利用検討時は公式のリージョン・クォータのドキュメントで必ずご確認ください。

料金は 3要素の従量課金 です。考え方を押さえると見積もりの当たりがつきます。

課金区分参考値(2026年6月時点・参考値)
ベクトルストレージ$0.06 / GB・月(ベクトルデータ+メタデータ+キーを含む論理量)
PUT(アップロード)$0.20 / GB(アップロードした論理GB)
クエリ(APIリクエスト)$2.5 / 100万クエリ(API calls)
クエリ(データ処理)インデックスサイズに応じた $/TB 課金。10万ベクトルを超えると単価が下がる構造。具体額は公式料金ページで要確認

上記はあくまで 2026年6月時点の参考値 です。AWSの料金は改定されうるので、見積もり時は必ず公式のS3料金ページで最新の値を確認してください。とくにクエリのデータ処理($/TB)は単価が小さく取り違えやすいため、本記事では具体額を載せていません。構造――「APIリクエストあたりの課金」+「インデックスサイズに応じたデータ処理課金(10万ベクトル超で単価低下)」――さえ押さえれば、コスト感の見通しは立ちます。ストレージ量の概算には、1次元あたり4バイト(1,024次元なら1件約4KB)という目安が便利です。

なお、AWSは「専用ベクトルDBと比較して保存・クエリの総コストを最大90%削減できる」とうたっています。これはAWSの主張値で、比較対象や前提ワークロードによって変わる数字です。「どんな構成でも9割安くなる」という意味ではありません。

ベクトルストアの選定軸 — どう選ぶか

ここが本記事の主戦場です。S3 Vectors は万能の置き換えではなく「適材適所」で効きます。「頻度の低い大量データを、安い層に逃がす」という発想が実務的です。代表的な3つの選択肢を並べてみましょう。

観点S3 VectorsOpenSearch(Service / Serverless)pgvector・専用ベクトルDB
狙い大量・長期・低頻度。コスト最適高QPS・低レイテンシのリアルタイム検索用途特化(RDB併用や高性能)
レイテンシ低頻度で1秒未満 / 高頻度で約100ミリ秒以下サブ秒・高スループット製品・構成による
クエリ頻度低頻度向き頻繁・常時アクセス向き用途依存
コスト傾向容量あたりが安い性能ぶんのプレミアム製品・構成依存

「QPS」はQueries Per Second(秒間クエリ数)です。ざっくり言えば、高頻度で叩くリアルタイム検索なら OpenSearch、大量データを安く長く持つなら S3 Vectors という棲み分けですね。pgvector(PostgreSQL の拡張)や Pinecone などの専用DBとの優劣は公式の対比数値がないため断定しませんが、「リアルタイム性 vs コスト・容量」の軸で自分の要件がどちら寄りかを見極めるのが安全です。

ハイブリッド階層設計という勘所

実務でいちばん現実的なのは、二者択一ではなく組み合わせです。AWSも推奨アーキテクチャに挙げるのが、ハイブリッドの階層設計です。大量のベクトルはまず S3 Vectors に低コストで保存し、最高性能が必要なベクトルだけを OpenSearch に「昇格」させる。需要の変化に応じて層の間で移す考え方ですね。

大量ベクトルをS3 Vectorsに低コスト保存し、高性能・高頻度が必要な分だけOpenSearchへ昇格させるハイブリッド階層設計のフロー図
図1: S3 Vectors と OpenSearch のハイブリッド階層設計

コスト試算もこの層の設計次第です。クエリ頻度が高ければクエリ課金が効き、低頻度ならストレージ中心になるので、「自分のクエリ頻度と、どの要素が支配的か」を先に把握するのが見積もりの近道です。

まとめ

ポイントは3つです。

  1. S3 Vectors = 大量・長期・低頻度向けの低コストなベクトル保存層。リアルタイム高QPSが要るなら OpenSearch、が基本の棲み分けです。
  2. 料金は3要素の従量課金(ストレージ/PUT/クエリ、いずれも参考値・公式要確認)。クエリのデータ処理単価は誤りやすい点に注意です。
  3. ハイブリッド階層設計が実務の勘所。安い層に大量保存し、性能が要る分だけ OpenSearch に昇格。AgentCore の Memory 層とも自然につながります。

RAG のデータ層は、ベクトル類似検索の S3 Vectors と、業務文脈で絞り込む S3 アノテーション を二本柱で設計すると噛み合います。あわせて、S3 Vectors を含む最近のAWSアップデートは AWS最新サービスの解説ハブ に横断的にまとめています。

For Freelancers

AWSフリーランス案件、お探しですか?

案件探しから単価交渉・契約手続き・参画後のフォローまで、専任コンサルタントが伴走します。 お名前とメールだけで、まずは無料でご相談いただけます。

案件を探す