米国マイクロソフト社(以下、マイクロソフト)のクラウドプラットフォーム Microsoft Azure (以下 Azure)において、 生成 AI による RAG (Retrieve Augmented Generation)システムを構築する際に使用するデータストアの選定についてホワイトペーパーを提供しました。
RAG システムにおいて、データの検索には検索サービスが使用されてきましたが、データストアを直接検索するアーキテクチャが選択候補として上がるようになりました。生成 AI や RAG システム構築の実績を持つ株式会社ネクストスケープによる、データストア選定についての提案を公開しました。
本ドキュメントを一人でも多くの方にご活用いただき、生成 AI による RAG システムの構築におけるデータストア選定の判断基準の一助になれば幸いです。
ホワイトペーパーの詳細は、以下の通りです。
本ドキュメントは、 GitHub にて公開されています。
■ホワイトペーパー概要
1章 RAG システムの基礎
RAG システムの基本構成と、 RAG システムでデータの検索に使用される Azure のサービスを説明します。
2章 データストアの検索クエリ機能のアップデート
元々 RAG システムのデータの検索には検索サービスが使用されていましたが、昨今のデータストアの検索機能の追加により、データストアを直接検索するアーキテクチャが選定候補に挙がるようになりました。そのため、 Azure のデータストアサービスの検索機能のアップデートを説明します。
3章 RAG システムにおける各種データストアの使い分け
検索サービスおよびデータストアとして紹介した各種リソースの特徴をを比較した上で、どのような要件・ユースケースで使用されるかまとめます。
■ダウンロード
Azure による RAG システム構築におけるデータストアの選定
https://github.com/nextscape/doc-aoai-rag
※Microsoft、Azure は、米国Microsoft Corporationの米国およびその他の国における登録商標または商標です。
※記載された製品名および会社名は各社の商標または登録商標です。
■会社ブログ「ネスケラボ」
株式会社ネクストスケープでは、会社ブログ「ネスケラボ」を運用しています。
MRの技術研究と製品開発をはじめ、MicrosoftAzureMVPの資格取得者を含めた個性豊かな社員が、様々な技術記事を公開しています。
その他会社の技術情報や事業チームによるプロモーションサイトなどの各種詳細は、専用キュレーションページ「Tech Blog Hub」よりご確認いただけます。