AWS Bedrock バッチ推論とオンデマンド推論の動的切り替えによる文書処理パイプライン
Amazon Bedrock の新しい文書処理ソリューションが、コスト効率と処理速度の両方を実現する動的パイプライン設計を提供している。このアーキテクチャは、時間的制約とコスト最適化の要件に応じて、オンデマンド推論とバッチ推論を自動的に選択する仕組みを実装している。
大量の文書処理を抱える企業にとって、処理方式の選択は重要な技術的判断となる。新しいソリューションでは、数億件の土地リース文書のような大規模バックログと日々追加される新規文書の両方に対応できる柔軟性を提供している。
(出典: Extract Data with On-demand and Batch Pipelines Dynamically)
アーキテクチャの詳細と処理フロー
システムは2つの並行パイプラインで構成されている。左側のオンデマンドパイプラインは、AWS SQS FIFO キューをトリガーとして個別文書を数秒以内に処理する。右側のバッチ推論パイプラインは、複数の文書リクエストを単一の Amazon Bedrock バッチ推論ジョブで非同期処理する。
オンデマンド処理では、キューメッセージに文書ID、LLMモデルID、プロンプトID/バージョン、システムプロンプトID/バージョンが含まれる。AWS Lambda 関数がトリガーされると、指定された Amazon S3 バケットからPDF文書を取得し、PDFページをPNG画像に変換し、Amazon Bedrock Prompt Management から関連プロンプトを取得してLLMへのメッセージを構成し、結果を Amazon DynamoDB テーブルに保存する。
キューメッセージの作成は AWS CLI で実行できる:
aws sqs send-message --queue-url https://sqs.us-east-1.amazonaws.com/1111111111/ondemand-data-pipe
両パイプラインとも、リクエスト内でプロンプトIDとバージョンを指定でき、対応するプロンプトテキストが Amazon Bedrock Prompt Management から取得される仕組みになっている。
(出典: Extract Data with On-demand and Batch Pipelines Dynamically)
Agent-EvalKit による AI エージェント評価の統合
AI エージェントの評価において、従来の出力レベルテストでは捉えきれない実行パスの評価が重要になっている。Agent-EvalKit は Apache 2.0 ライセンスのオープンソースツールキットとして、Claude Code、Kiro CLI、Kilo Code などの AI コーディングアシスタントと統合し、開発環境内で完全な評価ワークフローを提供する。
このツールキットは6つの評価フェーズを通じて動作し、エージェントのソースコードを読み取り、対象テストケースを生成し、評価を実行してコードベース内の特定の場所を参照する改善推奨事項を含むレポートを生成する。Strands Agents SDK と Amazon Bedrock で構築された旅行調査エージェントを例として、各フェーズの動作が説明されている。
評価は /evalkit.plan や /evalkit.data などのスラッシュコマンドを通じて駆動され、自然言語ガイダンスでアシスタントに品質要件を伝える仕組みになっている。
(出典: Evaluate AI agents systematically with Agent-EvalKit)
API Gateway での文書化機能の活用
Amazon API Gateway では、API 開発プロセスの一部として個別の API エンティティにヘルプコンテンツを追加・更新できる文書化機能が提供されている。この機能により、ソースコンテンツの保存と異なるバージョンの文書化アーカイブが可能になる。
文書化バージョンを API ステージと関連付け、ステージ固有の文書化スナップショットを外部 OpenAPI ファイルにエクスポートし、文書化の公開物として配布することができる。API Gateway コンソールを使用した文書化では、API エンティティの文書化パートを作成する際に以下の properties マップを使用する:
{
"info": {
"description": "Your first API Gateway API.",
"contact": {
"name": "John Doe",
"email": "john.doe@api.com"
}
}
}
API Gateway REST API、AWS SDK、AWS CLI、または API Gateway コンソールを使用して API を文書化でき、外部 OpenAPI ファイルで定義された文書化パートのインポート・エクスポートも可能である。
(出典: Document an API using the API Gateway console)
まとめ
- Amazon Bedrock の動的パイプライン設計により、時間的制約がある文書はオンデマンド推論で数秒以内に処理し、コスト重視の大量文書はバッチ推論で効率的に処理する使い分けが実現できる
- Agent-EvalKit を Claude Code や Kiro CLI と組み合わせることで、AI エージェントのツール呼び出しと中間状態を含む完全な実行パス評価を開発環境内で実行し、コードレベルの具体的改善提案を得られる
- API Gateway の文書化機能と Prompt Management を組み合わせることで、文書処理パイプラインの各エンティティに対する詳細な API ドキュメントを作成し、バージョン管理されたプロンプトと連携した運用が可能になる