Amazon SageMaker AI による物理AIトレーニングの新展開

Amazon Web Services(AWS)が、NVIDIA Isaac Lab と Amazon SageMaker AI を組み合わせたロボット強化学習のスケーリングソリューションを発表した。この統合により、ヒューマノイドロボットの複雑な行動学習を効率化し、研究から本格運用まで一貫したワークフローを実現する。

物理AIは研究段階から本格運用へと移行している。ロボットは工場、倉庫、物流センターに配備される前に、高精度シミュレーションで訓練される。現実世界での訓練は時間がかかり、コストが高く、しばしば危険であるのに対し、GPU加速シミュレーションは数ヶ月の学習を数時間に圧縮できる。

(出典: AWS Machine Learning Blog

SageMaker HyperPod による分散学習の耐障害性

Amazon SageMaker HyperPod は、大規模基盤モデルの分散学習と推論のために構築された専用マネージド基盤である。耐障害性が HyperPod の中核にある。

マルチノードでの強化学習実行では、ハードウェア障害が規模に応じて問題となる。各障害により訓練進捗が失われ、障害検出、ノード交換、最後のチェックポイントからの再開に時間を要する。SageMaker HyperPod は各ノードでヘルスモニタリングエージェントを実行し、基本的および詳細なヘルスチェックを実行する。

障害が検出されると、自動的に故障インスタンスを再起動または交換する。自動再開機能により、交換ノードの準備が完了した後、手動介入なしに最後のチェックポイントから訓練ジョブが再開される。

Amazon Elastic Kubernetes Service(Amazon EKS)または Slurm でオーケストレーションされた HyperPod は、クラスターノードへの直接アクセスと実行間で持続する安定した環境を提供する。

(出典: AWS Machine Learning Blog

Strands Agents と AgentCore Browser Tool による保険請求自動化

AWS は Strands Agents SDK と Amazon Bedrock AgentCore Browser Tool を組み合わせた、ハンズフリーの初回損失通知(FNOL)取り込みシステムを発表した。このアプローチは人間の専門知識を保持しながら、反復的なスクリーン作業を除去する。

手動 FNOL 処理は、非構造化マルチモーダル証拠を人間のインタラクション用に設計されたポータル経由で解釈する必要があるため、反復作業に専門家の時間を大幅に消費する。現場で撮影された写真、ウォークアラウンド動画、スキャンされた文書、口述または録音されたメモがすべて取り込み時にシステムに入力される。

このソリューションは2つの補完的な機能を組み合わせる。Strands Agents は生成AI エージェントを構築するためのモデル駆動アプローチを採用するオープンソース SDK である。Amazon Nova Act は自然言語指示(「次の未処理請求を開く」「画像解析をトリガーする」など)を解釈し、それらを具体的な UI アクションに変換するクライアント SDK である。

Amazon Bedrock AgentCore Browser tool は、Nova Act が接続してアクションを実行するための、管理された分離 Chrome セッションを提供する。AgentCore Browser Tool は可観測性のためのセッション記録とライブビュー機能も提供する。

(出典: AWS Machine Learning Blog

API Gateway ドキュメント作成の実装手順

Amazon API Gateway では、API 開発プロセスの一環として個別の API エンティティのヘルプコンテンツを追加・更新できる。API Gateway はソースコンテンツを保存し、ドキュメントの異なるバージョンをアーカイブできる。

API エンティティのドキュメント作成には、メインナビゲーションペインで Documentation を選択し、Create documentation part を選択する。Documentation typeAPI を選択すると、properties マップエディターが表示される。

以下の properties マップをテキストエディターに入力する:

{
  "info": {
    "description": "Your first API Gateway API.",
    "contact": {
      "name": "John Doe", 
      "email": "john.doe@api.com"
    }
  }
}

properties マップを JSON 文字列にエンコードする必要はない。API Gateway コンソールが JSON オブジェクトを文字列化する。

RESOURCE エンティティの場合、Documentation typeResource を選択し、Path にパスを入力する。説明として以下を入力できる:

{
  "description": "The PetStore's root resource."
}

(出典: Amazon API Gateway Developer Guide

まとめ

  • NVIDIA Isaac Lab と SageMaker HyperPod の組み合わせにより、ヒューマノイドロボットの複雑な行動学習を自動障害回復機能付きで数日間連続実行できるようになる
  • Strands Agents SDK と Amazon Nova Act を統合することで、保険請求の証拠解釈から UI操作まで一貫した自動化ワークフローを構築し、調整者の反復作業を削減できる
  • API Gateway の properties マップ形式を活用すれば、JSON エンコード作業なしに API エンティティごとの詳細なドキュメントを段階的に構築できる
  • SageMaker の2つの計算オプション(HyperPod の長期実行と Training Jobs の短期実験)を使い分けることで、研究フェーズから本格運用まで一貫したロボット政策開発環境を実現できる