AWS AI活用ガイド:SageMaker と Bedrock の使い分け

2026年、変化の激しいAI領域において、Amazon SageMakerとAWS Bedrockのどちらを選ぶべきかという問いは、もはや単純な二択ではなくなりました。SageMaker Unified StudioのリリースとBedrockのAgentic AIの機能拡張により、両サービスは現代のAI戦略の土台となっています。

両者の強みを活かす

2020年代初頭、AWSのAIサービスは役割がはっきり分かれていました。SageMakerはデータサイエンティストがゼロからモデルを構築する「ラボ」、Bedrockは開発者がフルマネージドAIを使うための「プラグアンドプレイ・スタジオ」でした。

2026年現在、その境界は曖昧になっています。SageMakerはBedrockに匹敵するシンプルさのサーバーレス・エージェント主導ワークフローを提供し、Bedrockもこれまではсултан SageMaker の専売特許だった Reinforcement Fine-Tuning(RFT)や Provisioned Throughput を導入して、きめ細かな制御を可能にしました。

今日の判断基準は、コーディングスキルというよりも、プロダクトのライフサイクル、投資対効果(ROI)、そしてデータ主権です。

1: 設計思想

適切なツールを選ぶには、まず両サービスの「責任共有モデル」を理解する必要があります。

AWS Bedrock:ユーティリティとしての知能(MaaS)

Bedrockは Model-as-a-Service(MaaS)という思想に基づいて設計されています。すぐに使えるモデル群であり、サーバー運用や専用ハードウェアのドライバ管理といった重い作業はすべて引き受けてくれます。ユーザーは自分のコードだけに集中できます。

消費モデル: 標準化されたAPI経由でモデルを呼び出します。AnthropicのClaude 4、MetaのLlama 3.5、AmazonのNova 2、どれを使っても裏側の仕組みは変わりません。
サーバーレススケーリング: Bedrockがコールドスタート問題を解消します。インスタンスのスケーリング管理は不要で、リクエストが1件でも100万件でも、AWS側で必要な計算リソースを確保します。

Amazon SageMaker:ワークベンチ(IaaS/PaaS)

マネージドインフラ環境を提供するのがSageMakerです。高水準の抽象化を備えつつ、最終的には機械学習ライフサイクル全体にアクセスできます。

インフラモデル: 学習・推論に使う EC2 インスタンスを自分で選択します。インスタンスタイプも実行環境もコントロールできます。
重みの所有権: SageMakerでファインチューニングや学習を行うと、生成されたモデル成果物(S3上の .tar.gz ファイル)は自社の資産になります。他サービスやオンプレ環境への移行も自由です。

2: AWS Bedrockを深掘り(新機能)

2026年のBedrockは、もはやLLMの単なるラッパーではありません。GenAI向けの完全なオーケストレーション層へと進化を遂げています。

2.1 エージェントの進化:Bedrock AgentCore

目玉機能はBedrock AgentCoreです。これにより、話すだけでなく実際に行動する自律エージェントを開発できます。

エピソード記憶: セッションをまたいで過去のやり取りを記憶できるようになり、DynamoDBで状態を手動管理する必要がなくなりました。
双方向ストリーミング: 自然な音声会話が可能になり、人間らしい割り込みやリアルタイム推論にも対応します。たとえば、航空券の予約変更で航空会社に電話したとしましょう。AIが長い規約文を読み上げ終えるのを待たずに、顧客が「ちょっと待って、それは高すぎる──朝便はある?」と割り込めば、AIは言葉の途中でぴたりと止まり、その要望を受け取って、間髪入れず安価な選択肢を探し始めます。
ポリシー制御: 自然言語で(Bedrockがポリシーに変換します)厳格なガードレールを設定できます。例:「上長承認なしに15%を超える割引は絶対に提示しない」

2.2 Knowledge Bases とネイティブRAG

Bedrockは**Retrieval-Augmented Generation(RAG)**パイプラインを自動化しました。

自動チャンキング: ドキュメントを最適な意味単位に自動分割します。
ベクトル管理サービス: Titan Embeddings V2 などのモデルで埋め込みを生成し、サーバーレス OpenSearch クラスタ、S3 Vector データベース、Aurora PostgreSQL Serverless、Neptune Analytics(Graph RAG)に格納します。

2.3 Reinforcement Fine-Tuning(RFT)

RFTを使えば、大量のラベル付きデータセットを用意しなくても、フィードバックだけでモデルを改善できます。アプリケーションの呼び出しログをBedrockに指定するだけで、どの応答が有用だったかを学習し、時間とともに自動的に最適化されていきます。

3: Amazon SageMakerを深掘り(新機能)

SageMakerはカスタムML向けの強力な環境であることに変わりはありませんが、使い勝手は大きく向上しました。

3.1 SageMaker HyperPod:堅牢性の強化

1兆パラメータ規模のモデルを学習させる組織にとって、SageMaker HyperPodはゴールドスタンダードです。

自己修復クラスタ: 巨大モデルの学習は、たった1枚のGPUのハードウェア障害でも失敗しがちです。HyperPodは障害ノードを自動検出して交換し、直前のチェックポイントから数分以内に学習を再開するため、無駄になる計算コストを数百万ドル単位で削減できます。

3.2 サーバーレスモデルカスタマイズ

SageMakerはBedrockの手法を取り入れました。エージェント主導の自然言語インターフェースからSupervised Fine-Tuning(SFT)やDirect Preference Optimization(DPO)を実行できます。Amazon SageMaker 上で大規模言語モデル(LLM)を人間の好みに沿わせるための、定番のテクニックです。

3.3 推論の革命:Inference Components

SageMakerはGPUの無駄遣い問題を解決しました。Inference Componentsを使えば、1台の大型GPUインスタンス上に数十種類のモデルをホストできます。大量利用のユーザーにとっては、Bedrockのトークン課金では実現できないレベルのコスト集約が可能になります。

4: スケールの経済学(計算式)

意思決定者にとって最も重要なセクションです。どちらが安くなるかは、処理量とスループット次第で完全に変わります。

4.1 Bedrockの料金:変動費

Bedrockは基本的にトークン単位の従量課金です。

Cost_{Bedrock} = (Tokens_{Input} \times Rate_{In}) + (Tokens_{Output} \times Rate_{Out})

Bedrockに導入されたPrompt Cachingは、RAGシステムの収支を大きく変えます。たとえば、毎クエリで同じ5,000語の「社内ハンドブック」を送信する場合:

初回読み込み: 通常料金。
キャッシュ読み込み: 最大90%割引。

4.2 SageMakerの料金:固定費

SageMakerはインスタンス単位の課金です。

Cost_{SageMaker} = Hours_{Instance} \times Rate_{Hourly}

4.3 損益分岐点

経験則として、損益分岐点は1日あたり2億2,000万トークン付近にあります。

2.2億トークン未満: 使った分だけ支払う Bedrock がほぼ常に有利です。夜間にアプリが動いていなければ料金は$0。
2.2億トークン超: SageMakerの優位性が高まります。処理量が十分大きく(稼働率80〜90%)、AWS Inferentia3チップを使ってSageMaker上に蒸留・量子化したモデルをホストできるレベルに達すれば、サーバーの定額料金のほうがAPI経由のトークン課金の合計より安くなります。

ROIのヒント: 安定して高いトラフィックがあるなら、SageMakerのSavings Plans(1年または3年のcommitments)で最大64%のコスト削減が可能です。同様に、Amazon Bedrockの Provisioned Throughput も、安定した大量の生成AI workloads に対して大きな節約効果を発揮します。オンデマンドのトークン料金を払う代わりに専用キャパシティを予約できるしくみで、1ヶ月または6ヶ月の契約にコミットすれば、オンデマンド料金と比べて通常30〜50%のコスト削減が見込めます。

5: セキュリティ、主権、コンプライアンス

5.1 VPC分離

Bedrock: VPCエンドポイント(PrivateLink)経由で接続します。データは公衆インターネットを通らず、モデルの重みはAWSマネージドサービスゾーン内に保持されます。
SageMaker: 完全なVPC分離を提供します。インターネット接続が一切ないサブネットにモデルをデプロイすることも可能です。規制の厳しい業界(防衛、医療など)で選ばれる構成です。

5.2 所有権とウェイトの主権

ビジネスが特定のモデルに依存している場合、Bedrockはリスクになり得ます。Bedrockを使う以上、モデル提供元(例:Anthropic)がそのモデルを提供し続けるかどうかに左右されるからです。一方、SageMakerではモデルのスナップショットを自社で保有します。提供元がバージョンを廃止しても、SageMakerエンドポイントは稼働し続けます。これが「モデル主権」です。

6: 業界別の事例

事例1:フィンテックの「スマートコンプライアンス」エージェント(Bedrockを使う)

課題: ある銀行が、すべての送信メールをリアルタイムで規制コンプライアンス観点から監査するツールを必要としている。

なぜBedrockか? トラフィックがバースト型(午前9時はピーク、午前2時はゼロ)だから。
アーキテクチャ: Bedrock GuardrailsがPII(個人情報)や攻撃的な言い回しを自動スキャンし、Bedrock Knowledge Basesに最新の銀行規制を格納します。
AgentCoreの強み: AgentCoreを使えば、エージェントは Reinforcement Fine-Tuning(RFT)を通じて銀行のシニアコンプライアンス担当者から「学習」できます。あるいは、システムプロンプトをしっかり設計するだけでも、与えられたタスクを十分こなせます。

事例2:放射線科ビジョンスイート(SageMakerを使う)

課題: ある病院グループが、独自設計のニューラルネットワークで数百万件のMRIスキャンを処理し、異常の可能性をフラグ立てしたい。

なぜSageMakerか? 非生成系で、高精度が求められるコンピュータビジョンのタスクだから。
アーキテクチャ: 医療グレードのデータラベリングにはSageMaker Ground Truthを使用。3週間に及ぶ学習サイクル中のダウンタイムをゼロにするため、SageMaker HyperPodで学習を実行します。
推論をInferentia3チップにデプロイすることで100ms未満のレイテンシを確保し、リアルタイムの手術支援にも対応します。

事例3: サポートセンターのスマートルーター(コスト最適化)

課題: あるフィンテックのスタートアップが、月100万件の顧客問い合わせをさばいている。20%は複雑なファイナンシャルプランニングの相談だが、80%は「返金はいつ?」「パスワードをリセットしたい」といった単純な要望。

ハイブリッド構成:

フェーズ1(Bedrock): Amazon Nova 2 Liteをルーターとして使用。受信メッセージの意図を即座に、しかも安価に判別します。
フェーズ2(SageMaker): サポート担当者が顧客と会話している最中に、*「今すぐクレジット限度額を上げられますか?」*と聞かれたとします。この回答のためには、取引履歴、延滞確率、リアルタイムの市況ボラティリティなど、5,000件のデータポイントをミリ秒単位で分析する必要があります。
モデルの非互換性: Bedrockは生成AI(LLM)向けで、表形式データやYes/Noの判定で業界標準とされるXGBoost、Random Forest、LightGBMのホスト・実行はできません。
レイテンシ:数千行の生データをプロンプトに詰め込んでLLMに推論させるのは、遅くてコストも嵩みます。
データ構造:LLMは曖昧さを許容する思考の持ち主です。与信判断では、自社の独自データで専用に学習させたモデルの数学的な精度が不可欠です。

SageMakerによる解決:

SageMakerのInferentia3エンドポイント上に、専用のGradient Boostingモデルをホストします。

Bedrockが会話を担当(「すぐにお調べしますね!」)。
SageMakerがバックグラウンドで重い計算を実行し、表形式データを10ms未満で分析。
SageMakerが「承認」結果をBedrockに返し、顧客にその結果を伝えます。

なぜ? 小学生レベルの質問に修士レベルの料金(Bedrock)を払う必要がなくなるからです。SageMakerの専用ハードウェアが大量の単純処理を低コストでこなし、Bedrockは高付加価値のロジックとわかりやすいコミュニケーションのために温存できます。

7: 意思決定フレームワーク: シンプルな判断軸の全体像

2026年、SageMaker対Bedrockという議論の中心はSageMaker Unified Studioへと移り、同じプロジェクト内で両者を並行利用できるようになりました。

SageMaker Unified Studio(2025年後半から順次提供開始)の登場で、AWSは事実上「2タブ時代」に終止符を打ちました。SageMakerコンソールとBedrockコンソールを行き来する必要はなく、単一の開発環境にまとまっています。

なぜこれが「ゲームチェンジャー」なのか

共有ワークスペース: Unified Studio内で、SageMakerの学習ノートブックとBedrock Agentの設定を同じプロジェクトに収められます。
データの流動性: Studioは統一データカタログを採用。AWS Glueでデータを準備し、SageMakerでモデルをファインチューニングし、そのモデルをそのままBedrock Flowに取り込むまでが、サービス間でデータを移動せずに完結します。
ワンクリックでBedrockへ: Unified Studioの画面内に、Bedrockツール(Agents、Guardrails、Knowledge Bases)専用のUIが用意され、SageMakerの実験のすぐ隣で操作できます。

これからの10年で勝てる戦略は、どちらか一方を選ぶことではなく、モジュール型のAIスタックを組み立てることです。アプリの「頭脳」にはBedrock、専門スキルとコスト効率にはSageMakerを使い分けるのです。

最終結論

$10,000の法則

市場投入のスピードを優先するなら、まずはBedrockから。月間の推論コストが$10,000に達したら、「利便性の対価」が「エンジニアリングコスト」を上回り始めるサインです。大量のworkloadsをSageMakerへ移し、専用ハードウェアによる大幅なコスト削減を取りに行くタイミングです。

なぜこの法則が機能するのか、そしてどこに例外があるのかを整理します。

インフラ管理のコスト: Bedrockは利便性にプレミアムを課しています。請求額が$10kに達した時点で、その相当部分はサーバーレススケーリングへの対価と考えられます。
SageMakerへの分岐点: 月額$10kあれば、専用のSageMaker HyperPodや24時間365日稼働するInferentia3インスタンスを十分まかなえます。この処理量になると、サーバーの定額料金のほうがBedrockのトークン課金より割安になります。
チーム編成の正当化: 月額$10kの支出は、SageMakerリソースの最適化を専任で担うMLOpsエンジニアの人件費を、事業として正当化できる目安にもなります。

例外(法則が当てはまらないケース)

スパイク型トラフィック: $10kの支出が大規模なバーストとその後の長い静寂で構成されている場合、Bedrockのほうが依然として安い可能性があります。SageMakerの専用インスタンスは、1トークンも処理していなくても課金されます。
スピード重視: チームが小規模な場合、SageMakerへの移行という「重労働」がかえって足かせになることもあります。

AWS AI実践ガイド:SageMaker と Bedrock

Ready to optimize?