Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

クラウド予算の超過を防ぐ、リアルタイム異常検知という選択

By Craig LowellMay 1, 20255 min read

このページはEnglishDeutschEspañolFrançaisItalianoPortuguêsでもご覧いただけます。

現代の企業では、イノベーションの速度がガバナンスの整備を追い越してしまう場面が少なくありません。マルチクラウドやハイブリッド環境の複雑化が進むなか、クラウドコストをリアルタイムに把握することは、もはや戦略上の必須事項です。動的なスケーリング、短命なworkloads、エンジニアリングチームに分散したオーナーシップが重なることで、支出の発生源と理由を捉え続けることは容易ではなくなっています。

使用量や支出が突発的に跳ね上がる「クラウドコストの異常」は、FinOpsチームを最も悩ませる課題のひとつです。放置すれば、わずかな期間で大幅な予算超過に発展しかねません。原因は、設定ミスのあるインフラ、想定外のオートスケーリング、稼働しっぱなしの開発環境など多岐にわたり、後述するセキュリティ侵害による不正利用というケースもあります。早期に検知できなければ、月次の請求書で初めて気づくことになり、その時点ではすでに対処の好機を逃しています。

手作業のレビューや遅れて届くレポートといった従来型のコストモニタリングでは、刻一刻と動くクラウド運用に追いつけません。異常に気づいたときには、すでに数万ドル規模の損失が発生していることもあります。だからこそ、リアルタイムのコスト異常検知はFinOps担当者にとって欠かせない機能になりつつあります。異常パターンを発生と同時に捉え、即座に対応する力は、もはや「あれば便利」ではなく、クラウドコストガバナンスの根幹そのものです。

異常検知の遅れが招くリスク

マネージドFinOpsプロバイダーであるDoiTでは、クラウド専門家がお客様のクラウドコスト異常の検知と影響緩和を支援し、必要に応じてAWS、Google Cloud、Microsoft Azureといったハイパースケーラーとお客様に代わって交渉し、返金の獲得にも取り組んでいます。

しかし、異常の規模や範囲が極端に大きい場合、クラウドの請求データだけに依存する従来型の異常検知では対応が遅れ、月次のクラウド請求への深刻な影響を防ぎきれないことがあります。クラウドプロバイダーがコストレポートのデータを更新するのは通常1日1回のため、異常が表面化するまでに24〜48時間のタイムラグが生じるからです。次に紹介する事例のように、その間にコストは月次のクラウド支出総額をはるかに超える水準まで膨らむこともあります。

セキュリティ侵害が引き起こすコスト異常

2025年3月のある週末、DoiTのアカウントチームは複数のお客様アカウントで大規模なコスト急増を検知しました。

急増の原因は、設定ミスのあったJenkinsプラグインを突破口にお客様の環境へ侵入した悪意ある第三者でした。攻撃者は暗号資産マイニングを目的に、新規のEC2 metalインスタンスを複数立ち上げていたのです。検知後、チームはただちにお客様に状況を通知し、セキュリティ侵害の封じ込めと不正なEC2 workloadsの停止を支援。法外なコストのさらなる積み上がりを食い止めました。

ただし、コスト急増を検出した情報源が更新後のAWS Cost and Usage Report(CUR)だったため、インスタンスは気づかれるまでに24時間以上稼働を続け、お客様のクラウド請求には不正利用によるAWSコストが9万ドル超計上される結果となりました。平均月次支出を26.7%押し上げる増加幅であり、リソースが限られ運営予算の逼迫した企業にとっては致命傷になりかねない水準です。

平均月次AWS支出

異常によるコスト

月次クラウド支出に占める割合

Company 1

€62,798

€25,532

40.6%

Company 2

$274,148

$48,971

17.9%

Company 3

$8,856

$17,773

200.7%

DoiTのリアルタイム異常検知がもたらす効果

これらのお客様がDoiT Cloud Intelligence™のリアルタイム異常検知を有効化していれば、AWS CloudTrailのデータをもとに、コストがお客様の通常の支出レンジ(DoiTの高度な機械学習モデルが判定)を超えてから30分以内に異常アラートが発報されていたはずです。攻撃者がコストを積み上げたペースを踏まえれば、CURデータから検知された実際の被害額と比べて、平均で29,220ドルの損失を回避できた計算になります。

EC2異常によるコスト

リアルタイム異常検知による削減見込み

Company 1

€25,532

€24,255

Company 2

$48,971

$46,522

Company 3

$17,773

$16,884

本機能は対象となるDoiT Cloud Intelligenceのお客様にご利用いただけます。DoiTがリアルタイムのCloudTrailデータを読み取るための追加権限を付与することで有効化できます。設定は、DoiT Cloud Intelligenceの「Link AWS」画面(画面上部のドロップダウンメニュー内Integrateタブから開けます)で表示されるCloudShellコマンドをコピーし、AWSコンソールに貼り付けるだけで完了します。数分以内にDoiTがデータの監視を開始し、リアルタイムでアラートを発報。お客様のメールに加えて、SlackやMS Teamsのチャンネルにも通知できます。

コスト異常による被害を最小化するには

クラウドコスト異常への対応において検知は欠かせない要素ですが、急増の原因を抑え込み、再発を防ぐためのフォローアップも同じくらい重要です。そのうえで、発生したコストの一部が返金対象になるかどうかを、クラウドプロバイダーと確認していきます。

先ほどのようなケースでは、お客様の正規クラウドリセラーであるDoiTがお客様に代わってAWSと交渉し、セキュリティ侵害によって発生したコストの少なくとも一部について返金を確保することが可能です。さらにDoiTのクラウド専門家は、お客様の社内クラウド運用チームと連携し、Jenkinsプラグインに見られたようなセキュリティ脆弱性の是正を支援することで、今後の不正アクセスを未然に防ぎます。

DoiTのリアルタイム異常検知について詳しくお知りになりたい方は、こちらからお問い合わせのうえ認定クラウドエキスパートにご相談いただくか、担当のDoiTアカウントマネージャーまでご連絡ください。