AIとRayのworkloadsを本番環境でスケールさせるチームに選ばれています
数分で接続完了
APIトークン1つで、Rayクラスターを丸ごと可視化
読み取り専用のAPIトークンでAnyscale組織を接続するだけ。DoiTが消費メトリクス、クラスター利用状況、AWSやGCPのクラウド支出を自動で取り込みます。エージェントは不要で、Rayジョブのコードに手を加える必要もありません。接続から数時間で統合レポートが利用可能になります。

得られるもの
Anyscale上でRayを運用する現場のために設計
Anyscale組織を接続したFinOpsやMLプラットフォームのリーダーが、実際に求めている機能を揃えました。

消費レポートの統合
Anyscaleの支出をワークスペース、プロジェクト、クラスター、チーム別に分析し、基盤となるクラウドコストと並べて把握できます。

リアルタイムの異常検知
暴走するRayジョブやGPU支出の急増を、数分以内にアラートでお知らせします。

クラスターのライトサイジング
オーバースペックなヘッドノードやワーカーノードを特定し、CPU・GPU・メモリの具体的な改善策を提示します。

アイドルクラスターの検出
ジョブ完了後も稼働し続けているRayクラスターを洗い出し、無駄な支出を取り戻します。

GPU・アクセラレータの可視化
集約された請求書に埋もれがちな、トレーニング・チューニング・サービングworkloadsのGPU、CPU、xPU使用状況をくっきり切り分けます。

ガバナンスと予算管理
MLチームやプロジェクト単位で予算を設定し、次のトレーニング実行前に超過を検知します。
Anyscaleのusage dashboardが示すのは「消費した量」だけ。Cloud Intelligence™は、その先のアクションにつなげます。
Anyscaleのusage dashboardの先へ
マルチクラウドの集約ビュー
AWS、GCP、Kubernetes上で動くAnyscale支出を一元的に表示し、任意のクラスターまでドリルダウンできます。
リアルタイム異常アラート
ワークスペース、クラスター、ジョブの各次元で機械学習による検知を行い、Slackやメールに通知します。
GPU commitmentsの計画立案
Savings Plans、CUD、リザーブドインスタンスを実際のRay利用状況に照らしてシミュレーションし、コミット前に最適解を導きます。
プロジェクトと配賦の整備
タグ付けされていないRay workloadsを発見し、配賦ルールを徹底。財務部門が求める形で共有コストを按分します。
Kubernetesのコスト配賦
Kubernetes上のAnyscale支出を、追加のエクスポーターなしで名前空間、workload、ラベル別に分解します。
Forward Deployed Engineers
世界水準のクラウドアーキテクトが、お客様のチームの一員として最適化を実装します。
急成長企業はDoiT Cloud Intelligence™で運用しています
最初の90日間の平均削減率
平均導入期間
“DoiTの信頼性とシステムの柔軟性により、Engineersが手を動かさずにAmazon EKS workloadsを安全に最適化できています。”
Oren Ashkenazy
Director of DevOps and Cloud at Fiverr
Anyscale組織を接続する準備はできましたか?
Rayクラスターの支出を、徹底的に見える化しましょう。
Frequently asked
questions
ワークスペースやプロジェクトを横断したAnyscaleコストの可視性を高めるには?
Anyscale組織を一度接続するだけで、Cloud Intelligence™がすべてのワークスペースとプロジェクトの消費データを取り込みます。クラスター、ジョブ、チーム、基盤クラウド別のコストを単一のビューで分析でき、手作業での集計は不要です。
Anyscaleの利用データをCloud Intelligence™と連携させる最適な方法は?
Anyscale組織の読み取り専用APIトークンと、AWSまたはGCPの請求情報の連携を組み合わせます。DoiTがデータの取り込み、正規化、時間単位でのレポーティングを担います。多くのチームが1日以内に運用を開始しています。
どのRayクラスターやジョブが支出の大半を占めているかを把握するには?
Cost & Usageレポートを使えば、Anyscale支出全体から特定のクラスター、ジョブ、ノードタイプまでドリルダウンできます。SQLを書くことなく、ワークスペース、プロジェクト、リージョン、インスタンスファミリーでフィルタ可能です。
Anyscaleのコスト異常をリアルタイムで監視するには?
異常検知はワークスペース、クラスター、ジョブの各次元で常時稼働します。夜間にGPU時間を消費し続けるトレーニング実行など、異変を検知すると、考えられる原因とともにSlackやメールでアラートが届きます。
アイドル状態やオーバースペックのRayクラスターによる無駄を削減するには?
Cloud Intelligence™は、利用率目標を下回るクラスター、workloadに対してオーバースペックなヘッドノード、ジョブ完了後にアイドル状態のまま放置されたクラスターを検出します。各推奨事項には削減見込み額が表示されます。
Anyscaleの支出をMLチームやモデルへ配賦するには?
Anyscaleのワークスペース、プロジェクト、タグを社内のコストセンターにマッピングします。共有GPUプールは配賦ルールで按分できるため、財務部門は手作業のスプレッドシートなしでチーム別・モデル別のコストを把握できます。
Cloud Intelligence™はAnyscaleのusage dashboardと何が違いますか?
Anyscaleのusage dashboardは、Anyscale内部の消費見積もりを示すものです。Cloud Intelligence™はそれを実際のクラウド支出と結びつけ、マルチクラウドの可視性、先回りの推奨、異常検知、ガバナンス、Forward Deployed Engineersへのアクセスを提供します。
Anyscale組織を接続した際、データのセキュリティは保たれますか?
Cloud Intelligence™は最小権限の読み取り専用APIトークンを使用します。お客様の承認なしにクラスターやジョブを変更することはなく、プラットフォームはSOC 2 Type II認証を取得しています。
