RapydがKubernetesのコストを40%削減するために観測可能性のギャップを解決した方法
ラピードとの出会い
Rapydは、グローバルな決済テクノロジーとネットワークを単一のプラットフォームに統合するフィンテックのリーディングカンパニーである。同社は、企業が100カ国以上で簡単に支払いを受け入れ、処理し、払い出すことを可能にし、190カ国以上で支払いを可能にする。
Rapydのプラットフォームは、多様な決済手段やカード発行(仮想・現物の両方)、外国為替、資金管理機能を統合することで、迅速かつ安全でシームレスなグローバル・コマースを実現し、フィンテックにおけるイノベーションとスケールの基盤となっている。
挑戦
RapydはAWS EC2からEKSに移行することで、パフォーマンスを向上させ、クラウド費用を削減することを目指しましたが、フィンテック業務に不可欠な弾力性を損なうことはありませんでした。KubernetesはすでにRapydのインフラストラクチャの中心となっており、15以上のクラスタをサポートし、大規模なイノベーションに必要なスピードと俊敏性を実現していました。
スムーズな移行を実現するため、CI/CD、インフラ、SREの各チームは当初、ノード、ポッド、クラスタにわたってリソースを過剰にプロビジョニングした。これにより安定性は確保されたものの、Kubernetesが提供できる弾力性とコスト効率は制限されました。既存の観測可能性ツールは、正確な最適化をサポートするための深さに欠けており、潜在的なコスト削減の可能性が残されていました。
パフォーマンスと効率性の目標を完全に実現するために、RapydはKubernetesリソースの消費を検出し、実用的できめ細かな洞察によって適切なサイズに調整できるソリューションを必要としていました。
ソリューション
DevOpsチームリーダーのBoris Isakov氏のリーダーシップのもと、RapydはKubernetes最適化のより革新的でスケーラブルなアプローチを求めて、PerfectScale by DoiTに注目しました。
よりスマートな最適化、ビルトイン
PerfectScaleはサービスライフサイクルの早い段階で導入され、最適化を開始する前に新しいサービスを数日間実行することができました。このワークフローと、ワークロードのライトサイジングを行うPodFitやノードの最適化を行うInfraFitといったPerfectScaleの強力なツールを組み合わせることで、Rapydはクラウドのリソース利用率の向上を迅速に達成することができました。
「当社のグローバル環境へのPerfectScaleの初期導入は、天啓でした。リソースの浪費が膨大であること、Kubernetesのベストプラクティスから大きく逸脱していることが明らかになりました。「PerfectScaleの導入により、効率的なスケーリングと最適化への道筋が見えてきました。
AIによるパフォーマンス向上
コスト削減だけでなく、PerfectScaleはRapydのプラットフォームのパフォーマンスと回復力を強化しました。データに基づき、インフラに焦点を当てた提案により、チームはリソースの要求と制限を微調整し、コストを削減しながらパフォーマンスを向上させることができました。
「コストだけがすべてではないことを理解しました。それはクラスタのパフォーマンスです。「コストは下がり、パフォーマンスは向上している。
PerfectScaleの高度なアラートシステムは、エンドユーザーに影響を与える前に問題をプロアクティブに特定しました。Slackと統合されたアラートは、重大度別に分類され、他の観測可能性ツールでは見逃されていたメモリ不足エラーなどの重大な問題を強調表示しました。
「PerfectScaleからは、他のソリューションでは得られなかったアラートを受け取ることができました。これらのアラートにより、当社の環境全体でプロアクティブに問題に対処することができ、顧客に影響が及ぶ前に問題を回避することができました。”
このような積極的なアプローチにより、ミリ秒を争う業界での事業継続性が確保された。
信頼できるパートナーシップ
そのプロセスを通じて、PerfectScaleのチームはハンズオンのガイダンスとKubernetesに関する深い専門知識を提供し、彼らのテクノロジーの能力をさらに拡張してくれました。このサポートは、Rapydがチーム全体でベストプラクティスを採用し、スケールさせる上で重要な役割を果たしました。
「PerfectScaleチームは非常にプロフェッショナルで、機能の説明や最適化プロセスのガイドをしてくれました。
結果
RapydとPerfectScaleのコラボレーションは、パフォーマンス、コスト、スケーラビリティのバランスをとりながら、よりスマートで弾力性のあるKubernetes戦略を推進しています。
主な成果
- EKSのコストを35~40%削減
最適化により、よりインテリジェントなリソース配分で大幅なコスト削減を実現。 - ワークロードの権利化とノードの最適化
PodFitとInfraFitは、Rapydがクラスタを正確に微調整するのに役立ちました。 - プラットフォーム・パフォーマンスの向上
PerfectScaleの洞察に基づく調整により、サービスの信頼性が向上。 - 高度なアラートシステム
重大な問題は、サービス品質に影響を与える前に、Slackに統合された重大度ベースのアラートによって迅速に解決された。