engineer-to-engineer
Hiding in Production
Forward Deployed Engineersがインシデントを解説。症状、根本原因、そして再発を防ぐ自動化までを語ります。

EKSクラスターは正常稼働中。エラーもアラートもなし。それでも請求書には、S3とは無関係の月額2,000ドルのデータ転送料金が紛れ込んでいます。正体は、同一クラスター内のノード間で発生するAZ間トラフィック。DataTransfer-Regional-Bytesとして請求されるため、VPCフローログを有効化しなければほぼ検知できません(しかもVPCフローログ自体にもコストがかかります)。
今回のHiding in Productionでは、DoiT Senior Cloud ArchitectのPiyush Patilが、根本原因の特定方法、手作業で解決した場合の流れ(11ステップ、複数チームをまたぐ調整、数日にわたる待ち時間)、そしてそのプロセス全体を置き換えたCloudFlow自動化までを解説します。
Library
ダッシュボードではなく、クラウドそのものを最適化
完全なCloud Intelligence™スタック。


