Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

Détection d'anomalies DoiT : précision chirurgicale, alertes sur mesure

By Matan BordoNov 29, 20237 min read

Cette page est également disponible en English, Deutsch, Español, Italiano, 日本語 et Português.

Avec la détection d'anomalies au niveau du SKU et des alertes ciblées, instaurez une culture de dépense cloud responsable tout en réduisant le temps moyen de résolution des pics de coûts.

Pour mieux maîtriser leurs dépenses cloud, de nombreuses entreprises incitent leurs équipes engineering et produit à assumer leur part des coûts cloud — et on comprend pourquoi.

Lorsque les Engineers et les responsables produit ont conscience du coût de leur travail, ils intègrent davantage cette dimension lors du développement de fonctionnalités et du suivi post-lancement, avec un impact direct et positif sur les résultats financiers.

Si le reporting en temps réel reste une tactique de référence pour sensibiliser les parties prenantes, il ne suffit pas toujours à réagir rapidement aux comportements anormaux ou aux pics de coûts. Encore faut-il des alertes en temps réel.

Or, jusqu'ici, les systèmes de détection d'anomalies prêts à l'emploi se contentaient généralement de surveiller la consommation cloud de l'ensemble de l'organisation, avec des alertes au niveau du service. Cette approche trop large présente deux limites :

  1. Elle vous oblige à identifier manuellement le ou les SKU et les ressources à l'origine de l'anomalie de coût pour un service donné.
  2. Elle envoie aux équipes des notifications d'anomalies qui ne concernent pas directement leurs opérations.

C'est pourquoi nous sommes ravis d'annoncer les alertes spécifiques au SKU pour DoiT Anomaly Detection, ainsi que la possibilité de s'abonner aux alertes d'anomalies portant uniquement sur les portions d'infrastructure dont vous avez la charge.

Passons en revue les avantages de ces deux fonctionnalités, et la marche à suivre pour configurer des alertes d'anomalies personnalisées dans DoiT Cloud Intelligence™.

Chacun est responsable de ses coûts cloud

Un principe fondamental du FinOps : chacun est responsable de ses coûts.

Pour instaurer une culture d'optimisation des coûts, il faut avant tout fournir des données précises et personnalisées aux bonnes personnes.

À l'image des rapports et des dashboards, des alertes d'anomalies personnalisées et précises déclenchent des conversations internes qui mènent in fine à une meilleure compréhension des coûts, à une responsabilisation accrue et à une réflexion sur les choix d'infrastructure sous-jacents.

Pourquoi nos coûts ont-ils explosé ? Était-ce attendu ? Que pouvons-nous faire mieux la prochaine fois ?

Comment fonctionne la détection d'anomalies au niveau du SKU

Alors que de nombreuses entreprises cherchent encore à automatiser leurs alertes d'anomalies, DoiT Anomaly Detection fonctionne dès l'installation : il surveille en autonomie les pics de coûts et vous alerte dès qu'une dépense anormale apparaît, pour que vous puissiez agir vite et limiter son impact sur votre facture. Vos Engineers n'ont donc pas à développer ni à maintenir un outil interne dédié.

Auparavant, l'outil observait la consommation des ressources cloud de votre organisation et définissait un comportement normal pour chaque service, projet par projet ou compte par compte.

Mais chaque minute durant laquelle un pic de coût passe inaperçu, c'est comme laisser le robinet ouvert sur votre compte bancaire. Plus l'anomalie reste invisible, plus l'impact financier et les conséquences potentielles s'aggravent. Et plus vous devez chercher manuellement la source du pic, plus la facture grimpe.

Avec notre dernière mise à jour, DoiT Anomaly Detection analyse désormais les anomalies SKU par SKU. Dès qu'un comportement anormal est détecté, vous recevez un e-mail (et un message Slack si vous l'avez configuré) qui met en évidence le SKU concerné.

Alerte d'anomalie envoyée par e-mail

Alerte d'anomalie envoyée par e-mail

Pour aller plus loin dans DoiT Cloud Intelligence, vous voyez également les ressources qui contribuent au pic de coût. Cela permet d'en identifier précisément la cause, au niveau le plus granulaire, et réduit le temps moyen de résolution.

Dans l'exemple ci-dessous, DoiT Cloud Intelligence indique qu'une anomalie a été détectée sur S3, et plus précisément sur le SKU DataTransfer-Out-Bytes. Trois buckets S3 contribuent principalement à ce pic, bucket-1 en tête.

Anomalie détectée pour un SKU AWS S3

Exemple de pic de coût détecté pour un SKU dans AWS S3

Vous obtenez aussi une explication de l'anomalie et du SKU — leurs noms n'étant pas toujours très parlants (ex. EUN1-LCUUsage) — ainsi que des conseils d'optimisation pertinents.

Explication d'une anomalie détectée pour un SKU AWS S3

Explication détaillée d'une anomalie détectée sur les coûts de transfert de données S3, accompagnée de recommandations d'optimisation

Pourquoi personnaliser les alertes d'anomalies sur les portions d'infrastructure dont vous avez la charge

Les alertes d'anomalies ciblées vont plus loin que la détection au niveau du SKU : elles permettent à vos équipes d'affiner les alertes qu'elles reçoivent, en se concentrant uniquement sur les coûts cloud dont elles ont la charge.

Vous pouvez aussi vouloir analyser les écarts dans un contexte précis. Par exemple, la saisonnalité de l'activité peut masquer des pics de coûts dans les projets R&D.

Voici pourquoi c'est essentiel :

  1. Pertinence et concentration : en adaptant les alertes de détection d'anomalies à chaque équipe, vous garantissez que vos parties prenantes ne sont notifiées que des anomalies qui impactent directement leurs opérations. Cela réduit la fatigue liée aux alertes et aide les équipes à se concentrer sur les actions qui relèvent de leur périmètre.
  2. Réaction plus rapide : lorsque vos équipes reçoivent des alertes liées à leurs propres coûts cloud, elles peuvent rapidement remonter à la source du problème et corriger les irrégularités. Cette approche ciblée raccourcit le temps de réponse aux incidents et limite l'impact d'un pic de coût sur votre facture mensuelle.
  3. Optimisation précise : la détection d'anomalies met en lumière les zones où l'optimisation des coûts s'impose. Lorsque les équipes sont alertées sur des pics de coûts dans leur périmètre, elles sont plus enclines à optimiser l'utilisation des ressources et à appliquer les bonnes pratiques, avec à la clé des économies globales et des habitudes financières saines.
  4. Culture de la responsabilité : avec une détection d'anomalies ciblée, le sens de l'appropriation et de la responsabilité s'enracine. Les équipes deviennent directement responsables de la gestion de leurs dépenses cloud, ce qui favorise une culture de conscience financière et de rigueur.

Configurer des alertes d'anomalies personnalisées avec DoiT

Vous devez d'abord définir les coûts dont chaque équipe ou personne est responsable. Dans DoiT Cloud Intelligence, cela se fait via les Attributions.

Qu'est-ce qu'une Attribution ?

Une Attribution est un regroupement logique de ressources cloud qui définit une catégorie de coûts propre à votre entreprise.

Les Attributions vous aident à associer vos dépenses cloud à des équipes, des applications, des environnements — toute catégorie ou tout regroupement pertinent pour votre activité.

Imaginons par exemple que votre entreprise propose trois produits différents dont vous souhaitez suivre les coûts. Les ressources de chaque produit sont alors réparties sur plusieurs comptes AWS.

Grâce aux Attributions, vous pouvez regrouper plusieurs comptes AWS et nommer ce regroupement d'après l'application concernée. Voici un exemple avec Application A, définie de cette manière.

Exemple d'Attribution pour une application hypothétique

Exemple d'Attribution pour une application hypothétique

Disons maintenant que vous souhaitez que les Engineers et les responsables produit qui travaillent sur Application A soient alertés uniquement lorsqu'une anomalie liée à cette application est détectée.

Une fois l'Attribution créée, il suffit d'y activer la détection d'anomalies.

Activation de la détection d'anomalies pour une Attribution

Activation de la détection d'anomalies pour une Attribution

Vous pouvez ensuite accéder aux paramètres de notification des personnes responsables d'Application A et les abonner aux alertes liées à cette Attribution (ou les laisser le faire elles-mêmes).

Abonnement aux alertes d'anomalies pour une Attribution spécifique

Abonnement aux alertes d'anomalies pour une Attribution spécifique

Elles peuvent également relayer ces alertes vers le canal Slack de leur équipe, le cas échéant.

Abonnement aux alertes Slack pour les anomalies détectées sur une AttributionRelayer les alertes d'anomalies détectées pour une Attribution vers un canal Slack partagé

Lorsqu'une alerte d'anomalie arrive sur Slack, vous pouvez la noter pour affiner notre algorithme, ou choisir d'approfondir l'analyse dans DoiT Cloud Intelligence.

alerte d'anomalie envoyée vers un canal Slack

Alerte d'anomalie envoyée vers un canal Slack partagé

Lorsqu'une anomalie est détectée pour une Attribution, son nom apparaît directement sur la page de l'anomalie.

En matière de gestion des coûts cloud, des alertes en temps réel précises et personnalisées sont indispensables pour responsabiliser vos équipes sur leurs dépenses.

Les alertes au niveau du SKU dans DoiT Anomaly Detection marquent un grand pas en avant pour réduire significativement le temps moyen de résolution des pics de coûts.

Combinées à des alertes d'anomalies plus précises et ciblées, elles aident votre entreprise à instaurer une culture de dépense cloud responsable, en permettant aux équipes de prendre des décisions éclairées en autonomie, de réagir vite aux irrégularités et de contribuer activement à la réussite globale de vos initiatives cloud.

À mesure que votre entreprise adopte les pratiques FinOps, ces fonctionnalités deviendront un atout précieux pour gagner en visibilité sur les coûts, optimiser l'allocation des ressources et, à terme, atteindre l'excellence financière dans le cloud.

Si vous êtes client DoiT, vous pouvez dès maintenant vous abonner — vous et vos parties prenantes — aux alertes d'anomalies portant sur les portions d'infrastructure dont chacun a la charge dans DoiT Cloud Intelligence. Vous n'êtes pas client DoiT mais souhaitez tirer parti de cette fonctionnalité ainsi que de l'ensemble du portefeuille produit de DoiT ? Contactez-nous ici.