Cursus
Au cours de mes années de collaboration avec infrastructure AWS , j'ai constaté que la visibilité sur vos ressources cloud fait la différence entre une résolution proactive des problèmes et une gestion réactive des urgences.
Amazon CloudWatch remplit précisément cette fonction : Il agit comme le système nerveux central de votre environnement AWS, en assurant une surveillance, une journalisation et une observabilité complètes de l'ensemble de votre infrastructure.
Je vais vous présenter les fonctionnalités de CloudWatch, de la surveillance des métriques de base aux opérations avancées basées sur l'intelligence artificielle. À la fin de ce tutoriel, vous saurez comment utiliser CloudWatch pour surveiller efficacement vos ressources AWS, optimiser vos coûts et résoudre les problèmes avant qu'ils n'aient un impact sur vos utilisateurs.
Si vous débutez avec AWS, je vous recommande de suivre notre technologie et services cloud AWS.
Qu'est-ce qu'AWS CloudWatch ?
Avant d'aborder les aspects pratiques, examinons d'abord ce qu'est CloudWatch et comment il s'intègre dans l'écosystème AWS plus large.
CloudWatch est la plateforme d'observabilité unifiée d'AWS qui collecte, surveille et analyse les données provenant de vos ressources et applications cloud. Ce service vous permet de surveiller l'ensemble de votre infrastructure, notamment les applications, l'infrastructure, le réseau et les services, et d'utiliser les alarmes, les journaux et les données d'événements pour prendre des mesures automatisées.
La plateforme fonctionne dans les environnements natifs AWS et les scénarios hybrides, prenant en charge les charges de travail sur AWS, d'autres fournisseurs de cloud et les centres de données sur site. L'agent CloudWatch collecte des données télémétriques à partir de n'importe quel environnement, offrant ainsi une vue d'ensemble unique pour tous les besoins en matière de surveillance.

AWS Cloudwatch
Ce qui rend CloudWatch particulièrement performant, c'est son niveau d'intégration au sein d'AWS. Chaque service AWS majeur publie automatiquement des métriques dans CloudWatch :
- Services informatiques : EC2, Lambda, ECS et EKS
- Services de base de données : RDS, DynamoDB et Aurora
- Services de stockage : S3, EBS et EFS
- Services de réseau : VPC, CloudFront et Route 53
Grâce à cette intégration native, vous pouvez commencer immédiatement la surveillance sans configuration complexe. Maintenant que vous comprenez ce qu'est CloudWatch, examinons les coûts liés à l'utilisation de ce service performant.
Tarification AWS CloudWatch
Il est essentiel de bien comprendre le coût de CloudWatch avant de l'implémenter dans votre infrastructure. Permettez-moi de vous expliquer le modèle de tarification et vous présenter des stratégies pour maîtriser vos coûts.
Niveau gratuit et structure tarifaire d'AWS CloudWatch
Le service fonctionne selon un système de paiement à l'utilisation, sans engagement préalable. La plupart des services AWS transmettent automatiquement et gratuitement des métriques à CloudWatch.
Le niveau gratuit comprend des allocations généreuses qui couvrent les besoins de surveillance de base :
- 10 indicateurs personnalisés et un nombre illimité d'indicateurs de surveillance de base
- 10 alertes pour les mesures de résolution standard
- 1 million de requêtes API par mois
- 5 Go d'ingestion et de stockage de données de journalisation
- 3 tableaux de bord avec jusqu'à 50 indicateurs chacun
- 100 tests canari par mois pour les produits synthétiques
Au-delà du niveau gratuit, les métriques personnalisées coûtent environ 0,30 $ par métrique pour les 10 000 premières métriques, avec des remises sur volume appliquées à mesure que l'utilisation augmente. Les tableaux de bord sont facturés 3 $ par tableau de bord et par mois.
L'ingestion de journaux coûte généralement 0,50 $ par Go dans les régions de l'est des États-Unis (les tarifs varient selon les régions) après la période d'essai gratuit. Ce tarif s'applique uniquement aux 10 premiers To par mois ; au-delà, le tarif diminue progressivement.
Utilisation journaux à accès peu fréquent réduit les coûts d'ingestion de 50 %, soit 0,25 $ par Go dans les régions de l'est des États-Unis. Cependant, il est important de noter qu'ils ne prennent pas en charge l'utilisation de filtres métriques, qui ne fonctionnent qu'avec les journaux standard. Cependant, Logs-IA ne prend pas en charge des fonctionnalités telles que les filtres métriques.
Voici un aperçu des principaux éléments de tarification au-delà de l'offre gratuite :
|
Caractéristique |
Tarification (Est des États-Unis) |
|
Mesures personnalisées (les 10 000 premières) |
0,30 $ par métrique/mois |
|
Ingestion des journaux |
0,50 $ par Go / 0,25 $ par Go (accès peu fréquent) |
|
Stockage des journaux |
0,03 $ par Go/mois |
|
Tableaux de bord standard |
3,00 $ par tableau de bord/mois |
|
Alarmes standard |
0,10 $ par alarme/mois |
Stratégies de gestion des coûts dans AWS CloudWatch
Grâce à mon expérience dans l'optimisation des coûts CloudWatch, j'ai identifié plusieurs stratégies efficaces :
- Publication sélective de mesures : Adoptez une approche stratégique avec des indicateurs personnalisés. Chaque indicateur que vous publiez a un coût, par conséquent, concentrez-vous sur les mesures essentielles à l'activité plutôt que de surveiller tout ce qui est possible. Utilisez des filtres métriques pour extraire des informations des journaux plutôt que de créer des métriques personnalisées distinctes, dans la mesure du possible.
- Optimiser la conservation des journaux : Mettez en œuvre des politiques de conservation conformes à vos exigences en matière de conformité. CloudWatch Logs Infrequent Access offre une option économique pour les journaux que vous devez conserver mais que vous consultez rarement. Je configure généralement :
- Conservation des journaux de débogage pendant 7 jours
- 30 jours pour les journaux d'application
- Plus de 90 jours pour les journaux d'audit nécessitant une conformité
- Définir des intervalles de surveillance appropriés : Envisagez d'utiliser la surveillance détaillée uniquement pour les ressources nécessitant une granularité inférieure à la minute. Une surveillance de base à intervalles de 5 minutes est suffisante pour la plupart des charges de travail et permet de réduire les coûts.
- Réduire au minimum le transfert de données : Veuillez utiliser CloudWatch Logs Insights plutôt que de transmettre inutilement les journaux vers des outils externes, car les coûts de transfert de données peuvent rapidement s'accumuler.

Si vous souhaitez en savoir plus sur la manière de tirer parti de la structure tarifaire AWS et de sécuriser vos ressources, je vous recommande de suivre notre cours sur la sécurité et la gestion des coûts AWS .
Principales fonctionnalités d'AWS CloudWatch
CloudWatch propose une suite complète d'outils de surveillance qui fonctionnent ensemble pour offrir une visibilité totale sur votre environnement AWS. Explorons les fonctionnalités principales que vous utiliserez le plus fréquemment.
Surveillance en temps réel avec indicateurs, tableaux de bord et alertes
Les métriques constituent la base de la surveillance CloudWatch. CloudWatch offre une visibilité sur les métriques avec une précision d'une seconde, une conservation des données d'un jour à une durée indéterminée, ainsi que la possibilité d'effectuer des calculs. Cette visibilité détaillée permet une surveillance en temps réel et une analyse historique pour la planification des capacités.
Vous pouvez créer des tableaux de bord adaptés aux besoins des différentes parties prenantes. Les équipes opérationnelles ont besoin d'informations en temps réel sur l'utilisation des ressources, tandis que les équipes financières tirent profit du suivi des coûts. CloudWatch prend en charge les tableaux de bord inter-comptes, ce qui permet une surveillance centralisée des architectures multi-comptes.
Les alertes fournissent des notifications proactives lorsque les indicateurs dépassent les seuils définis. Je configure des alarmes avec l'intégration Amazon SNS pour envoyer des notifications ou déclencher des mesures correctives automatisées via fonctions Lambda. Par exemple, lorsque l'utilisation du processeur dépasse 80 % pendant 5 minutes, une alarme peut automatiquement déclencher l'Auto Scaling.
Ensuite, examinons comment CloudWatch va au-delà des métriques de base pour offrir une observabilité complète des applications et des conteneurs.
Observabilité des applications et des conteneurs
Pour les applications modernes, CloudWatch Application Signals offre une visibilité immédiate sur la latence, les erreurs et les performances des charges de travail d'IA. Il offre également une instrumentation automatique, éliminant les modifications manuelles du code et permettant la création et la surveillance d'objectifs de niveau de service (SLO).
En ce qui concerne les environnements conteneurisés, CloudWatch Container Insights recueille des informations sur l'utilisation des ressources informatiques à partir des applications conteneurisées. Container Insights prend en charge :
- Amazon ECS : Indicateurs au niveau des clusters, des tâches et des services
- Amazon EKS : Visibilité aux niveaux du cluster, du nœud et du pod
- AWS Fargate : Observabilité complète pour les conteneurs sans serveur
- Kubernetes autogéré : Prise en charge sur site et hybride
Ces capacités d'observabilité génèrent un volume important de données qui nécessitent une gestion efficace. Pour comparer les services de conteneurs AWS, veuillez consulter notre comparaison entre ECS et EKS.
Gestion et analyse des journaux
Examinons maintenant les fonctionnalités de gestion des journaux de CloudWatch.
Pour le stockage centralisé des journaux, CloudWatch Logs centralise la gestion des journaux provenant des services AWS, des applications et des ressources sur site. J'organise les journaux en groupes de journaux représentant différentes applications, avec des flux de journaux capturant des sources individuelles. Les politiques de conservation établissent un équilibre entre les exigences de conformité et les coûts de stockage.
Lorsque vous avez besoin d'analyser ces données de journal, CloudWatch Logs Insights fournit un langage de requête puissant pour analyser les données de journal. J'utilise sa syntaxe de type SQL pour effectuer rapidement les opérations suivantes :
- Identifier les schémas d'erreurs
- Suivre les sessions spécifiques des utilisateurs
- Agrégation des mesures à partir de données non structurées
Pour l'audit de sécurité, CloudWatch s'intègre à CloudTrail afin de capturer et d'analyser tous les appels API.

Allant encore plus loin dans la gestion des journaux, les récentes fonctionnalités de gestion unifiée des données permettent de collecter et d'agréger les journaux de tous les comptes et régions AWS. Il élimine le besoin de pipelines ETL complexes et de multiples magasins de données, ce qui change la donne pour les équipes réparties à l'échelle mondiale.
Au-delà de la surveillance du backend, il est tout aussi essentiel de comprendre l'expérience utilisateur réelle. C'est là que les capacités de surveillance des utilisateurs finaux de CloudWatch entrent en jeu.
Surveillance des utilisateurs finaux et synthétique
Pour comprendre comment les utilisateurs réels perçoivent vos applications, CloudWatch RUM (Real User Monitoring) recueille des données sur l'expérience utilisateur réelle à partir d'applications Web. Je mets en œuvre RUM afin de comprendre les performances des applications du point de vue de l'utilisateur, en suivant les temps de chargement des pages, les erreurs JavaScript et le comportement des utilisateurs.
Pour effectuer des tests proactifs avant que les utilisateurs ne soient affectés, CloudWatch Synthetics complète RUM en testant de manière proactive les points de terminaison des applications. Vous pouvez créer des canaris (scripts simulant les interactions des utilisateurs) afin de surveiller en permanence la disponibilité. Ces tests sont effectués selon un calendrier défini, ce qui permet de signaler les problèmes avant que les utilisateurs réels ne les rencontrent.
Alors que les technologies RUM et Synthetics offrent une surveillance superficielle, une meilleure compréhension de ce qui se passe au sein de vos applications distribuées nécessite une visibilité plus approfondie. C'est là que le traçage distribué devient essentiel.
Suivi distribué avec AWS X-Ray
Pour une visibilité complète des requêtes, AWS X-Ray permet le traçage distribué, affichant les flux de requêtes à travers les architectures de microservices. La carte de trace permet de visualiser les dépendances des services et met en évidence les sources de latence. J'utilise X-Ray pour identifier les goulots d'étranglement liés à la latence et comprendre les dépendances des services.

D'autre part, pour identifier les modèles de performance et les goulots d'étranglement, Contributor Insights analyse les données à cardinalité élevée afin d'identifier les principaux contributeurs au comportement du système. Lors de l'analyse des erreurs, il identifie les points de terminaison, les utilisateurs ou les ressources spécifiques qui génèrent le plus de problèmes.
Ces capacités de surveillance deviennent considérablement plus efficaces lorsqu'elles sont intégrées aux services d'automatisation d'AWS. C'est ici que les choses deviennent intéressantes.
Intégrations AWS et réponses automatisées
La puissance de CloudWatch est renforcée par ses intégrations avec d'autres services AWS. Pour l'automatisation basée sur les événements, Amazon EventBridge reçoit les alertes et les événements CloudWatch, coordonnant ainsi les réponses automatisées. Vous pouvez créer des workflows dans lesquels les alarmes CloudWatch déclenchent des règles EventBridge qui invoquent des fonctions Lambda pour :
- Redémarrage automatique des services défaillants
- Adaptation des ressources en fonction de la demande
- Prise de clichés avant la remédiation
- Informer les équipes via plusieurs canaux
Pour les flux de travail opérationnels complexes, l'intégration avec Systems Manager permet d'automatiser les actions opérationnelles. Les alarmes CloudWatch peuvent déclencher l'exécution de documents Systems Manager Automation qui exécutent des procédures de correction complexes sur plusieurs ressources.
Maintenant que nous avons exploré les fonctionnalités de CloudWatch, examinons pourquoi la mise en œuvre de cette plateforme est importante pour votre organisation.
Cas d'utilisation d'AWS CloudWatch
Comprendre les fonctionnalités de CloudWatch est une chose, mais il est essentiel de comprendre comment elles se traduisent en valeur commerciale réelle. Voici pourquoi des organisations de tous les secteurs font confiance à CloudWatch pour leurs opérations.
Visibilité opérationnelle et suivi des performances
CloudWatch offre une visibilité centralisée sur toutes les ressources AWS. J'apprécie particulièrement la possibilité de surveiller les instances EC2, les fonctions Lambda, les requêtes de base de données et les métriques spécifiques aux applications à partir d'une seule interface, ce qui permet une corrélation rapide entre le comportement de l'infrastructure et les performances des applications.
La plateforme réduit le temps moyen nécessaire à la résolution des problèmes grâce à une collecte exhaustive de données. Lorsque j'enquête sur des incidents, je peux consulter simultanément les métriques, les journaux et les traces, ce qui me permet non seulement de comprendre qu'un problème s'est produit, mais également pourquoi il s'est produit.
Au-delà de la visibilité opérationnelle, CloudWatch joue un rôle crucial dans le maintien de la conformité et le soutien aux enquêtes judiciaires.
Conformité et dépannage centrés sur les journaux
Pour les secteurs réglementés, CloudWatch sert de référentiel centralisé pour les pistes d'audit et les journaux de conformité. Je configure les durées de conservation des journaux conformément aux exigences réglementaires. L'intégration de CloudWatch à CloudTrail permet de capturer toutes les activités API, fournissant ainsi des pistes d'audit complètes pour les enquêtes de sécurité.
Lors d'une intervention en cas d'incident, les journaux constituent la principale source d'information pour l'analyse des causes profondes. CloudWatch Logs Insights permet d'effectuer rapidement des requêtes sur des téraoctets de données de journaux, ce qui facilite l'identification des modèles d'erreurs et l'analyse du comportement du système menant aux incidents.
Les capacités de conformité et de dépannage conduisent naturellement à un autre avantage essentiel : l'optimisation des coûts.
Optimisation des coûts et contrôle de la facturation
Les indicateurs de facturation de CloudWatch permettent une gestion proactive des coûts. Je configure des alertes sur les frais estimés afin de détecter immédiatement toute augmentation inattendue, ce qui me permet d'examiner rapidement les coûts et de prendre des mesures correctives.
Les informations sur les performances contribuent également à l'optimisation des coûts. En analysant les indicateurs d'utilisation des ressources, j'identifie les ressources surdimensionnées afin de les redimensionner et je comprends les goulots d'étranglement des applications qui réduisent les ressources nécessaires.
Évolutivité hybride et multicloud
CloudWatch s'étend au-delà d'AWS pour surveiller les environnements hybrides et multicloud, soutenant ainsi les organisations disposant d'infrastructures variées. Grâce à CloudWatch Agent, vous pouvez, par exemple, collecter des métriques à partir de serveurs sur site, offrant ainsi une observabilité unifiée, quel que soit l'endroit où s'exécutent les charges de travail.
D'après mon expérience, cela s'avère particulièrement utile lors des migrations vers le cloud. Je peux comparer les performances entre différents environnements à l'aide des mêmes outils, garantissant ainsi que les migrations n'entraînent pas de régressions.
Pour ceux d'entre vous qui se demandent comment ces fonctionnalités se comparent au service CloudTrail d'Amazon, nous vous invitons à lire notre article comparatif sur AWS CloudTrail et AWS CloudWatch.
Configuration de CloudWatch
Êtes-vous prêt à commencer à utiliser CloudWatch ? Le processus de configuration est simple, et je vais vous guider à travers toutes les étapes nécessaires pour commencer à surveiller votre infrastructure.
Conditions préalables
Avant de commencer la mise en œuvre de CloudWatch, veuillez vous assurer que vous remplissez les conditions préalables suivantes :
- Compte AWS avec les autorisations IAM appropriées
- AWS CLI installé et configuré avec les informations d'identification
- Politique CloudWatchFullAccess pour la configuration initiale
- Connectivité Internet ou points de terminaison VPC pour les instances EC2
- Accès HTTPS sortant pour les serveurs sur site
Pour la production, je recommande des rôles IAM dédiés qui respectent les principes du moindre privilège plutôt que d'accorder un accès complet à long terme.
Si vous possédez déjà un compte mais avez besoin d'aide concernant les commandes du terminal, notre tutoriel sur Comment utiliser l'interface CLI AWS vous guide à travers les aspects liés à la ligne de commande.
Maintenant que les prérequis sont remplis, passons à la procédure de configuration initiale.
Accès à CloudWatch
Veuillez accéder à CloudWatch via la console de gestion AWS en vous rendant sur le service CloudWatch. La vue principale offre une visibilité immédiate sur toutes les commandes, options et intégrations.

AWS CloudWatch
Par exemple, vous pouvez visualiser les journaux de vos services en cours d'exécution sous Gestion des journaux. Il s'agit probablement de l'une des visualisations les plus utilisées, car elle nous permet d'analyser les journaux des applications et d'effectuer un débogage si quelque chose ne fonctionne pas comme prévu.

Gestion des journaux
Surveillance du cloud avec AWS CloudWatch
Maintenant que vous savez comment accéder à CloudWatch, examinons les workflows pratiques que vous utiliserez quotidiennement pour surveiller efficacement vos ressources. Je vais vous présenter les techniques de surveillance essentielles qui deviendront une seconde nature.
Surveillance à l'aide de mesures
La consultation des métriques commence dans la console CloudWatch Metrics. Voici comment procéder :
Étape 1 : Accéder aux métriques CloudWatch
- Veuillez ouvrir la console de gestion AWS et accéder à CloudWatch.
- Dans le volet de navigation gauche, veuillez cliquer sur Métriques → Toutes les métriques.
- Vous verrez apparaître une liste des espaces de noms de services disponibles (AWS/Bedrock, AWS/EC2, AWS/Lambda, etc.).

Tableau de bord des métriques CloudWatch
Étape 2 : Sélectionner et visualiser les indicateurs
Comme vous pouvez le constater sur l'image ci-dessus, sous « Toutes les mesures », vous avez accès aux différents services. Pour commencer, vous pouvez cliquer sur n'importe quel service et accéder au tableau de bord automatique. Par exemple, lorsque je clique sur mon tableau de bord Bedrock, j'accède aux métriques par défaut de Bedrock, où je peux visualiser différentes mesures standard telles que la latence, le nombre de jetons par modèle, les requêtes ou le nombre d'erreurs.

Indicateurs AWS Bedrock
Étape 3 : Créer des filtres métriques pour les journaux
Outre la visualisation des métriques, il est également possible d'extraire des métriques à partir des données des journaux. Cela peut être réalisé en utilisant des filtres et en établissant un modèle. Veuillez suivre les étapes suivantes pour définir un modèle de filtre à partir d'une métrique :
- Veuillez vous rendre dans Journaux → Gestion des journaux.
- Veuillez sélectionner votre groupe de journaux et cliquer sur Actions → Créer un filtre métrique.
- Définissez un modèle de filtre (par exemple, [ERREUR] pour compter les erreurs).
- Veuillez attribuer un nom de métrique et un espace de noms.
- Veuillez tester le modèle et créer le filtre.

Création de filtres métriques
Cela génère automatiquement des métriques à partir de vos données de journalisation sans code supplémentaire.
Une fois que vous maîtrisez les indicateurs, l'étape suivante consiste à créer des tableaux de bord pour visualiser efficacement ces données.
Visualisation à l'aide de tableaux de bord personnalisés
Les tableaux de bord offrent une vue centralisée de vos indicateurs les plus importants. Voici comment créer des tableaux de bord efficaces pour différentes équipes.
Étape 1 : Veuillez créer un nouveau tableau de bord.
- Dans CloudWatch, veuillez vous rendre dans Dashboards dans le menu de gauche.
- Veuillez cliquer sur Créer un tableau de bord.
- Veuillez saisir un nom pour le tableau de bord (par exemple, « Tableau de bord des opérations de production »).
- Veuillez cliquer sur Créer un tableau de bord.
Vous serez ensuite redirigé vers la page « Ajouter un widget », où vous pourrez personnaliser le type de style du tableau de bord.

Widgets du tableau de bord
Étape 2 : Ajouter des widgets
La meilleure approche pour concevoir des widgets de tableau de bord consiste à les personnaliser en fonction des besoins de l'équipe. Voici ce que je recommande généralement pour certaines équipes courantes :
À l'attention des équipes opérationnelles :
- Ajouter des widgets de ligne indiquant l'utilisation du processeur et de la mémoire
- Ajouter des widgets numériques affichant les connexions actives actuelles
- Ajouter des widgets d'état d'alarme pour les services critiques
À l'attention des équipes financières :
- Ajouter des widgets de ligne pour suivre les frais estimés au fil du temps
- Ajouter des widgets numériques indiquant les coûts cumulés depuis le début du mois
- Ajouter des indicateurs à partir d'AWS Cost Explorer
À l'attention des équipes produit :
- Ajouter des indicateurs spécifiques à l'application (inscriptions d'utilisateurs, transactions)
- Ajouter des widgets d'informations sur les journaux pour les taux d'erreur
- Ajouter des indicateurs clés de performance personnalisés pour votre entreprise
Dans cette optique, vous pouvez les créer en suivant les étapes suivantes sur la console AWS :
- Veuillez cliquer sur « Ajouter un widget » dans votre tableau de bord.
- Veuillez sélectionner le type de widget : Ligne, nombre, jauge, barre, camembert, etc.
- Veuillez sélectionner l'espace de noms : Bedrock, Lamba, etc.
- Veuillez configurer le widget :
- Veuillez sélectionner les métriques à partir des espaces de noms disponibles.
- Définir la plage horaire et l'intervalle de rafraîchissement
- Personnaliser les couleurs et les étiquettes
- Veuillez cliquer sur Créer un widget.
Une fois ces étapes suivies, vous pourrez visualiser votre tableau de bord personnalisé avec les indicateurs sélectionnés. Si nécessaire, vous pouvez le modifier ou même le partager de manière privée ou publique.

Partage de tableaux de bord personnalisés
Surveillance des frais estimés
Outre les indicateurs de performance des applications et les tableaux de bord, il est également essentiel de contrôler les coûts, d'éviter les frais inutiles et d'optimiser l'ensemble du système. CloudWatch peut vous aider à suivre et à contrôler ces coûts avant qu'ils n'augmentent de manière significative. Voici comment configurer la surveillance de la facturation. surveillance de la facturation:
Étape 1 : Activer les indicateurs de facturation
- Veuillez accéder à la console de facturation et de gestion des coûts.
- Veuillez cliquer sur « Préférences de facturation » dans le menu de gauche.
- Activer les alertes de facturation
- Veuillez cliquer sur « Enregistrer les préférences ».

Activation des alertes de facturation CloudWatch
Veuillez noter que l'affichage des métriques de facturation dans CloudWatch peut prendre jusqu'à 15 minutes. Par conséquent, après avoir appliqué les paramètres et attendu ce délai, veuillez revenir à la console CloudWatch pour créer l'alarme de facturation.
Étape 2 : Créer une alerte de facturation
Maintenant que nous avons activé les métriques de facturation, nous pouvons créer une alerte de facturation CloudWatch en suivant les étapes suivantes :
- Revenez à CloudWatch → Alarmes → Toutes les alarmes
- Veuillez cliquer sur Créer une alarme.
- Veuillez sélectionner une mesure.
- Veuillez sélectionner Facturation (si vous ne voyez pas la métrique Facturation/Total des frais estimés, activez les alertes de facturation et modifiez votre région pour US East/N. Virginia).
- Veuillez sélectionner « Total Estimated Charge » (Coût total estimé), puis choisissez « Select metric » (Sélectionner la métrique).
- Veuillez préciser les indicateurs et les conditions. Ici, vous avez la possibilité de choisir entre les alertes liées aux coûts et la détection des anomalies de coûts.
- Configurer les actions : notifications, lambda, auto-scaling, EC2 et gestionnaire de système
- Veuillez ajouter les détails de l'alarme.
- Prévisualiser et créer

Mesures et conditions d'alarme
Une fois ces étapes effectuées, votre alerte de facturation sera configurée, et vos coûts ou anomalies (selon votre sélection) seront déclenchés, et vous en serez informé en conséquence.
Cependant, au-delà des métriques intégrées d'AWS, il est souvent nécessaire de suivre des métriques spécifiques à votre entreprise et à vos applications. Cela impliquerait la création et la publication de mesures personnalisées.
Publication de mesures personnalisées
Les métriques personnalisées vous permettent de surveiller les données spécifiques à l'application que AWS ne suit pas automatiquement. Vous pouvez publier vos propres métriques personnalisées à l'aide de l'interface CLI AWS ou d'une API. À titre d'exemple simple, permettez-moi de vous montrer comment procéder à l'aide de l'interface de ligne de commande AWS. AWS CLI.
La commande suivante vous permet de publier une métrique personnalisée de base :
aws cloudwatch put-metric-data \
--namespace "MyApplication" \
--metric-name "PageViews" \
--value 1452 \
--unit Count
Cependant, vous pouvez également définir des dimensions pour faciliter la catégorisation des mesures. Il est possible d'inclure jusqu'à 30 dimensions par métrique sous forme de paires clé/valeur.
aws cloudwatch put-metric-data \
--namespace "MyApplication" \
--metric-name "ResponseTime" \
--value 245 \
--unit Milliseconds \
--dimensions Environment=Production,Service=API
Ces métriques personnalisées apparaîtront dans la console AWS CloudWatch, et vous pourrez les ajouter à un tableau de bord nouveau ou existant.
Voici quelques-uns des cas d'utilisation les plus courants des métriques personnalisées que j'ai observés :
- Indicateurs commerciaux : Utilisateurs actifs quotidiens, taux de conversion, revenu par utilisateur
- Indicateurs clés de performance de l'application : Taux de réussite du cache, profondeur des files d'attente, types d'erreurs personnalisés
- Indicateurs de performance : Mesures de latence personnalisées, indicateurs de débit
- Indicateurs opérationnels : Délais d'exécution des tâches par lots, volume de traitement des données
Une fois ces techniques de surveillance fondamentales maîtrisées, vous serez parfaitement équipé pour gérer les opérations quotidiennes.
Fonctionnalités avancées d'IA d'AWS CloudWatch
Au-delà des fonctionnalités de base, CloudWatch propose des fonctionnalités de pointe qui le distinguent des outils de surveillance traditionnels. Ces fonctionnalités utilisent l'intelligence artificielle pour relever les défis uniques des architectures cloud modernes.
Opérer de manière intelligente avec AIOps
CloudWatch Investigations exploite l'IA générative pour automatiser l'analyse des causes profondes et fournir un dépannage guidé. Lorsque des incidents surviennent, les enquêtes établissent automatiquement des corrélations :
- Indicateurs : Données de performance illustrant les changements
- Journaux : Événements détaillés liés aux applications et au système
- Traces : Les requêtes transitent par des systèmes distribués.
- Modifications récentes : Déploiements et mises à jour de configuration
En plus d'identifier les problèmes, il génère un rapport d'incident qui transforme l'analyse post-incident. Un simple clic active la collecte complète de données afin de générer une documentation détaillée et contextuelle, éliminant ainsi la collecte manuelle de preuves.

Enquêtes CloudWatch
Afin d'éviter que les fausses alertes ne perturbent vos opérations, la détection des anomalies à l'aide de la reconnaissance de formes réduit la fatigue liée aux alertes en identifiant les anomalies réelles par rapport aux variations attendues. Vous pouvez configurer la détection des anomalies sur des indicateurs clés afin que CloudWatch apprenne les modèles normaux et n'émette des alertes qu'en cas d'écarts statistiquement significatifs.
Surveillance des flux de travail de l'IA générative
Les applications d'IA générative introduisent de nouvelles exigences en matière de surveillance. CloudWatch permet aux développeurs d'analyser les données télémétriques de tous les composants des applications d'IA :
- Modèles d'exécution de code dans les outils intégrés
- Taux de réussite des transformations API via Amazon API Gateways
- Modèles de stockage et de récupération de la mémoire
- Utilisation des jetons et coûts liés aux invocations de modèles
- Suivi de la latence pour les délais de réponse
Pour les organisations qui surveillent les applications d'IA telles qu'Amazon Bedrock AgentCore, CloudWatch fournit des tableaux de bord intégrés spécialement conçus pour l'observabilité GenAI, avec une compatibilité étendue aux frameworks open source tels que Strands, CrewAIet LangGraph.
Cela nous permet de comprendre le parcours complet de l'utilisateur, en couvrant les métriques liées à l'invocation, à la mémoire, aux passerelles ou aux invites, qui retracent le flux des requêtes à travers les applications d'IA. Cette visibilité optimise les performances des applications d'IA et identifie les goulots d'étranglement dans les flux de travail complexes des agents.
Conclusion
CloudWatch a évolué d'un service de métriques de base à une plateforme d'observabilité complète, essentielle pour les opérations cloud modernes. La force de la plateforme réside dans son intégration approfondie, son analyse automatisée et sa capacité à passer d'une simple surveillance à une intelligence opérationnelle alimentée par l'IA.
Je vous encourage à explorer CloudWatch de manière systématique, en commençant par les métriques et les alarmes de base, puis en adoptant des fonctionnalités avancées à mesure que vos besoins évoluent. La documentation AWS CloudWatch et le cadre Well-Architected fournissent des conseils détaillés.
Une surveillance efficace consiste à obtenir des informations qui améliorent la fiabilité, les performances et l'expérience utilisateur. CloudWatch fournit tous les outils nécessaires pour y parvenir et créer des systèmes plus performants et plus résilients.
Si vous souhaitez obtenir la certification AWS, je vous recommande de suivre notre parcours de compétences AWS Cloud Practitioner , qui couvre tout ce dont vous avez besoin pour obtenir la certification CLF-C02 d'Amazon.
FAQ sur AWS CloudWatch
Comment puis-je utiliser CloudWatch pour surveiller les performances de mes fonctions AWS Lambda ?
CloudWatch collecte automatiquement les métriques Lambda telles que le nombre d'invocations, la durée, les erreurs et les limitations, sans frais supplémentaires. Veuillez vous rendre dans CloudWatch → Metrics → Lambda pour consulter ces métriques. Pour plus d'informations, veuillez activer CloudWatch Lambda Insights afin de collecter des métriques au niveau du système (CPU, mémoire, réseau) et créer des tableaux de bord personnalisés. Vous pouvez configurer des alertes sur des indicateurs tels que les taux d'erreur ou la durée afin d'être averti en cas de baisse des performances.
Quelle est la différence entre les classes de journaux CloudWatch Logs Standard et Infrequent Access ?
CloudWatch Logs Standard est conçu pour la surveillance en temps réel et les requêtes fréquentes, avec des coûts de stockage plus élevés, mais un accès complet aux fonctionnalités. Logs Infrequent Access (Logs-IA) réduit de 50 % les coûts d'ingestion (environ 0,25 $/Go contre 0,50 $/Go) pour les journaux que vous devez conserver mais que vous consultez rarement, ce qui le rend idéal pour les journaux de conformité et la conservation à long terme. Les deux prennent en charge le chiffrement, l'analyse inter-comptes et les mêmes capacités d'ingestion. Cependant, Logs-IA ne prend pas en charge les filtres métriques.
Comment puis-je configurer une alerte CloudWatch basée sur un filtre de métrique de journal ?
Tout d'abord, veuillez vous assurer que vous utilisez un groupe de journaux de classe standard, car les filtres métriques ne sont pas disponibles sur les journaux à accès peu fréquent. Ensuite, créez un filtre métrique : accédez à CloudWatch → Gestion des journaux → sélectionnez votre groupe de journaux → Créer un filtre métrique → définissez un modèle (tel que « [ERROR] ») → attribuez un nom de métrique. Veuillez ensuite créer une alarme : accédez à Alarmes → Créer une alarme → sélectionnez votre métrique personnalisée → définissez le seuil → configurez les notifications SNS. Par exemple, vous pourriez être alerté lorsque le nombre d'erreurs dépasse 10 en 5 minutes.
Amazon CloudWatch peut-il m'aider à identifier et à résoudre les problèmes dans mes applications conteneurisées ?
Oui, CloudWatch Container Insights offre une surveillance complète pour ECS, EKS et Fargate. Il collecte automatiquement des mesures telles que celles relatives au processeur, à la mémoire, au disque et au réseau au niveau du cluster, du service et des tâches. En combinaison avec CloudWatch Application Signals pour le traçage distribué et l'intégration X-Ray, vous pouvez identifier les goulots d'étranglement en matière de performances, suivre les flux de requêtes à travers les microservices et corréler les métriques avec les journaux pour un dépannage plus rapide.
Quel est le coût d'Amazon CloudWatch et comment puis-je contrôler les dépenses ?
CloudWatch propose une tarification à l'utilisation avec une offre gratuite généreuse (10 métriques personnalisées, 5 Go de journaux, 3 tableaux de bord). En outre, les métriques personnalisées coûtent environ 0,30 $ chacune, et l'ingestion des journaux coûte entre 0,25 $ et 0,50 $ par Go. Afin de contrôler les coûts, veuillez utiliser la publication sélective des métriques (suivre uniquement les métriques critiques), mettre en œuvre des politiques de conservation des journaux conformes aux exigences de conformité et utiliser Logs Infrequent Access pour les journaux rarement consultés.
En tant que fondateur de Martin Data Solutions et Data Scientist freelance, ingénieur ML et AI, j'apporte un portefeuille diversifié en régression, classification, NLP, LLM, RAG, réseaux neuronaux, méthodes d'ensemble et vision par ordinateur.
- A développé avec succès plusieurs projets de ML de bout en bout, y compris le nettoyage des données, l'analyse, la modélisation et le déploiement sur AWS et GCP, en fournissant des solutions impactantes et évolutives.
- Création d'applications web interactives et évolutives à l'aide de Streamlit et Gradio pour divers cas d'utilisation dans l'industrie.
- Enseigne et encadre des étudiants en science des données et en analyse, en favorisant leur développement professionnel par le biais d'approches d'apprentissage personnalisées.
- Conception du contenu des cours pour les applications de génération augmentée par récupération (RAG) adaptées aux exigences de l'entreprise.
- Rédaction de blogs techniques à fort impact sur l'IA et le ML, couvrant des sujets tels que les MLOps, les bases de données vectorielles et les LLM, avec un engagement significatif.
Dans chaque projet que je prends en charge, je m'assure d'appliquer des pratiques actualisées en matière d'ingénierie logicielle et de DevOps, comme le CI/CD, le linting de code, le formatage, la surveillance des modèles, le suivi des expériences et la gestion robuste des erreurs. Je m'engage à fournir des solutions complètes, en transformant les connaissances sur les données en stratégies pratiques qui aident les entreprises à se développer et à tirer le meilleur parti de la science des données, de l'apprentissage automatique et de l'IA.
