Lernpfad
In den Jahren, in denen ich mit AWS habe ich gemerkt, dass der Überblick über deine Cloud-Ressourcen den Unterschied zwischen proaktiver Problemlösung und reaktiver Brandbekämpfung ausmacht.
Amazon CloudWatch macht genau das: Es ist sozusagen das zentrale Nervensystem deiner AWS-Umgebung und bietet umfassende Überwachung, Protokollierung und Beobachtbarkeit für deine ganze Infrastruktur.
Ich zeig dir mal, was CloudWatch alles kann, von der einfachen Überwachung von Metriken bis hin zu fortgeschrittenen KI-gestützten Vorgängen. Am Ende dieses Tutorials wirst du wissen, wie du CloudWatch nutzen kannst, um deine AWS-Ressourcen effektiv zu überwachen, Kosten zu optimieren und Probleme zu lösen, bevor sie sich auf deine Nutzer auswirken.
Wenn du neu bei AWS bist, empfehle ich dir, unseren Kurs „AWS Cloud-Technologie und -Services” zu machen.
Was ist AWS CloudWatch?
Bevor wir uns mit den praktischen Sachen beschäftigen, lass uns erst mal schauen, was CloudWatch ist und wie es ins AWS-Ökosystem passt.
CloudWatch ist die einheitliche Observability-Plattform von AWS, die Daten aus deinen Cloud-Ressourcen und Anwendungen sammelt, überwacht und analysiert. Mit dem Service kannst du deinen kompletten Stack überwachen, also Anwendungen, Infrastruktur, Netzwerk und Dienste, und anhand von Alarmen, Protokollen und Ereignisdaten automatisierte Maßnahmen ergreifen.
Die Plattform läuft in AWS-nativen Umgebungen und hybriden Szenarien und unterstützt Workloads über AWS, andere Cloud-Anbieter und lokale Rechenzentren hinweg. Der CloudWatch Agent sammelt Telemetriedaten aus jeder Umgebung und bietet so eine zentrale Übersicht für alle Überwachungsanforderungen.

AWS Cloudwatch
Was CloudWatch so besonders macht, ist, wie gut es in AWS integriert ist. Jeder wichtige AWS-Dienst schickt automatisch Metriken an CloudWatch:
- Computerdienste: EC2, Lambda, ECS und EKS
- Datenbankdienste: RDS, DynamoDB und Aurora
- Speicherdienste: S3, EBS und EFS
- Netzwerkdienste: VPC, CloudFront und Route 53
Dank dieser nativen Integration kannst du sofort mit der Überwachung loslegen, ohne dich mit komplizierten Einstellungen rumschlagen zu müssen. Jetzt, wo du weißt, was CloudWatch ist, schauen wir uns mal an, was die Nutzung dieses coolen Dienstes kostet.
Preise für AWS CloudWatch
Bevor du CloudWatch in deiner Infrastruktur einsetzt, solltest du unbedingt wissen, wie viel es kostet. Lass mich das Preismodell und Strategien vorstellen, mit denen du die Kosten im Griff behältst.
AWS CloudWatch – Kostenlose Nutzung und Preise
Der Service läuft auf Pay-as-you-go-Basis, ohne dass man sich vorher festlegen muss. Die meisten AWS-Services schicken Metriken automatisch und kostenlos an CloudWatch.
Die kostenlose Version hat echt großzügige Kontingente, die die grundlegenden Überwachungsanforderungen abdecken:
- 10 benutzerdefinierte Metriken und unbegrenzte grundlegende Überwachungsmetriken
- 10 Warnmeldungen für Metriken mit Standardauflösung
- 1 Million API-Anfragen pro Monat
- 5 GB Logdaten-Erfassung und -Speicherung
- 3 Dashboards mit jeweils bis zu 50 Metriken
- 100 Kanarienvogel-Läufe pro Monat für Synthetics
Nach dem kostenlosen Kontingent kosten benutzerdefinierte Metriken ungefähr 0,30 $ pro Metrik für die ersten 10.000 Metriken, wobei mit steigender Nutzung Mengenrabatte gelten. Für Dashboards wird 3 $ pro Dashboard und Monat berechnet.
Die Log-Erfassung kostet in den Regionen im Osten der USA normalerweise 0,50 $ pro GB (die Preise variieren je nach Region), nachdem die kostenlose Stufe aufgebraucht ist. Dieser Preis gilt nur für die ersten 10 TB pro Monat; danach wird der Preis nach und nach günstiger.
Seltener Zugriff Infrequent Access reduziert die Erfassungskosten um 50 % auf 0,25 $ pro GB in den Regionen im Osten der USA. Eine Einschränkung, die man beachten sollte, ist, dass sie keine metrischen Filter unterstützen, die nur mit Standardprotokollen funktionieren. Allerdings unterstützt Logs-IA keine Funktionen wie Metrikfilter.
Hier ist ein kurzer Überblick über die wichtigsten Preisbestandteile über diekostenlose Stufe hinaus:
|
Feature |
Preise (Ostküste der USA) |
|
Benutzerdefinierte Metriken (die ersten 10.000) |
0,30 $ pro Monat |
|
Protokollaufnahme |
0,50 $ pro GB / 0,25 $ pro GB (seltener Zugriff) |
|
Holzlagerung |
0,03 $ pro GB/Monat |
|
Standard-Dashboards |
3,00 $ pro Dashboard/Monat |
|
Standardalarme |
0,10 $ pro Alarm/Monat |
Strategien zum Kostenmanagement in AWS CloudWatch
Durch meine Erfahrung mit der Optimierung der CloudWatch-Kosten habe ich ein paar effektive Strategien gefunden:
- Selektive Veröffentlichung von Metriken: Sei clever mit deinen eigenen Kennzahlen. Jede Metrik, die du veröffentlichst, kostet Geld. Konzentriere dich also lieber auf geschäftskritische Messungen, anstatt alles Mögliche zu überwachen. Nutze Metrikfilter, um Erkenntnisse aus Protokollen zu gewinnen, anstatt, wenn möglich, separate benutzerdefinierte Metriken zu erstellen.
- Optimier die Protokollspeicherung: Setz Aufbewahrungsrichtlinien um, die deinen Compliance-Anforderungen entsprechen. CloudWatch Logs Infrequent Access ist eine günstige Option für Logs, die du behalten musst, aber kaum abfragst. Normalerweise mache ich das so:
- 7 Tage Aufbewahrung für Debug-Protokolle
- 30 Tage für Anwendungsprotokolle
- Über 90 Tage für Audit-Protokolle, die die Einhaltung von Vorschriften erfordern
- Überwachungsintervalle richtig einstellen: Denk mal darüber nach, detaillierte Überwachung nur für Ressourcen zu nutzen, die eine Granularität von weniger als einer Minute brauchen. Für die meisten Aufgaben reicht eine einfache Überwachung alle 5 Minuten völlig aus und spart auch noch Geld.
- Minimier die Datenübertragung: Benutz lieber CloudWatch Logs Insights, statt Logs unnötig an externe Tools zu streamen, weil die Kosten für die Datenübertragung schnell steigen können.

Wenn du mehr darüber erfahren möchtest, wie du die AWS-Preisstruktur zu deinem Vorteil nutzen und deine Ressourcen schützen kannst, empfehle ich dir unseren Kurs „AWS Security and Cost Management” zu machen.
Die wichtigsten Funktionen von AWS CloudWatch
CloudWatch hat eine ganze Reihe von Überwachungstools, die zusammenarbeiten, um dir einen kompletten Überblick über deine AWS-Umgebung zu geben. Schauen wir uns mal die wichtigsten Funktionen an, die du am häufigsten nutzen wirst.
Echtzeitüberwachung mit Metriken, Dashboards und Alarmen
Metriken sind das A und O der CloudWatch-Überwachung. CloudWatch gibt dir einen Überblick über Metriken mit einer Genauigkeit von bis zu einer Sekunde, speichert Daten für einen Tag bis unbegrenzt und kann Berechnungen durchführen. Diese detaillierte Übersicht macht es möglich, die Kapazitätsplanung in Echtzeit zu überwachen und historische Analysen durchzuführen.
Du kannst Dashboards erstellen, die auf die Bedürfnisse der verschiedenen Interessengruppen zugeschnitten sind. Die Teams im operativen Bereich brauchen Echtzeit-Infos zur Ressourcennutzung, während die Finanzteams von der Kostenverfolgung profitieren. CloudWatch hat Dashboards, die mehrere Konten abdecken, was eine zentrale Überwachung für Architekturen mit mehreren Konten ermöglicht.
Alarme geben dir einen Hinweis, wenn Messwerte bestimmte Schwellenwerte überschreiten. Ich richte Alarme mit Amazon SNS ein, um Benachrichtigungen zu schicken oder automatische Korrekturen über Lambda-Funktionen. Wenn zum Beispiel die CPU-Auslastung 5 Minuten lang über 80 % liegt, kann ein Alarm automatisch Auto Scaling auslösen.
Als Nächstes schauen wir uns an, wie CloudWatch über grundlegende Metriken hinausgeht und umfassende Anwendungs- und Container-Observability bietet.
Anwendungs- und Container-Beobachtbarkeit
Für moderne Anwendungen bietet CloudWatch Application Signals eine sofort einsatzbereite Übersicht über Latenz, Fehler und Leistung bei KI-Workloads. Es bietet auch automatische Instrumentierung, wodurch manuelle Codeänderungen wegfallen und die Erstellung und Überwachung von Service-Level-Ziele (SLOs).
Bei containerisierten Umgebungen sammelt CloudWatch Container Insights Informationen zur Rechenauslastung von containerisierten Anwendungen. Container Insights unterstützt:
- Amazon ECS: Metriken auf Cluster-, Aufgaben- und Serviceebene
- Amazon EKS: Sichtbarkeit auf Cluster-, Knoten- und Pod-Ebene
- AWS Fargate: Volle Beobachtbarkeit für serverlose Container
- Selbstverwaltetes Kubernetes: Unterstützung vor Ort und hybride Unterstützung
Diese Beobachtungsfunktionen erzeugen eine Menge Daten, die man gut verwalten muss. Um die Containerdienste von AWS zu vergleichen, schau dir unseren Vergleich von ECS und EKS.
Protokollverwaltung und -analyse
Schauen wir uns als Nächstes die Log-Management-Funktionen von CloudWatch an.
Für die zentrale Speicherung von Protokollen zentralisiert CloudWatch Logs zentralisiert die Protokollverwaltung von AWS-Diensten, Anwendungen und lokalen Ressourcen. Ich sortiere die Protokolle in Gruppen, die verschiedene Anwendungen abdecken, wobei die Protokollströme einzelne Quellen erfassen. Aufbewahrungsrichtlinien bringen die Compliance-Anforderungen und die Speicherkosten unter einen Hut.
Wenn du diese Protokolldaten analysieren musst, bietet CloudWatch Logs Insights eine leistungsstarke Abfragesprache für die Analyse von Protokolldaten. Ich nutze die SQL-ähnliche Syntax, um schnell:
- Fehlermuster erkennen
- Bestimmte Benutzersitzungen verfolgen
- Aggregierte Metriken aus unstrukturierten Daten
Für Sicherheitsüberprüfungen arbeitet CloudWatch mit CloudTrail zusammen, um alle API-Aufrufe zu erfassen und zu analysieren.

Die Log-Verwaltung geht jetzt noch weiter: Mit den neuen Funktionen für einheitliches Datenmanagement kannst du Logs aus verschiedenen AWS-Konten und -Regionen sammeln und zusammenfassen. Es macht komplexe ETL-Pipelines und mehrere Datenspeicher überflüssig, was für global verteilte Teams echt revolutionär ist.
Neben der Überwachung des Backends ist es genauso wichtig, die tatsächliche Benutzererfahrung zu verstehen. Hier kommen die Überwachungsfunktionen von CloudWatch für Endnutzer ins Spiel.
Endbenutzer- und synthetische Überwachung
Um zu erfassen, wie echte Benutzer Ihre Anwendungen erleben, CloudWatch RUM (Real User Monitoring) die tatsächlichen Nutzererfahrungsdaten von Webanwendungen. Ich nutze RUM, um die Leistung von Apps aus der Sicht der Nutzer zu checken, indem ich die Ladezeiten von Seiten, JavaScript-Fehler und das Nutzerverhalten im Auge behalte.
Für Tests, bevor die Nutzer Probleme haben, ergänzt CloudWatch Synthetics RUM, indem es proaktiv die Endpunkte von Anwendungen testet. Du kannst Canaries (Skripte, die Benutzerinteraktionen simulieren) erstellen, um die Verfügbarkeit ständig im Auge zu behalten. Diese Tests laufen nach einem festen Zeitplan ab und zeigen Probleme an, bevor echte Nutzer drauf stoßen.
Während RUM und Synthetics nur oberflächliche Überwachung bieten, braucht man einen tieferen Einblick, um zu verstehen, was in deinen verteilten Anwendungen wirklich abläuft. Da kommt verteiltes Tracing ins Spiel.
Verteiltes Tracing mit AWS X-Ray
Für vollständige Transparenz bei Anfragen AWS X-Ray die Integration von AWS X-Ray, die verteiltes Tracing ermöglicht und den Ablauf von Anfragen durch Microservice-Architekturen zeigt. Die Trace-Karte zeigt Serviceabhängigkeiten und zeigt, wo es zu Verzögerungen kommt. Ich nutze X-Ray, um Latenzengpässe zu finden und Serviceabhängigkeiten zu verstehen.

Um Leistungsmuster und Engpässe zu erkennen, Contributor Insights hochkardinalitäre Daten, um die wichtigsten Faktoren für das Systemverhalten zu ermitteln. Wenn du Fehler untersuchst, zeigt es dir, welche Endpunkte, Benutzer oder Ressourcen die meisten Probleme verursachen.
Diese Überwachungsfunktionen werden noch viel leistungsfähiger, wenn man sie mit den Automatisierungsdiensten von AWS zusammenbringt. Jetzt wird's spannend.
AWS-Integrationen und automatische Antworten
Die Leistungsfähigkeit von CloudWatch wird durch die Integration mit anderen AWS-Diensten noch verstärkt. Für die ereignisgesteuerte Automatisierung schnappt sich Amazon EventBridge CloudWatch-Alarme und -Ereignisse und sorgt für automatische Reaktionen. Du kannst Workflows erstellen, bei denen CloudWatch-Alarme EventBridge-Regeln auslösen, die Lambda-Funktionen für folgende Zwecke aufrufen:
- Nicht funktionierende Dienste automatisch neu starten
- Ressourcen je nach Bedarf skalieren
- Schnappschüsse vor der Sanierung machen
- Teams über verschiedene Kanäle informieren
Für komplizierte Arbeitsabläufe kann man mit Systems Manager automatisierte Vorgänge einrichten. CloudWatch-Alarme können Systems Manager Automation-Dokumente auslösen, die komplexe Abhilfemaßnahmen über mehrere Ressourcen hinweg ausführen.
Nachdem wir uns die Funktionen von CloudWatch angesehen haben, lass uns darüber reden, warum die Implementierung dieser Plattform für dein Unternehmen wichtig ist.
Anwendungsfälle für AWS CloudWatch
Die Funktionen von CloudWatch zu verstehen ist eine Sache, aber zu sehen, wie sie sich in echten Geschäftswert umsetzen lassen, ist das, was wirklich zählt. Hier ist der Grund, warum Unternehmen aus allen Branchen bei ihren Abläufen auf CloudWatch setzen.
Betriebliche Transparenz und Leistungsüberwachung
CloudWatch gibt dir einen zentralen Überblick über alle AWS-Ressourcen. Ich finde es echt super, dass man EC2-Instanzen, Lambda-Funktionen, Datenbankabfragen und anwendungsspezifische Metriken über eine einzige Oberfläche überwachen kann. So kann man schnell Zusammenhänge zwischen dem Verhalten der Infrastruktur und der Anwendungsleistung erkennen.
Die Plattform verkürzt die durchschnittliche Zeit bis zur Lösung durch umfassende Datenerfassung. Wenn ich Vorfälle untersuche, kann ich Metriken, Protokolle und Traces zusammen anschauen und so nicht nur sehen, dass ein Problem aufgetreten ist, sondern auch verstehen, warum es passiert ist.
CloudWatch ist nicht nur für die Betriebsübersicht wichtig, sondern auch super wichtig, um die Compliance zu halten und bei forensischen Untersuchungen zu helfen.
Protokollbasierte Compliance und Fehlerbehebung
Für regulierte Branchen ist CloudWatch der zentrale Ort für Audit-Trails und Compliance-Protokolle. Ich stelle die Aufbewahrungsfristen für Protokolle so ein, dass sie den gesetzlichen Anforderungen entsprechen. Die Integration von CloudWatch mit CloudTrail erfasst alle API-Aktivitäten und liefert so komplette Prüfpfade für Sicherheitsuntersuchungen.
Bei der Reaktion auf Vorfälle sind Protokolle die wichtigste Quelle für die Ursachenanalyse. CloudWatch Logs Insights macht es möglich, schnell Terabytes an Log-Daten abzufragen, um Fehlermuster zu erkennen und das Systemverhalten zu analysieren, das zu Vorfällen führt.
Compliance und Fehlerbehebungsfunktionen bringen natürlich noch einen weiteren wichtigen Vorteil mit sich: die Kostenoptimierung.
Kostenoptimierung und Abrechnungskontrolle
Die Abrechnungsmetriken von CloudWatch machen ein proaktives Kostenmanagement möglich. Ich richte Alarmmeldungen für geschätzte Kosten ein, um unerwartete Erhöhungen sofort zu erkennen. So kann ich die Kosten schnell überprüfen und Maßnahmen ergreifen.
Einblicke in die Leistung helfen auch dabei, die Kosten zu optimieren. Durch die Analyse der Ressourcenauslastung finde ich überdimensionierte Ressourcen, die man besser anpassen kann, und verstehe, wo es Engpässe bei den Anwendungen gibt, die die benötigten Ressourcen reduzieren.
Skalierbarkeit für Hybrid- und Multi-Cloud-Umgebungen
CloudWatch geht über AWS hinaus und überwacht auch Hybrid- und Multi-Cloud-Umgebungen, was Unternehmen mit unterschiedlichen Infrastrukturen hilft. Mit dem CloudWatch Agent kannst du zum Beispiel Metriken von lokalen Servern sammeln und so eine einheitliche Beobachtbarkeit bieten, egal wo die Workloads laufen.
Meiner Erfahrung nach ist das bei Cloud-Migrationen echt super hilfreich. Ich kann die Leistung zwischen verschiedenen Umgebungen mit denselben Tools vergleichen und so sicherstellen, dass bei Migrationen keine Rückschritte passieren.
Für alle, die sich fragen, wie diese Funktionen im Vergleich zu Amazons CloudTrail-Service abschneiden, empfehlen wir unseren Vergleichsartikel zu AWS CloudTrail versus AWS CloudWatch.
CloudWatch einrichten
Bist du bereit, mit CloudWatch loszulegen? Die Einrichtung ist echt einfach, und ich zeig dir alles, was du brauchst, um mit der Überwachung deiner Infrastruktur loszulegen.
Was du brauchen solltest
Bevor du mit der CloudWatch-Implementierung anfängst, solltest du sicherstellen, dass du die folgenden Voraussetzungen erfüllst:
- AWS-Konto mit den richtigen IAM-Berechtigungen
- AWS CLI installiert und mit Anmeldedaten eingerichtet
- CloudWatchFullAccess -Richtlinie für die Ersteinrichtung
- Internetverbindung oder VPC-Endpunkte für EC2-Instanzen
- Ausgehender HTTPS-Zugriff für lokale Server
Für die Produktion empfehle ich spezielle IAM-Rollen, die nach dem Prinzip der geringsten Rechte funktionieren, statt einfach nur langfristigen Vollzugriff zu geben.
Wenn du schon ein Konto hast, aber Hilfe bei den Terminalbefehlen brauchst, schau dir unser Tutorial zum Thema „Verwendung der AWS CLI“ führt dich durch die Befehlszeile selbst.
Jetzt, wo wir die Voraussetzungen geklärt haben, lass uns mit der Ersteinrichtung loslegen.
Zugriff auf CloudWatch
Geh über die AWS Management Console zu CloudWatch, indem du zum CloudWatch-Dienst gehst. Die Hauptansicht zeigt dir sofort alle Befehle, Optionen und Integrationen.

AWS CloudWatch
Du kannst zum Beispiel die Protokolle deiner laufenden Dienste unter „Log Management“ (Protokollverwaltung)anschauen . Das ist wahrscheinlich eine der am häufigsten verwendeten Visualisierungen, weil wir damit die Protokolle der Anwendungen checken und Debugging machen können, wenn irgendwas nicht so läuft, wie es soll.

Protokollverwaltung
Cloud-Überwachung mit AWS CloudWatch
Jetzt, wo du weißt, wie du auf CloudWatch zugreifen kannst, schauen wir uns die praktischen Abläufe an, die du jeden Tag nutzen wirst, um deine Ressourcen effektiv zu überwachen. Ich zeig dir die wichtigsten Überwachungstechniken, die du bald im Schlaf beherrschst.
Überwachung mit Metriken
Das Anzeigen von Metriken geht in der CloudWatch Metrics-Konsole los. So fängst du an:
Schritt 1: Auf CloudWatch-Metriken zugreifen
- Öffne die AWS Management Console und geh zu CloudWatch.
- Klick im linken Navigationsbereich auf „Metriken “ → „Alle Metriken“.
- Du siehst eine Liste der verfügbaren Service-Namespaces (AWS/Bedrock, AWS/EC2, AWS/Lambda usw.).

CloudWatch-Metriken-Dashboard
Schritt 2: Metriken auswählen und visualisieren
Wie du auf dem Bild oben sehen kannst, kannst du unter „Alle Metriken“ auf die verschiedenen Dienste zugreifen. Um loszulegen, kannst du auf einen beliebigen Dienst klicken und das automatische Dashboard aufrufen. Wenn ich zum Beispiel auf mein Bedrock-Dashboard klicke, lande ich bei den Standardmetriken von Bedrock, wo ich verschiedene Standardmessungen wie Latenz, Tokenanzahl nach Modell, Anfragen oder Fehleranzahl sehen kann.

AWS Bedrock-Metriken
Schritt 3: Erstell Metrikfilter für Protokolle
Neben der Visualisierung der Metriken kann man auch Metriken aus Protokolldaten extrahieren. Das geht mit Filtern und indem man ein Muster festlegt. Mach einfach die folgenden Schritte, um ein Filtermuster aus einer Metrik zu definieren:
- Geh zu Protokolle → Protokollverwaltung
- Wähle deine Protokollgruppe aus und klicke auf „Aktionen“ → „Metrikfilter erstellen“.
- Lass uns ein Filtermuster festlegen (z. B. [ERROR], um Fehler zu zählen).
- Gib einen Metriknamen und einen Namespace an.
- Teste das Muster und erstelle den Filter.

Metrikfilter erstellen
Das macht automatisch Metriken aus deinen Logdaten, ohne dass du extra Code schreiben musst.
Sobald du mit den Kennzahlen vertraut bist, geht's weiter mit dem Erstellen von Dashboards, um diese Daten gut darzustellen.
Visualisieren mit benutzerdefinierten Dashboards
Dashboards bieten dir einen zentralen Überblick über deine wichtigsten Kennzahlen. Hier erfährst du, wie du effektive Dashboards für verschiedene Teams erstellen kannst.
Schritt 1: Mach ein neues Dashboard
- Geh in CloudWatch im linken Menü zu „Dashboards “.
- Klick auf „Dashboard erstellen“
- Gib einen Namen für das Dashboard ein (z. B. „Produktions-Betriebs-Dashboard“).
- Klick auf „Dashboard erstellen“
Danach kommst du auf die Seite „Widget hinzufügen“, wo du den Stil des Dashboards anpassen kannst.

Dashboard-Widgets
Schritt 2: Widgets hinzufügen
Der beste Weg, um Dashboard-Widgets zu gestalten, ist, sie nach den Bedürfnissen des Teams anzupassen. Das empfehle ich normalerweise für einige gängige Teams:
Für die Teams im operativen Bereich:
- Füge Widgets hinzu, die die CPU- und Speicherauslastung anzeigen
- Füge Widgets hinzu, die die aktuell aktiven Verbindungen anzeigen
- Widgets für den Alarmstatus wichtiger Dienste hinzufügen
Für Finanzteams:
- Füge Linien-Widgets hinzu, die die geschätzten Kosten im Laufe der Zeit verfolgen
- Füge Zahlen-Widgets hinzu, die die Kosten seit Monatsbeginn anzeigen.
- Metriken aus AWS Cost Explorer hinzufügen
Für Produktteams:
- Füge anwendungsspezifische Metriken hinzu (Benutzeranmeldungen, Transaktionen)
- Füge Log-Insights-Widgets für Fehlerquoten hinzu
- Benutzerdefinierte geschäftliche KPIs hinzufügen
In diesem Sinne kannst du sie erstellen, indem du die folgenden Schritte in der AWS-Konsole machst:
- Klick in deinem Dashboard auf „Widget hinzufügen“
- Wähle den Widget-Typ aus: Linie, Zahl, Messgerät, Balken, Kreisdiagramm usw.
- Wähle den Namespace aus: Bedrock, Lamba, etc.
- Das Widget einrichten:
- Wähle Metriken aus den verfügbaren Namespaces aus.
- Zeitbereich und Aktualisierungsintervall einstellen
- Farben und Beschriftungen anpassen
- Klick auf „Widget erstellen“
Wenn du diese Schritte gemacht hast, kannst du dein individuelles Dashboard mit den ausgewählten Kennzahlen anzeigen. Wenn du willst, kannst du es ändern oder sogar privat oder öffentlich teilen.

Benutzerdefinierte Dashboards teilen
Überwachung der geschätzten Gebühren
Neben Anwendungsmetriken und Dashboards ist es auch wichtig, die Kosten im Griff zu haben, unnötige Ausgaben zu vermeiden und das ganze System zu optimieren. Mit CloudWatch kannst du diese Kosten im Blick behalten und kontrollieren, bevor sie aus dem Ruder laufen. So richtest du die Rechnungsüberwachung ein die Rechnungsüberwachung:
Schritt 1: Aktiviere Abrechnungsmetriken
- Geh zur Konsole für Abrechnung und Kostenmanagement.
- Klick im linken Menü auf „Abrechnungseinstellungen “.
- Rechnungsbenachrichtigungen aktivieren
- Klick auf „Einstellungen speichern“

CloudWatch-Abrechnungsbenachrichtigungen aktivieren
Beachte, dass es bis zu 15 Minuten dauern kann, bis die Abrechnungsmetriken in CloudWatch angezeigt werden. Geh also nach dem Anwenden der Einstellungen und dem Abwarten dieser Zeit zurück zur CloudWatch-Konsole, um den Abrechnungsalarm zu erstellen.
Schritt 2: Erstelle einen Rechnungsalarm
Jetzt, wo wir die Abrechnungsmetriken aktiviert haben, können wir einen CloudWatch-Abrechnungsalarm erstellen, indem wir diese Schritte befolgen:
- Zurück zu CloudWatch → Alarme → Alle Alarme
- Klick auf „Alarm erstellen“
- Metrik auswählen
- Wähle „Abrechnung“ (Wenn du die Metrik „Abrechnung/Geschätzte Gesamtkosten“ nicht siehst, aktiviere die Abrechnungsbenachrichtigungen und ändere deine Region zu „US East/N“. Virginia).
- Wähle „Gesamte geschätzte Kosten“ und dann „Metrik auswählen“.
- Gib Metriken und Bedingungen an. Hier kannst du zwischen kostenbezogenen Alarmen und der Erkennung von Kostenabweichungen wählen.
- Aktionen einrichten: Benachrichtigungen, Lambda, automatische Skalierung, EC2 und System Manager
- Alarmdetails hinzufügen
- Vorschau und erstellen

Alarmmetriken und -bedingungen
Nach diesen Schritten ist dein Rechnungsalarm eingerichtet, und deine Kosten oder Unregelmäßigkeiten (je nachdem, was du ausgewählt hast) werden gemeldet, und du wirst entsprechend benachrichtigt.
Aber neben den integrierten Metriken von AWS musst du oft auch Metriken verfolgen, die speziell für dein Unternehmen und deine Anwendungen wichtig sind. Das würde bedeuten, dass man eigene Metriken erstellen und veröffentlichen muss.
Benutzerdefinierte Metriken veröffentlichen
Mit benutzerdefinierten Metriken kannst du anwendungsspezifische Daten überwachen, die AWS nicht automatisch verfolgt. Du kannst deine eigenen benutzerdefinierten Metriken über die AWS-Befehlszeilenschnittstelle oder eine API veröffentlichen. Als einfaches Beispiel zeig ich dir, wie du das mit der AWS CLI.
Mit dem folgenden Befehl kannst du eine einfache benutzerdefinierte Metrik veröffentlichen:
aws cloudwatch put-metric-data \
--namespace "MyApplication" \
--metric-name "PageViews" \
--value 1452 \
--unit Count
Du kannst aber auch Dimensionen festlegen, um Metriken besser zu kategorisieren. Man kann bis zu 30 Dimensionen pro Metrik als Schlüssel/Wert-Paare einfügen.
aws cloudwatch put-metric-data \
--namespace "MyApplication" \
--metric-name "ResponseTime" \
--value 245 \
--unit Milliseconds \
--dimensions Environment=Production,Service=API
Diese benutzerdefinierten Metriken werden in der AWS CloudWatch-Konsole angezeigt und du kannst sie zu einem neuen oder bestehenden Dashboard hinzufügen.
Ein paar der häufigsten Anwendungsfälle für benutzerdefinierte Metriken, die ich gesehen habe, sind:
- Geschäftskennzahlen: Täglich aktive Nutzer, Konversionsraten, Umsatz pro Nutzer
- Anwendungs-KPIs: Cache-Trefferquoten, Warteschlangentiefen, benutzerdefinierte Fehlertypen
- Leistungsindikatoren: Benutzerdefinierte Latenzmessungen, Durchsatzmetriken
- Betriebliche Kennzahlen: Fertigstellungszeiten von Batch-Jobs, Datenverarbeitungsvolumen
Wenn du diese grundlegenden Überwachungstechniken drauf hast, bist du bestens für den täglichen Betrieb gerüstet.
Fortgeschrittene KI-Funktionen von AWS CloudWatch
Über die Basisfunktionen hinaus hat CloudWatch coole Features, die es von den üblichen Überwachungstools abheben. Diese Funktionen nutzen KI, um die besonderen Herausforderungen moderner Cloud-Architekturen zu meistern.
Mit AIOps clever arbeiten
CloudWatch Investigations nutzt generative KI, um die Ursachenanalyse zu automatisieren und eine geführte Fehlerbehebung zu bieten. Wenn was passiert, werden die Untersuchungen automatisch miteinander verknüpft:
- Metriken: Leistungsdaten, die Veränderungen zeigen
- Protokolle: Detaillierte Anwendungs- und Systemereignisse
- Spuren: Anfragen fließen durch verteilte Systeme
- Letzte Änderungen: Bereitstellungen und Konfigurationsaktualisierungen
Es findet nicht nur Probleme, sondern macht auch einen Vorfallsbericht, der die Analyse nach dem Vorfall total verändert. Mit einem Klick startest du die umfassende Datenerfassung, um detaillierte, kontextbezogene Unterlagen zu erstellen, und sparst dir das manuelle Sammeln von Beweisen.

CloudWatch Investigations
Um zu verhindern, dass falsche Alarme deinen Betrieb durcheinanderbringen, hilft die Erkennung von Anomalien mit Mustererkennung dabei, Alarmmüdigkeit zu reduzieren, indem echte Anomalien von erwarteten Abweichungen unterschieden werden. Du kannst die Erkennung von Anomalien für wichtige Metriken einrichten, damit CloudWatch normale Muster lernt und nur bei statistisch signifikanten Abweichungen Warnungen ausgibt.
Überwachung generativer KI-Arbeitsabläufe
Generative KI-Anwendungen bringen neue Überwachungsanforderungen mit sich. Mit CloudWatch können Entwickler Telemetriedaten über verschiedene KI-Anwendungskomponenten hinweg analysieren:
- Muster für die Codeausführung in integrierten Tools
- Erfolgsraten bei der API-Transformation über Amazon API Gateways
- Muster für das Speichern und Abrufen von Erinnerungen
- Token-Nutzung und Kosten bei Modellaufrufen
- Latenzverfolgung für Reaktionszeiten
Für Unternehmen, die KI-Anwendungen wie Amazon Bedrock AgentCore überwachen, bietet CloudWatch integrierte Dashboards, die speziell für die Beobachtbarkeit von GenAI entwickelt wurden und mit Open-Source-Frameworks wie Strands, CrewAIund LangGraph.
So können wir die ganze User Journey nachvollziehen, einschließlich der Metriken zu Aufruf, Speicher, Gateways oder Prompting, die zeigen, wie Anfragen durch KI-Anwendungen fließen. Diese Transparenz macht die Leistung von KI-Anwendungen besser und zeigt, wo es in komplizierten Arbeitsabläufen von Agenten Probleme gibt.
Fazit
CloudWatch hat sich von einem einfachen Metrikdienst zu einer umfassenden Beobachtungsplattform entwickelt, die für moderne Cloud-Betriebe echt wichtig ist. Die Plattform ist echt stark, weil sie super integriert ist, automatisierte Analysen macht und von einfacher Überwachung bis hin zu KI-gestützter operativer Intelligenz skalierbar ist.
Ich empfehle dir, CloudWatch systematisch zu erkunden, indem du mit grundlegenden Metriken und Alarmen anfängst und dann mit zunehmenden Anforderungen erweiterte Funktionen nutzt. Die AWS CloudWatch-Dokumentation und das Well-Architected Framework bieten detaillierte Anleitungen.
Bei einer guten Überwachung geht's darum, Infos zu sammeln, die die Zuverlässigkeit, Leistung und Benutzererfahrung verbessern. CloudWatch hat alles, was du brauchst, um das zu machen und bessere, stabilere Systeme zu entwickeln.
Wenn du eine AWS-Zertifizierung anstrebst, empfehle ich dir, an unserem AWS Cloud Practitioner Lernpfad zu machen, der alles abdeckt, was du für die CLF-C02-Zertifizierung von Amazon brauchst.
Häufig gestellte Fragen zu AWS CloudWatch
Wie kann ich CloudWatch nutzen, um die Leistung meiner AWS Lambda-Funktionen zu checken?
CloudWatch sammelt automatisch Lambda-Metriken wie Aufrufanzahl, Dauer, Fehler und Drosselungen, ohne dass dafür extra Kosten anfallen. Geh zu CloudWatch → Metriken → Lambda, um diese Metriken anzuschauen. Für mehr Infos aktivierst du CloudWatch Lambda Insights, um Metriken auf Systemebene (CPU, Speicher, Netzwerk) zu sammeln und benutzerdefinierte Dashboards zu erstellen. Du kannst Alarme für Kennzahlen wie Fehlerquoten oder Dauer einrichten, um benachrichtigt zu werden, wenn die Leistung nachlässt.
Was ist der Unterschied zwischen den Protokollklassen „CloudWatch Logs Standard“ und „Infrequent Access“?
CloudWatch Logs Standard ist für Echtzeitüberwachung und häufige Abfragen gedacht, mit höheren Speicherkosten, aber vollem Zugriff auf alle Funktionen. Logs Infrequent Access (Logs-IA) senkt die Erfassungskosten um 50 % (ca. 0,25 USD/GB gegenüber 0,50 USD/GB) für Protokolle, die du aufbewahren musst, aber nur selten abfragen. Damit eignet sich diese Lösung ideal für Compliance-Protokolle und die langfristige Aufbewahrung. Beide unterstützen Verschlüsselung, kontoübergreifende Analysen und die gleichen Erfassungsfunktionen. Allerdings unterstützt Logs-IA keine Metrikfilter.
Wie richte ich einen CloudWatch-Alarm ein, der auf einem Protokollmetrikfilter basiert?
Stell zuerst sicher, dass du eine Standardklassen-Protokollgruppe benutzt, weil Metrikfilter für Protokolle mit seltenem Zugriff nicht verfügbar sind. Dann legst du in CloudWatch einen Metrikfilter an: Geh zu „ “ → „Logs Management“ → wähle deine Protokollgruppe aus → Erstellen Sie einen Metrikfilter → Muster definieren (z. B. „[ERROR]“) → Gib einen Metriknamen an. Dann machst du einen Alarm: Geh zu Alarme → Alarm erstellen → wähle deine benutzerdefinierte Metrik aus → Schlag einen Schwellenwert fest → SNS-Benachrichtigungen einrichten. Du könntest zum Beispiel benachrichtigt werden, wenn die Fehleranzahl innerhalb von 5 Minuten 10 überschreitet.
Kann Amazon CloudWatch mir dabei helfen, Probleme in meinen containerisierten Anwendungen zu erkennen und zu beheben?
Ja, CloudWatch Container Insights bietet umfassende Überwachung für ECS, EKS und Fargate. Es sammelt automatisch Infos wie CPU, Speicher, Festplatte und Netzwerk auf Cluster-, Service- und Aufgabenebene. Zusammen mit CloudWatch Application Signals für verteiltes Tracing und X-Ray-Integration kannst du Leistungsengpässe erkennen, Anfragen über Microservices verfolgen und Metriken mit Protokollen abgleichen, um Probleme schneller zu lösen.
Was kostet Amazon CloudWatch und wie kann ich die Kosten im Griff behalten?
CloudWatch nutzt ein Pay-as-you-go-Preismodell mit einer großzügigen kostenlosen Stufe (10 benutzerdefinierte Metriken, 5 GB Protokolle, 3 Dashboards). Außerdem kosten benutzerdefinierte Metriken etwa 0,30 $ pro Stück und die Protokollaufnahme 0,25 bis 0,50 $ pro GB. Um die Kosten im Griff zu behalten, solltest du nur die wichtigsten Metriken veröffentlichen, Richtlinien für die Protokollspeicherung nach den Compliance-Anforderungen einrichten und für selten abgefragte Protokolle die Option „Logs Infrequent Access” nutzen.
Als Gründer von Martin Data Solutions und freiberuflicher Datenwissenschaftler, ML- und KI-Ingenieur bringe ich ein vielfältiges Portfolio in den Bereichen Regression, Klassifizierung, NLP, LLM, RAG, Neuronale Netze, Ensemble-Methoden und Computer Vision mit.
- Er hat erfolgreich mehrere End-to-End-ML-Projekte entwickelt, einschließlich Datenbereinigung, Analyse, Modellierung und Bereitstellung auf AWS und GCP, und dabei wirkungsvolle und skalierbare Lösungen geliefert.
- Du hast mit Streamlit und Gradio interaktive und skalierbare Webanwendungen für verschiedene Branchen entwickelt.
- Er unterrichtete und betreute Studierende in den Bereichen Datenwissenschaft und Analytik und förderte ihre berufliche Entwicklung durch personalisierte Lernansätze.
- Entwickelte Kursinhalte für Retrieval-Augmented-Generating (RAG)-Anwendungen, die auf die Anforderungen von Unternehmen zugeschnitten sind.
- Er hat hochwirksame technische Blogs zu Themen wie MLOps, Vektordatenbanken und LLMs verfasst und damit ein hohes Maß an Engagement erzielt.
Bei jedem Projekt, das ich übernehme, achte ich darauf, dass ich die neuesten Praktiken des Software-Engineerings und der DevOps anwende, wie CI/CD, Code Linting, Formatierung, Modellüberwachung, Experiment-Tracking und robuste Fehlerbehandlung. Ich biete Komplettlösungen an und verwandle Datenerkenntnisse in praktische Strategien, die Unternehmen dabei helfen, zu wachsen und das Beste aus Data Science, maschinellem Lernen und KI herauszuholen.

