Kurs
Gemini CLI ist Googles Open-Source-KI-Terminal-Assistent, der Gemini direkt in deinen Entwicklungs-Workflow bringt. Mit Gemini 2.5 Pro und seinem 1-Millionen-Kontextfenster kannst du 60 Abfragen pro Minute und 1000 Abfragen pro Tag durchführen, und das alles kostenlos.
In diesem Tutorial erkläre ich dir Schritt für Schritt, wie du Gemini CLI auf deinem lokalen Rechner einrichtest und es benutzt, um:
- Verstehen und Navigieren in großen Codebases
- Erkennen und Beheben von Fehlern
- Code schreiben und testen
- Erstellen von Dokumentation und visuellen Diagrammen
Wir halten unsere Leserinnen und Leser mit The Median auf dem Laufenden, unserem kostenlosen Freitags-Newsletter, der die wichtigsten Meldungen der Woche aufschlüsselt. Melde dich an und bleibe in nur ein paar Minuten pro Woche auf dem Laufenden:
Was ist Gemini CLI?
Gemini CLI ist ein Tool, das direkt in deinem Terminal läuft, deine Codebasis versteht und dir hilft, Fehler mit Hilfe von natürlichsprachlichen Aufforderungen zu beheben. Das ist die Antwort von Google auf Anthropics Claude Code.
Hier sind einige der wichtigsten Funktionen von Gemini CLI:
- Editieren und Refactoring: Sie kann deinen Code mit Hilfe von KI automatisch verbessern und vereinfachen.
- Fehlererkennung und -behebung: Sie identifiziert die Bugs und schlägt Fehlerbehebungen vor.
- Codeverständnis: Gemini CLI fordert Gemini auf, die Architektur zusammenzufassen, Modulrollen zu erklären oder Abläufe abzubilden.
- Testgeneration: Gemini generiert automatisch pytest-Testfälle, um die Zuverlässigkeit und das CI-Vertrauen zu verbessern.
- Dokumentationsunterstützung: Mit diesem Tool kannst du strukturierte Markdown-Dokumente, Changelogs und GitHub-Problemlösungen im Terminal erstellen.
- Suche Erdung: Das Tool
@search
kann zum Abrufen von Informationen in Echtzeit genutzt werden, um bewährte Verfahren zu überprüfen.
Jetzt wollen wir uns ansehen, wie ich Gemini CLI eingesetzt habe, um ein Open-Source-Projekt zu erkunden, Probleme zu beheben und Änderungen zu implementieren.
Schritt 1: Voraussetzungen
Um loszulegen, installiere Node.js (Version 18 oder höher). Du kannst auch den Installer deiner Wahl herunterladen hieroder du kannst die folgenden Bash-Befehle in deinem Terminal ausführen:
# Download and install nvm:
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.3/install.sh | bash
# in lieu of restarting the shell
\. "$HOME/.nvm/nvm.sh"
# Download and install Node.js:
nvm install 22
# Verify the Node.js version:
node -v # Should print "v22.17.0".
nvm current # Should print "v22.17.0".
# Verify npm version:
npm -v # Should print "10.9.2".
So richtest du deine Umgebung für Gemini CLI ein:
- Installiere den NVM (Node Version Manager), indem du das offizielle Installationsskript ausführst
- Dann initialisiere sie in deiner aktuellen Terminalsitzung mit source
- Schließlich installierst du Node.js v22 mit NVM und überprüfst die Installation mit den Befehlen
node -v
,nvm current
undnpm -v
Diese Einrichtung stellt sicher, dass dein System für den reibungslosen Betrieb von Gemini CLI bereit ist.
Multi-Agenten-Systeme mit LangGraph
Schritt 2: Gemini CLI einrichten
Jetzt, wo wir die Voraussetzungen geschaffen haben, können wir Gemini CLI auf unserem System einrichten.
Schritt 2.1: Gemini CLI installieren
Sobald Node.js und npm installiert und verifiziert sind, installiere Gemini CLI, indem du den folgenden Befehl in deinem Terminal ausführst:
npx https://github.com/google-gemini/gemini-cli
Oder verwende npm
, um es auszuführen:
npm install -g @google/gemini-cli
gemini
Sobald gemini-cli
installiert ist, gibst du gemini
in dein Terminal ein, um es aufzurufen.
Schritt 2.2: Authentifizierung
Du kannst dein persönliches Google-Konto zur Authentifizierung verwenden, wenn du dazu aufgefordert wirst. Damit erhältst du bis zu 60 Modellanfragen pro Minute und 1.000 Modellanfragen pro Tag mit Gemini.
In diesem Tutorial habe ich mich mit Login with Googleauthentifiziert , aber du kannst auch den API-Schlüssel (als Umgebungsvariable festgelegt) oder Vertex AI zur Authentifizierung verwenden. Um einen neuen API-Schlüssel zu generieren, melde dich bei AI Studio mit deinem Google-Konto an und klicke auf API-Schlüssel erstellen. Du kannst auch einen bestehenden Schlüssel aus einem Google Cloud-Projekt verwenden, um auf bestimmte Modelle zuzugreifen oder höhere Nutzungsgrenzen zu beantragen.
export GEMINI_API_KEY=”Your_API_Key”
Oder erstelle eine .env
Datei
GEMINI_API_KEY=”Your_API_Key”
Du kannst /auth
im Textfeld verwenden, um die Authentifizierung bei Bedarf umzuschalten.
Sobald du dich authentifiziert hast, findest du ein Textfeld, mit dem du kostenlos mit dem CLI in deinem Terminal interagieren kannst.
Schritt 3: Einrichten eines Projekts auf Gemini CLI
Sobald das CLI läuft, können wir mit Gemini über das Terminal interagieren. Es gibt zwei Möglichkeiten, mit CLI an einem Projekt zu arbeiten.
1. Ein neues Projekt starten
Um ein Projekt von Grund auf neu zu starten, führe die folgenden Befehle aus:
cd new-project/
gemini
Verwende in der CLI eine Eingabeaufforderung, um ein Problem zu lösen, das dich interessiert - zum Beispiel:
> Write the encoder code for a transformer from scratch.
Mit diesem Befehl wird ein neues Projektverzeichnis erstellt und Gemini auf dem Terminal initialisiert. Dann kannst du Gemini bitten, dein neues Verzeichnis mit Code zu füllen.
2. Mit einem bestehenden Projekt arbeiten
Wenn du bereits eine bestehende Codebasis hast, kannst du sie mit den folgenden Befehlen bearbeiten:
git clone https://github.com/AashiDutt/Google-Agent-Development-Kit-Demo
cd Google-Agent-Development-Kit-Demo
gemini
Verwende im CLI eine Eingabeaufforderung wie:
> Give me a summary of all of the changes made to the codebase today.
Wenn du mit einer bestehenden Codebasis arbeitest, die entweder von GitHub geklont wurde oder bereits auf deinem lokalen Rechner vorhanden ist, kannst du Gemini CLI aus dem Projektverzeichnis heraus starten.
Alternativ kannst du nach dem Start von Gemini den vollständigen Pfad zum Code-Verzeichnis in das Textfeld der Eingabeaufforderung eingeben und den Befehl /path
verwenden, um das lokale Projekt manuell zu laden.
Schritt 4: Experimentieren mit der Gemini CLI
In diesem Tutorial werden wir mit einem bestehenden Projekt arbeiten, das ich verwendet habe, um ein Tutorial zu schreiben Googles Agent Development Kit (ADK). Das Repository ist gespeichert auf GitHub. Mit Gemini CLI werden wir:
- Erforsche und verstehe die Codebase
- Entdecke einen Fehler oder ein Problem auf GitHub oder in einer Datei
- Refaktoriere den Code und erstelle Unit-Tests
- Erstelle einen Markdown-Bericht über die vorgenommenen Änderungen
- Visualisiere die Codebasis, indem du ein Flussdiagramm oder ein Diagramm erstellst
Erkunden und Verstehen der Codebase
Beginnen wir damit, Gemini zu bitten, die Codebasis zu erkunden und zu erklären.
Aufforderung: Erkunde das aktuelle Verzeichnis und beschreibe die Architektur des Projekts.
Gemini CLI liefert eine strukturierte Zusammenfassung, die erklärt, wie:
- agents/ enthält einzelne Agentenimplementierungen
- shared/ definiert gemeinsame Schemata, die von allen Agenten verwendet werden
- common/ enthält wiederverwendbare A2A-Utility-Funktionen für Inter-Agent-Messaging
Das hat mir geholfen, mich zu orientieren, ohne jede Datei manuell zu lesen.
Analysieren und Beheben eines GitHub-Problems
Lass uns einige offene Fragen aus dem GitHub-Repository untersuchen. Du kannst das Werkzeug /compress
verwenden, um den Kontext zu komprimieren, indem du ihn durch eine Zusammenfassung ersetzst. Das hilft uns, mehr Informationen in einer begrenzten Kontextlänge zu vermitteln.
Hinweis: Gemini wird dich um eine Bestätigung bitten, bevor du auf das GitHub-Repository zugreifen kannst. In diesem Fall wird das Repo als Open Source zur Verfügung gestellt.
Prompt: Hier ist ein GitHub-Problem: [@search https://github.com/AashiDutt/Google-Agent-Development-Kit-Demo/issues/1]. Analysiere die Codebasis und schlage einen 3-stufigen Korrekturplan vor. Welche Dateien/Funktionen sollte ich ändern?
Gemini CLI hat das Problem untersucht:
- Du hast die Funktion
@search
genutzt und einen 3-Schritte-Plan für die Behebung des GitHub-Problems zurückgegeben. - Die Ursache war ein JSON-Serialisierungsfehler.
- Schließlich schlug Gemini Änderungen und die Bearbeitung von Antworten in einigen Dateien vor.
Als Nächstes wartet das CLI auf die Eingaben des Nutzers, um die Änderungen zu bewerten, und wenn der Nutzer zustimmt, nimmt es die vorgeschlagenen Änderungen vor. Wähle die Option, die vorgeschlagenen Änderungen zu übernehmen, indem du auf Enter klickst.
Die CLI nimmt Änderungen an jeder betroffenen Datei vor. Sobald die Änderungen vorgenommen wurden, wird eine Zusammenfassung der vorgenommenen Änderungen zurückgegeben.
Implementieren und Testen der Korrektur
Lass uns die von Gemini vorgeschlagenen Korrekturen umsetzen und testen. Dazu habe ich die folgende Eingabeaufforderung verwendet und die Ausführung erlaubt.
Prompt: Schreibe einen pytest-Unit-Test für diese Änderung in test_shared.py.
Gemini CLI:
- Einfügen von
json.dumps()
vor dem Senden von Aufgaben-Nutzlasten in die zuvor vorgeschlagenen Dateien. - Dann erstellt es
test_agents.py
, wenn es fehlt, um Unit-Tests hinzuzufügen. - Schließlich wurde ein neuer Testfall hinzugefügt, um das Schema und die Übertragung von verschachtelten Agentennachrichten zu überprüfen.
Das CLI erstellt die Datei test_agents.py
und führt sie mithilfe mehrerer Shell-Skripte aus. An einem Punkt kam Gemini jedoch in eine Schleife, in der der gleiche Fehler wiederholt wurde. Eine verfeinerte Eingabeaufforderung, ein erneuter Durchlauf oder einfach die Verwendung eines anderen Modells über die API würden helfen, dieses Problem zu lösen.
Hier ist die neue Datei, die von Gemini im Projektordner erstellt wurde:
Dokumentation generieren
Nachdem wir nun die Korrekturen vorgenommen haben, fassen wir die Änderungen zusammen und schreiben sie als Markdown in eine .txt Datei.
Dafür habe ich die folgende Aufforderung verwendet:
Prompt: Schreibe eine Markdown-Zusammenfassung des Fehlers, der Korrektur und der Testabdeckung. Formatiere ihn wie einen Changelog-Eintrag unter "v0.2.0".
Um die Zusammenfassung in einem Dokument zu speichern, habe ich die folgende Eingabeaufforderung verwendet:
Prompt: Speichern Sie diese Zusammenfassung in einer .txt Datei und nennen Sie sie zusammenfassung.txt
Gemini CLI verwendet das Tool WriteFile
, um die Datei summary.txt
im Projektverzeichnis zu speichern.
Hier ist die summary.txt
Datei, die von Gemini für dieses Projekt erstellt wurde:
Erstellen eines Flussdiagramms mit MCP
Dieser Abschnitt erweitert die vorherigen Experimente, in denen ich untersucht habe, wie Gemini CLI das Model Context Protocol (MCP) verwendet, um Zusammenfassungen auf Dateiebene und den Aufgabenverlauf über Aufforderungen hinweg zu erhalten. Das gibt Zwillingen ein Arbeitsgedächtnis innerhalb der Sitzung. Ich habe Gemini gebeten, ein Projektablaufdiagramm zu erstellen und es in ein Bild zu konvertieren.
Hier ist die Aufforderung, die ich verwendet habe:
Prompt: Erstelle ein Flussdiagramm, das zeigt, wie Agenten über A2A kommunizieren und wie die main.py das System orchestriert. Hebe hervor, wo das Problem aufgetreten ist und wie es behoben wurde.
Diese Visualisierung wird durch den persistenten Speicher von Gemini unterstützt, der den gesamten Kontext unserer früheren Fehlerbehebung und Agentenstruktur beibehält, ohne dass ein erneuter Upload oder Dateihinweise erforderlich sind.
Obwohl die Werkzeuge zur Bilderzeugung nicht direkt in der CLI verfügbar waren (sie sind möglicherweise über die API zugänglich), erwies sich diese Visualisierung als hilfreich für das Verständnis des Agent-Routings.
Verfügbare Gemini CLI-Tools
Einige Tools, die Gemini CLI unterstützt, sind:
- ReadFile, WriteFile, Edit
- FindFiles, ReadFolder, ReadManyFiles
- Shell, SaveMemory
- GoogleSearch or Search, WebFetch
Diese Tools helfen dir, große Codebasen effizient zu navigieren, abzufragen und zu ändern.
Um mehr über Gemini CLI zu erfahren, empfehle ich die Lektüre des offiziellen Ankündigungsartikel und die GitHub-Seite.
Fazit
Zusammengefasst hat dieses Tutorial gezeigt, wie Gemini CLI verwendet werden kann, um:
- Die Struktur einer Multi-Agenten-Codebasis verstehen
- Behebe ein GitHub-Problem
- Erstelle Unit-Tests und Markdown-Dokumentation für die Änderungen.
- Datenfluss visualisieren
Gemini CLI reduziert die Zeit, die ich normalerweise mit dem Parsen von Dateien und der manuellen Planung von Korrekturen verbringen würde. Obwohl Gemini CLI noch in den Kinderschuhen steckt und sich gelegentlich langsam anfühlt, wenn es über die API verwendet wird, entspricht es bereits den Fähigkeiten von Claude Code.
Wenn du ein Entwickler bist, der KI-Agenten in seinen Arbeitsablauf einbinden möchte, solltest du dir diese vierteilige Tutorial-Serie auf Devin ansehen:

Ich bin ein Google Developers Expert in ML (Gen AI), ein Kaggle 3x Expert und ein Women Techmakers Ambassador mit mehr als 3 Jahren Erfahrung im Tech-Bereich. Ich habe 2020 ein Startup im Bereich Gesundheitstechnologie mitbegründet und mache einen Master in Informatik an der Georgia Tech, der sich auf maschinelles Lernen spezialisiert.