Cours
Gemini CLI est l'assistant terminal IA open-source de Google qui intègre directement Gemini dans votre flux de travail de développement. Vous pouvez utiliser Gemini 2.5 Pro et sa fenêtre contextuelle de 1M pour exécuter 60 requêtes par minute et 1000 requêtes par jour, le tout gratuitement.
Dans ce tutoriel, je vais vous expliquer pas à pas comment configurer Gemini CLI sur votre machine locale et l'utiliser pour :
- Comprendre et naviguer dans de grandes bases de code
- Détecter et corriger les bogues
- Écrire et tester le code
- Produire de la documentation et des diagrammes visuels
Nous tenons nos lecteurs informés des dernières nouveautés en matière d'IA en leur envoyant The Median, notre lettre d'information gratuite du vendredi qui analyse les principaux sujets de la semaine. Abonnez-vous et restez à la pointe de la technologie en quelques minutes par semaine :
Qu'est-ce que l'interface de programmation Gemini ?
Gemini CLI est un outil qui s'exécute directement dans votre terminal, comprend votre base de code et vous aide à corriger les bogues à l'aide d'invites en langage naturel. C'est la réponse de Google à Anthropic's Claude Code.
Voici quelques fonctionnalités clés de l'interface de programmation Gemini :
- Édition et refonte de: Il peut automatiquement améliorer et simplifier votre code grâce aux conseils de l'IA.
- Détection et correction des bogues: Il identifie les bogues et propose des correctifs pour les erreurs.
- Compréhension du code: Gemini CLI demande à Gemini de résumer l'architecture, d'expliquer les rôles des modules ou de cartographier les flux.
- Génération de tests: Gemini génère automatiquement des cas de test pytest pour améliorer la fiabilité et la confiance de l'IC.
- Support de documentation: Cet outil vous permet de créer des documents markdown structurés, des changelogs et des réponses aux problèmes GitHub dans le terminal.
- Recherche de mise à la terre: L'outil
@searchpeut être utilisé pour la recherche d'informations en temps réel afin de valider les meilleures pratiques.
Voyons maintenant comment j'ai utilisé Gemini CLI pour explorer, résoudre des problèmes et mettre en œuvre des changements dans un projet open-source.
Étape 1 : Conditions préalables
Pour commencer, installez Node.js (version 18 ou supérieure). Vous pouvez également télécharger le programme d'installation de votre choix iciou vous pouvez exécuter les commandes bash suivantes dans votre terminal :
# Download and install nvm:
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.3/install.sh | bash
# in lieu of restarting the shell
\. "$HOME/.nvm/nvm.sh"
# Download and install Node.js:
nvm install 22
# Verify the Node.js version:
node -v # Should print "v22.17.0".
nvm current # Should print "v22.17.0".
# Verify npm version:
npm -v # Should print "10.9.2".
Pour configurer votre environnement pour Gemini CLI :
- Installez le NVM (Node Version Manager) en exécutant le script d'installation officiel.
- Ensuite, initialisez-le dans votre session de terminal actuelle à l'aide de la source
- Enfin, utilisez NVM pour installer Node.js v22 et vérifiez l'installation à l'aide des commandes
node -v,nvm current, etnpm -v.
Cette configuration permet de s'assurer que votre système est prêt à exécuter Gemini CLI sans problème.
Systèmes multi-agents avec LangGraph
Étape 2 : Configuration de l'interface de programmation de Gemini
Maintenant que nous avons les prérequis en place, nous pouvons configurer Gemini CLI sur notre système.
Étape 2.1 : Installer le CLI de Gemini
Une fois que Node.js et npm sont installés et vérifiés, installez Gemini CLI en lançant la commande suivante dans votre terminal :
npx https://github.com/google-gemini/gemini-cli
Ou utilisez npm pour le faire fonctionner :
npm install -g @google/gemini-cli
gemini
Une fois que gemini-cli est installé, tapez gemini dans votre terminal pour y accéder.
Étape 2.2 : Authentification
Vous pouvez utiliser votre compte Google personnel pour vous authentifier lorsque vous y êtes invité. Cela vous permettra d'obtenir jusqu'à 60 demandes de modèles par minute et 1 000 demandes de modèles par jour avec Gemini.
Dans ce tutoriel, je me suis authentifié à l'aide de Login with Google, mais vous pouvez également utiliser la clé API (définie comme variable d'environnement) ou Vertex AI pour l'authentification. Pour générer une nouvelle clé API, connectez-vous à AI Studio avec votre compte Google et cliquez sur Créer une clé API. Vous pouvez également utiliser une clé existante d'un projet Google Cloud pour accéder à des modèles spécifiques ou demander des limites d'utilisation plus élevées.
export GEMINI_API_KEY=”Your_API_Key”
Ou créez un fichier .env
GEMINI_API_KEY=”Your_API_Key”
Vous pouvez utiliser /auth dans la zone de texte pour changer d'authentification en fonction des besoins.

Une fois authentifié, vous trouverez une boîte de texte pour interagir avec le CLI dans votre terminal gratuitement.
Étape 3 : Mise en place d'un projet sur Gemini CLI
Une fois que le CLI est lancé, nous pouvons commencer à interagir avec Gemini à partir du terminal. Il y a deux façons de travailler sur un projet avec CLI.
1. Démarrer un nouveau projet
Pour démarrer un projet à partir de zéro, exécutez les commandes suivantes :
cd new-project/
gemini
Dans l'interface de programmation, utilisez une invite pour résoudre un problème qui vous intéresse, par exemple :
> Write the encoder code for a transformer from scratch.
Cette commande crée un nouveau répertoire de projet et initialise Gemini sur le terminal. Ensuite, vous pouvez demander à Gemini de remplir votre nouveau répertoire avec du code.
2. Travailler avec un projet existant
Si vous avez déjà une base de code existante, vous pouvez travailler avec elle en utilisant les commandes suivantes :
git clone https://github.com/AashiDutt/Google-Agent-Development-Kit-Demo
cd Google-Agent-Development-Kit-Demo
gemini
Dans l'interface de programmation, utilisez une invite telle que :
> Give me a summary of all of the changes made to the codebase today.
Si vous travaillez avec une base de code existante, clonée depuis GitHub ou déjà présente sur votre machine locale, vous pouvez exécuter Gemini CLI depuis le répertoire du projet.
Vous pouvez également, après avoir lancé Gemini, saisir le chemin complet du répertoire de code dans la zone de texte de l'invite à l'aide de la commande /path pour charger manuellement le projet local.
Étape 4 : Expérimenter l'interface de programmation de Gemini
Dans ce tutoriel, nous travaillerons avec un projet existant que j'ai utilisé pour écrire un tutoriel sur Le kit de développement d'agents de Google (ADK). Le dépôt est stocké sur GitHub. À l'aide de l'interface de programmation Gemini, nous allons
- Explorer et comprendre la base de code
- Détecter un bug ou un problème sur GitHub ou dans un fichier
- Refondre le code et générer des tests unitaires
- Créez un rapport markdown des modifications apportées
- Visualisez la base de code en générant un organigramme ou un diagramme.
Explorer et comprendre la base de code
Commençons par demander à Gemini d'explorer et d'expliquer la base de code.
Prompt : Explorez le répertoire actuel et décrivez l'architecture du projet.

Gemini CLI a renvoyé un résumé structuré, expliquant comment :
- agents/ contient des implémentations d'agents individuels
- partagé/ définit des schémas communs utilisés par tous les agents
- common/ inclut des fonctions utilitaires A2A réutilisables pour la messagerie inter-agents
Cela m'a permis de m'orienter sans avoir à lire chaque fichier manuellement.
Analyse et résolution d'un problème GitHub
Examinons quelques questions ouvertes du dépôt GitHub. Vous pouvez utiliser l'outil /compress pour comprimer le contexte en le remplaçant par un résumé. Cela nous permet de transmettre plus d'informations dans un contexte de longueur limitée.
Note : Gemini vous demandera un accusé de réception avant d'accéder au dépôt GitHub. Dans ce cas, le dépôt est en libre accès.
Prompt : Voici un problème GitHub : [@search https://github.com/AashiDutt/Google-Agent-Development-Kit-Demo/issues/1]. Analyser la base de code et proposer un plan de correction en 3 étapes. Quels fichiers/fonctions dois-je modifier ?

Gemini CLI s'est penché sur la question :
- En utilisant la fonction
@search, et en renvoyant un plan de correction en 3 étapes pour le problème GitHub. - Il a ensuite identifié la cause première comme étant une erreur de sérialisation JSON.
- Enfin, Gemini a suggéré des modifications et un traitement des réponses dans quelques fichiers.
Ensuite, l'ILC attend l'avis de l'utilisateur pour évaluer les changements, et si l'utilisateur est d'accord, il effectue les changements suggérés. Choisissez l'option d'appliquer les changements suggérés en cliquant sur Enter.

L'ITC apporte des modifications à tous les fichiers concernés. Une fois les modifications effectuées, il renvoie un résumé des modifications apportées.
Mise en œuvre et test de la correction
Mettons en œuvre et testons les corrections suggérées par Gemini. Pour ce faire, j'ai utilisé l'invite suivante et autorisé l'exécution.
Prompt : Ecrivez un test unitaire pytest pour ce changement dans test_shared.py.

CLI Gemini :
- Insérez
json.dumps()avant d'envoyer les charges utiles des tâches dans les fichiers proposés précédemment. - Ensuite, il crée
test_agents.pys'il manque d'ajouter des tests unitaires. - Enfin, il a ajouté un nouveau cas de test pour valider le schéma et la transmission des messages d'agents imbriqués.
L'ITC génère le fichier test_agents.py et l'exécute à l'aide de plusieurs scripts shell. Cependant, à un moment donné, Gemini est entré dans une boucle répétant la même erreur. Une invite affinée, une nouvelle exécution ou simplement l'utilisation d'un modèle différent via l'API permettraient de résoudre ce problème.
Voici le nouveau fichier généré par Gemini dans le dossier du projet :

Générer de la documentation
Maintenant que nous avons effectué les corrections, résumons les changements apportés et écrivons-les en Markdown dans un fichier .txt dans un fichier .txt.
Pour ce faire, j'ai utilisé l'invite suivante :
Prompt : Rédigez un résumé en markdown de la couverture des bogues, des corrections et des tests. Formulez-la comme une entrée de journal des modifications sous "v0.2.0".

Pour enregistrer le résumé dans un document, j'ai utilisé l'invite suivante :
Prompt : Enregistrez ce résumé dans un fichier .txt et nommez-le résumé.txt

Gemini CLI utilise l'outil WriteFile pour enregistrer le fichier summary.txt dans le répertoire du projet.

Voici le fichier summary.txt généré par Gemini pour ce projet :

Générer un organigramme à l'aide de MCP
Cette section prolonge les expériences précédentes, au cours desquelles j'ai exploré la manière dont Gemini CLI utilise protocole de contexte de modèle (MCP) pour maintenir les résumés au niveau des fichiers et l'historique des tâches à travers les invites. Les Gémeaux disposent ainsi d'une mémoire de travail au sein de la session. En utilisant cette capacité de Gemini, j'ai demandé à Gemini de générer un organigramme de projet et de le convertir en image.
Voici le texte que j'ai utilisé :
Prompt : Créez un organigramme qui montre comment les agents communiquent via A2A et comment main.py orchestre le système. Mettez en évidence l'endroit où le problème s'est produit et la manière dont il a été résolu.

Cette visualisation est alimentée par la mémoire persistante de Gemini, qui a conservé le contexte complet de notre précédente correction de bogue et la structure de l'agent sans avoir besoin d'un nouveau téléchargement ou d'une indication de fichier.
Bien que les outils de génération d'images ne soient pas directement disponibles dans l'interface de programmation (ils peuvent être accessibles via l'API), cette visualisation s'est avérée utile pour comprendre le routage des agents.
Outils CLI disponibles pour Gemini
Parmi les outils pris en charge par Gemini CLI, citons
- ReadFile, WriteFile, Edit
- FindFiles, ReadFolder, ReadManyFiles
- Shell, SaveMemory
- GoogleSearch ou Search, WebFetch
Ces outils vous permettent de naviguer, d'interroger et de modifier efficacement de grandes bases de code.
Pour en savoir plus sur Gemini CLI, je vous recommande de lire l'article officiel officiel et la page GitHub.
Conclusion
En résumé, ce tutoriel a démontré comment le CLI de Gemini peut être utilisé pour :
- Comprendre la structure d'une base de code multi-agents
- Corriger un problème GitHub
- Générer des tests unitaires et de la documentation markdown pour les changements.
- Visualiser le flux de données
Gemini CLI a réduit le temps que je passais normalement à analyser les fichiers et à planifier manuellement les corrections. Bien que l'interface de programmation de Gemini en soit encore à ses débuts et qu'elle puisse parfois sembler lente lorsqu'elle est utilisée par l'intermédiaire de l'API, elle est déjà à la hauteur des capacités de Claude Code.
Si vous êtes un développeur désireux d'ajouter des agents d'intelligence artificielle à votre flux de travail, consultez cette série de tutoriels en quatre parties sur Devin :

Je suis un expert Google Developers en ML (Gen AI), un expert Kaggle 3x, et un ambassadeur Women Techmakers avec plus de 3 ans d'expérience dans la technologie. J'ai cofondé une startup dans le domaine de la santé en 2020 et je poursuis un master en informatique à Georgia Tech, avec une spécialisation dans l'apprentissage automatique.