Les Smolagents de Hugging Face : Un guide avec des exemples

Apprenez à simplifier la création d'agents d'intelligence artificielle avec la nouvelle bibliothèque Python de Hugging Face, smolagents, et suivez un projet de démonstration pour la voir en action.

Actualisé 17 janv. 2025 · 8 min lire

Smolagents de Hugging Face est une nouvelle bibliothèque Python qui simplifie la création d' agents d'IAet les rend plus accessibles aux développeurs.

Dans ce blog, je vous présenterai la bibliothèque smolagents, j'expliquerai pourquoi elle est utile et je vous guiderai à travers un projet de démonstration pour montrer ses capacités.

Qu'est-ce que les Smolagents de Hugging Face ?

Comme le décrit le blog d'annonce de Hugging Face blog d'annonce de Hugging Facesmolagents est "une bibliothèque très simple qui débloque les capacités agentiques des modèles de langage". Mais pourquoi avons-nous besoin de bibliothèques pour créer des agents ?

Au fond, les agents sont alimentés par des LLM pour résoudre dynamiquement une tâche en observant leur environnement, en élaborant des plans et en exécutant ces plans à l'aide de leur boîte à outils. La création de ces agents n'est pas impossible, mais elle nécessite l'écriture de nombreux composants à partir de zéro. Ces composants garantissent que les agents fonctionnent correctement sans épuiser votre crédit API et votre temps d'exécution. Les cadres agentiques facilitent cette tâche et vous évitent de réinventer la roue.

Les cadres d'agents d'IA sont souvent critiqués sur deux points :

Ils construisent trop de couches d'abstraction, ce qui les rend rigides et difficiles à déboguer.
Ils se concentrent sur les "flux de travail" plutôt que sur la construction d'agents capables de collaborer dynamiquement de manière autonome.

D'autre part, les smolagents possèdent des qualités qui les rendent très prometteurs pour ces applications agentiques :

Les abstractions du cadre sont réduites au minimum.
Alors que la plupart des frameworks permettent aux agents de définir leurs actions au format JSON/texte, l'approche principale de smolagents est la suivante Agents de code dans lesquels les actions sont écrites sous forme d'extraits de code Python (ce qui est différent des agents qui écrivent du code).
Étant un framework Hugging Face, smolagents s'intègre bien avec le Hub et la bibliothèque Transformers. Vous pouvez utiliser de nombreux modèles à partir du hub (certains d'entre eux ne peuvent être utilisés qu'en tant qu'utilisateur Pro), et vous pouvez également travailler avec des modèles propriétaires d'OpenAI, Anthropic, etc.
Vous pouvez facilement utiliser les outils déjà fournis, ou définir vos propres outils avec un minimum d'effort, presque aussi simple que d'écrire une fonction Python.

Ces qualités sont celles qui, sur le papier, font des smolagents des agents d'intelligence artificielle prêts à l'emploi avec peu d'efforts, alors voyons si elles se vérifient dans la pratique.

Construire un projet de démonstration avec Smolagents

Dans cette section, nous allons construire une démo simple avec smolagents. Notre application permettra à un agent d'obtenir le papier le plus upvoté sur le Hugging Face. Articles quotidiens de Hugging Face. Nous construisons nos outils personnalisés pour l'agent et nous les voyons fonctionner en action.

Daily Papers, une bonne source pour rester au courant des meilleurs documents de recherche quotidiens.

Mise en place de smolagents

Pour utiliser smolagents, il vous suffit d'installer la bibliothèque et de fournir un jeton Hugging Face. La facilité d'installation du cadre est un point positif.

Pour installer le paquet, exécutez :

pip install smolagents

Construire des outils personnalisés

Bien que le cadre fournisse des outils intégrés que vous pouvez utiliser directement (par exemple, DuckDuckGoSearchTool), la création de vos propres outils est tout aussi simple. Pour notre objectif, nous construisons quatre outils, chacun pour un objectif particulier :

Obtenir le titre du premier quotidien.
Obtenir l'identifiant de l'article en utilisant son titre.
Télécharger l'article à partir de arXiv avec l'ID.
Lecture du fichier PDF téléchargé.

L'utilisation d'un outil est une cause fréquente d'erreur de la part des agents. Pour optimiser les outils à des fins agentiques, il est important de s'assurer que les agents comprennent clairement quel outil utiliser et comment l'utiliser. Pour ce faire, soyez aussi explicite que possible dans la définition de ces outils :

Choisissez un nom informatif pour la fonction.
Les entrées et les sorties de la fonction doivent avoir des indications de type.
Une description de l'objectif de l'outil doit être incluse. Il sert de manuel à l'agent.

Construisons maintenant notre premier outil personnalisé pour analyser la page des quotidiens et obtenir le titre de l'article le plus important :

from smolagents import tool 
# import packages that are used in our tools
import requests
from bs4 import BeautifulSoup
import json

@tool
def get_hugging_face_top_daily_paper() -> str:
    """
    This is a tool that returns the most upvoted paper on Hugging Face daily papers.
    It returns the title of the paper
    """
    try:
      url = "<https://huggingface.co/papers>"
      response = requests.get(url)
      response.raise_for_status()  # Raise an exception for bad status codes (4xx or 5xx)
      soup = BeautifulSoup(response.content, "html.parser")

      # Extract the title element from the JSON-like data in the "data-props" attribute
      containers = soup.find_all('div', class_='SVELTE_HYDRATER contents')
      top_paper = ""

      for container in containers:
          data_props = container.get('data-props', '')
          if data_props:
              try:
                  # Parse the JSON-like string
                  json_data = json.loads(data_props.replace('&quot;', '"'))
                  if 'dailyPapers' in json_data:
                      top_paper = json_data['dailyPapers'][0]['title']
              except json.JSONDecodeError:
                  continue

      return top_paper
    except requests.exceptions.RequestException as e:
      print(f"Error occurred while fetching the HTML: {e}")
      return None

Remarquez le décorateur @tool, le nom clair de l'outil, les indications de type et la docstring. De même, nous définissons l'outil get_paper_id_by_title pour obtenir l'identifiant de l'article à partir de son titre, afin de pouvoir le télécharger à partir d'arXiv. Pour cet outil, nous utilisons l'API de Hugging Face.

from huggingface_hub import HfApi

@tool
def get_paper_id_by_title(title: str) -> str:
    """
    This is a tool that returns the arxiv paper id by its title.
    It returns the title of the paper

    Args:
        title: The paper title for which to get the id.
    """
    api = HfApi()
    papers = api.list_papers(query=title)
    if papers:
        paper = next(iter(papers))
        return paper.id
    else:
        return None

Le téléchargement de l'article à l'aide de son identifiant peut être effectué à l'aide du paquet Python arxiv. Nous sauvegardons le papier localement sous un nom particulier, que nous utilisons ensuite pour le lire :

import arxiv

@tool
def download_paper_by_id(paper_id: str) -> None:
    """
    This tool gets the id of a paper and downloads it from arxiv. It saves the paper locally 
    in the current directory as "paper.pdf".

    Args:
        paper_id: The id of the paper to download.
    """
    paper = next(arxiv.Client().results(arxiv.Search(id_list=[paper_id])))
    paper.download_pdf(filename="paper.pdf")
    return None

Pour lire un fichier PDF, vous pouvez utiliser le logiciel pypdf. Nous ne lirons que les trois premières pages du document afin d'économiser les jetons.

from pypdf import PdfReader

@tool
def read_pdf_file(file_path: str) -> str:
    """
    This function reads the first three pages of a PDF file and returns its content as a string.
    Args:
        file_path: The path to the PDF file.
    Returns:
        A string containing the content of the PDF file.
    """
    content = ""
    reader = PdfReader('paper.pdf')
    print(len(reader.pages))
    pages = reader.pages[:3]
    for page in pages:
        content += page.extract_text()
    return content

Si vous définissez des outils personnalisés et que l'agent a du mal à les utiliser correctement ou à transmettre les bons arguments, envisagez de rendre les noms des fonctions et des variables, ainsi que les descriptions des outils, plus clairs et plus explicites.

Exécution de l'agent

Une fois nos outils mis en place, nous pouvons maintenant initialiser et exécuter notre agent. Nous utilisons le modèle Qwen2.5-Coder-32B-Instruct, dont l'utilisation est gratuite. Les outils dont un agent a besoin peuvent être transmis lors de la définition de l'agent. Vous pouvez constater que le processus de définition et de fonctionnement d'un agent nécessite un minimum de code :

from smolagents import CodeAgent, HfApiModel

model_id = "Qwen/Qwen2.5-Coder-32B-Instruct"

model = HfApiModel(model_id=model_id, token=<YOUR-API>)
agent = CodeAgent(tools=[get_hugging_face_top_daily_paper,
                         get_paper_id_by_title,
                         download_paper_by_id,
                         read_pdf_file],
                  model=model,
                  add_base_tools=True)

agent.run(
    "Summarize today's top paper on Hugging Face daily papers by reading it.",
)

Au fur et à mesure que l'agent opère, il produit son processus étape par étape. Cela nous permet de voir comment il définit ses actions dans le code tout en utilisant les outils personnalisés que nous avons fournis :

Résultat de l'agent à l'étape 0

L'agent peut terminer la lecture du document lors de la première étape (étape 0). Dans un deuxième temps, le modèle énumère les points clés du document, toujours sous la forme d'une liste Python.

Résultat de l'agent à l'étape 1

Lors de la troisième étape (étape 2), l'agent crée un résumé des points clés et l'imprime lors de la dernière étape (étape 3).

Résultats de l'agent aux étapes 2 et 3.

L'agent a pu identifier les outils à utiliser à chaque étape et a terminé la tâche sans erreur. Notez que l'ensemble du pipeline pourrait être optimisé pour utiliser moins d'outils, mais j'étais curieux de vérifier comment l'agent utilise les appels d'outils multiples.

Pour les tâches plus difficiles, qui nécessitent un raisonnement plus complexe ou l'utilisation d'outils, vous pouvez également utiliser des modèles plus performants comme colonne vertébrale de vos agents, tels que ceux proposés par OpenAI ou Claude.

Conclusion

Que recherchez-vous dans un cadre agentique ? Votre réponse indique clairement lequel utiliser, mais s'il s'agit d'un cadre simple qui n'est pas encombré d'abstractions, qui vous donne le contrôle, qui a de bonnes intégrations, et qui fournit les bases sans prendre la roue, alors smolagents est une bonne option à essayer.

Être bien intégré dans l'écosystème Hugging Face signifie plus de modèles et d'outils à portée de main, ainsi que le soutien de la communauté open-source. Le cadre fonctionne bien dans ce qu'il promet. Il pourrait bénéficier de plus d'outils intégrés, et nous pouvons croiser les doigts pour que cela se produise au fur et à mesure de son développement.

Si vous souhaitez en savoir plus sur les agents d'IA et les smolagents, ne manquez pas ces ressources :

Author

Hesam Sheikh Hassani

Sujets

Intelligence artificielle

Grands modèles linguistiques

Visage étreint

Apprenez l'IA avec ces cours !

Cursus

Développer des applications d'IA

21 h

Apprenez à créer des applications alimentées par l'IA avec les derniers outils de développement d'IA, notamment l'API OpenAI, Hugging Face et LangChain.

Afficher les détails

Commencer le cours

Cours

Travailler avec Hugging Face

2 h

32.9K

Naviguez et utilisez le vaste référentiel de modèles et d'ensembles de données disponibles sur le Hugging Face Hub.

Afficher les détails

Commencer le cours

Cours

Travailler avec Llama 3

2 h

13.8K

Découvrez les dernières techniques pour exécuter Llama LLM localement et l'intégrer à votre pile.

Afficher les détails

Commencer le cours

Contenus associés

blog

Types d'agents d'intelligence artificielle : Comprendre leurs rôles, leurs structures et leurs applications

Découvrez les principaux types d'agents d'intelligence artificielle, comment ils interagissent avec les environnements et comment ils sont utilisés dans les différents secteurs d'activité. Comprendre les agents réflexes simples, les agents basés sur un modèle, les agents basés sur un but, les agents basés sur l'utilité, les agents d'apprentissage, etc.

Tutoriel

Classes abstraites Python : Un guide complet avec des exemples

Découvrez les classes abstraites Python, leur utilité et comment utiliser le module `abc` pour garantir la cohérence des interfaces. Comprend des exemples pratiques et des bonnes pratiques pour une mise en œuvre efficace.

Derrick Mwiti

Tutoriel

Tableaux Python

Tableaux Python avec exemples de code. Découvrez comment créer et imprimer des tableaux à l'aide de Python NumPy dès aujourd'hui.

DataCamp Team

Tutoriel

Données JSON Python : Un guide illustré d'exemples

Apprenez à utiliser JSON en Python, notamment la sérialisation, la désérialisation, le formatage, l'optimisation des performances, la gestion des API, ainsi que les limites et les alternatives de JSON.

Moez Ali

Tutoriel

Fonctions lambda Python : Guide pour débutants

Découvrez les fonctions lambda Python, leur utilité et quand les utiliser. Comprend des exemples pratiques et des bonnes pratiques pour une mise en œuvre efficace.

Mark Pedigo

Voir plus Voir plus

Qu'est-ce que les Smolagents de Hugging Face ?

Construire un projet de démonstration avec Smolagents

Mise en place de smolagents

Construire des outils personnalisés

Exécution de l'agent

Conclusion

Types d'agents d'intelligence artificielle : Comprendre leurs rôles, leurs structures et leurs applications

Classes abstraites Python : Un guide complet avec des exemples

Tableaux Python

Données JSON Python : Un guide illustré d'exemples

Fonctions lambda Python : Guide pour débutants

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Développer des applications d'IA

Travailler avec Hugging Face

Travailler avec Llama 3

Types d'agents d'intelligence artificielle : Comprendre leurs rôles, leurs structures et leurs applications

Classes abstraites Python : Un guide complet avec des exemples

Tableaux Python

Données JSON Python : Un guide illustré d'exemples

Fonctions lambda Python : Guide pour débutants

Développer des applications d'IA