Aller au contenu principal
DomicileBlogIntelligence artificielle (IA)

Qu'est-ce que le sonnet Claude 3.5 ? Fonctionnement, cas d'utilisation et artefacts

Claude 3.5 Sonnet surpasse GPT-4o et Gemini Pro 1.5 dans plusieurs benchmarks et introduit une nouvelle fonctionnalité intéressante : Artefacts.
Actualisé 4 oct. 2024  · 8 min lire

GPT-4o et Gemini 1.5 Pro ont une sérieuse concurrence : Claude 3.5 Sonnet.

Anthropic a annoncé Claude 3.5 Sonnet comme faisant partie de la grande famille Claude 3.5 - qui sera complétée plus tard cette année, avec la sortie de Claude 3.5 Haiku et Claude 3.5 Opus.

Claude 3.5 Sonnet ne se contente pas de battre GPT-4o et Gemini 1.5 Pro dans plusieurs benchmarks, il introduit également une nouvelle fonctionnalité géniale appelée Artifacts.

Si vous souhaitez en savoir plus sur Claude 3.5 Sonnet, je vous recommande ces articles de blog :

Je suis impatient de vous montrer à quel point la fonction Artefacts est géniale, alors commençons !

Vous souhaitez vous lancer dans l'IA générative ?

Apprenez à travailler avec des LLM en Python directement dans votre navigateur

Commencez Maintenant

Claude 3.5 Sonnet : Premières impressions

J'ai été intrigué par les résultats du benchmark, et je me suis donc rendu directement sur Claude.ai pour tester le nouveau modèle Claude 3.5 Sonnet.

J'ai d'abord demandé à Claude 3.5 Sonnet de créer un graphique à partir des données du tableau ci-dessous :

Claude 3.5 Résultats du benchmark Sonnet

Je pense que je n'ai pas fait beaucoup d'efforts de réflexion pour l'invite que j'ai utilisée - Générerun graphique pour ce tableau - etpourtant le modèle a généré ce diagramme à barres groupées interactif :

Claude 3.5 Sonnet génère des graphiques interactifs.

Claude 3.5 Sonnet a implémenté le graphique comme un composant React en utilisant la bibliothèque Recharts. Nous pouvons voir et copier le code en passant à l'onglet Code dans le coin supérieur droit :

Claude 3.5 Vue du code Sonnet

Une chose qui m'a gêné dans le diagramme à barres généré est que la légende des couleurs en bas chevauche les étiquettes de l'axe des abscisses. En outre, il y a tout simplement trop d'informations à consommer pour un seul graphique. J'ai pensé qu'il serait intéressant d'avoir une infographie distincte pour chaque critère de référence, et j'ai donc lancé le Sonnet de Claude 3.5 avec ceci :

Pour le code de référence, créez une infographie dans laquelle vous ajoutez une très courte explication de ce qu'est le code de référence et de ce qu'il mesure, ainsi qu'un petit graphique de comparaison sur le côté pour montrer comment chaque LLM se classe par rapport à ce code de référence.

Je dois dire que le résultat est assez impressionnant, compte tenu de la mauvaise qualité de mon message :

Infographie Claude 3.5 Sonnet

L'infographie est bien organisée, avec un bon choix de couleurs et de polices de caractères. Je vois déjà de nombreuses applications : grâce à des instructions détaillées, nous pourrions adapter la conception à nos besoins et ajouter des personnalisations spécifiques à une marque, par exemple.

Si vous n'avez pas encore essayé Claude 3.5 Sonnet vous-même, vous vous demandez peut-être quel est ce composant de l'interface utilisateur qui affiche à la fois le graphique et le code. Entrez dans les artefacts.

Artefacts : Nouvelle fonctionnalité de Claude AI

Il est inutile que j'explique ce que sont les artefacts alors que la vidéo officielle le fait bien mieux. La raison pour laquelle je vous encourage à regarder cette vidéo est qu'elle montre comment créer un jeu à défilement latéral en HTML 5 en une minute :

Les artefacts sont si dynamiques !

À première vue, la fonction Artefacts peut sembler n'être qu'une fenêtre ou un onglet de plus dans l'interface. Cependant, Anthropic ne se contente pas d'ajouter un autre moyen d'afficher des informations, elle propose une nouvelle façon d'interagir avec son IA.

Les artefacts vont au-delà des interactions textuelles traditionnelles en introduisant une couche dynamique et interactive. Cela nous permet de visualiser et de manipuler directement les résultats de l'IA, plutôt que de simplement les lire.

Ce changement constitue une évolution notable. Cela suggère une évolution vers une relation plus collaborative avec l'IA, dans laquelle nous pouvons nous engager activement et affiner les résultats de l'IA.

Il sera intéressant de voir comment cette fonctionnalité évoluera et quel sera son impact sur la façon dont nous utiliserons l'IA à l'avenir.

Et ce qui m'enthousiasme, c'est la promesse d'Antrophic de le concevoir pour la collaboration en équipe :

Ce n'est que le début d'une vision plus large pour Claude.ai, qui s'étendra bientôt à la collaboration en équipe. Dans un avenir proche, les équipes, et à terme des organisations entières, pourront centraliser en toute sécurité leurs connaissances, leurs documents et leurs travaux en cours dans un espace partagé, Claude faisant office de coéquipier à la demande.

Anthropic AI

Comment activer et utiliser les artefacts

Pour accéder à Claude Artifacts, vous devez l'activer dans les paramètres. Tout d'abord, cliquez sur les initiales de votre compte, puis sur Feature Preview.

Activation des artefacts Claude

Ensuite, activez les artefacts en plaçant le commutateur sur Activé.

Activation des artefacts Claude

Une fois la fonction activée, vous pouvez la déclencher en demandant à Claude de générer du contenu qui peut être affiché dans un artefact, comme du code, des visualisations de données ou même des maquettes.

Lorsque Claude crée un artefact, celui-ci apparaît dans un panneau séparé de l'interface, divisé en deux onglets :Code et Aperçu. L' onglet Code affiche le résultat brut généré par Claude, tandis que l' ongletAperçu fournit une représentation visuelle ou interactive de ce résultat.

Utilisation des artefacts Claude

Comment accéder à Claude 3.5 Sonnet

La façon la plus simple d'accéder à Claude 3.5 Sonnet est d'aller sur Claude.ai et de s'amuser avec leur interface graphique conviviale :

Interface graphique Claude AI

Claude 3.5 Sonnet est gratuit sur Claude.ai, mais je dois mentionner que j'ai atteint les limites d'utilisation très rapidement (après une dizaine d'invites).

Claude 3.5 Limites d'utilisation du sonnet

Si vous souhaitez utiliser Claude 3.5 Sonnet régulièrement, il ne fait aucun doute que vous devrez acheter un abonnement Pro.

Claude 3.5 Sonnet est également disponible via l'API Anthropic, Vertex AI de Google Cloud et Amazon Bedrock.

Fonctionnement et performances de Claude 3.5 Sonnet

Bien qu'Anthropic n'ait pas dévoilé tous les détails techniques, nous savons que le Claude 3.5 Sonnet est construit sur la base du modèle précédent, le Claude 3 Opus. Il s'agit d'un modèle linguistique de grande taille, c'est-à-dire qu'il a été entraîné sur un ensemble massif de données de texte et de code, ce qui lui permet de comprendre et de générer un langage semblable à celui des humains.

Ce qui distingue Claude 3.5 Sonnet, ce sont ses performances accrues. Il a été affiné et optimisé, ce qui a permis d'apporter des améliorations dans différents domaines.

Claude 3.5 Résultats du benchmark Sonnet

Le raisonnement de haut niveau est depuis longtemps considéré comme une caractéristique de l'intelligence humaine, un domaine dans lequel l'IA a toujours eu du mal à suivre.  Bien qu'il reste encore beaucoup de travail à faire, Claude Sonnet 3.5 démontre des progrès significatifs.

En ce qui concerne les mathématiques, Claude 3.5 Sonnet est légèrement en retrait par rapport à GPT-4o, qui arrive en tête avec un score de 76,6 %. Mais le score de 71,1 % de Claude 3.5 Sonnet est encore très élevé. Cette performance suggère que Claude 3.5 Sonnet a une bonne maîtrise des concepts mathématiques, des formules et du raisonnement logique, ce qui en fait un outil prometteur pour les tâches qui requièrent une expertise mathématique.

Le benchmark BIG-Bench-Hard se concentre sur l'évaluation de la capacité des modèles d'IA à résoudre des problèmes à multiples facettes, à faire preuve d'un raisonnement avancé et à appliquer des connaissances dans différents domaines. Claude 3.5 Sonnet surpasse de manière significative les autres modèles dans ce benchmark, obtenant un score de 93,1%. Cela indique que Claude 3.5 Sonnet possède un haut niveau de compétence pour gérer des tâches complexes, raisonner efficacement dans différents domaines et appliquer ses connaissances avec souplesse à des situations nouvelles.

En ce qui concerne les capacités visuelles, Claude 3.5 Sonnet excelle particulièrement dans le raisonnement mathématique visuel, obtenant un score de 67,7 % au test MathVista, soit une avance significative sur les autres modèles. Claude 3.5 Sonnet obtient également de bons résultats en réponse à des questions visuelles (MMMU) et en questions et réponses visuelles sur des documents (score ANLS), ce qui démontre sa capacité à comprendre et à traiter efficacement des informations visuelles.

Bien que ses performances sur les diagrammes scientifiques et les questions-réponses soient légèrement inférieures à celles de GPT-4o et de Gemini 1.5 Pro, il conserve un taux de précision élevé, supérieur à 90 %. Dans l'ensemble, les résultats mettent en évidence les fortes capacités de Claude 3.5 Sonnet à comprendre des données visuelles et textuelles, ce qui en fait un outil prometteur pour diverses applications nécessitant une compréhension multimodale.

Claude 3.5 Cas d'utilisation de Sonnet

Claude 3.5 Sonnet est le modèle de vision le plus puissant d'Anthropic, et il n'est pas surprenant qu'il réussisse si bien les tâches qui nécessitent un raisonnement visuel, comme l'interprétation et la création de graphiques. Cependant, il est également présenté comme un excellent partenaire de codage ou d'écriture, alors regardons de plus près.

Présentations visuelles

Si vous avez des données à présenter visuellement, Claude 3.5 Sonnet semble pouvoir faire des miracles.

Dans l'exemple d'Anthropic, un professeur de biologie présente au modèle deux graphiques et demande à Claude d'extraire les informations pertinentes pour créer une présentation basée sur Javascript qui utilise reveal-js, un cadre populaire pour créer des présentations HTML. Voyons si la professeure a obtenu les diapositives qu'elle souhaitait :

Partenaire de codage

Supposons que vous soyez un ingénieur logiciel qui essaie d'écrire des tests et de corriger des bogues dans un code qui recadre les images en cercles (pour que les utilisateurs puissent avoir de belles images de profil). Claude 3.5 Sonnet peut-il y contribuer ? Voyons ce qu'il en est :

Partenaire d'écriture

Anthropic présente également Claude 3.5 Sonnet comme un partenaire d'écriture, mais leur exemple ne pourrait pas être plus éloigné d'un cas d'utilisation dans le monde réel - les romans ne sont généralement pas à propos de "crabes chargés de sarcasmes qui vivent sur des récifs en pleine effervescence". Le génogramme créé par Claude est cependant impressionnant et démontre une fois de plus ses étonnantes capacités visuelles.

Comparaison des prix : Sonnet vs. GPT-4o vs. Gemini Pro 1.5

Voyons comment les prix de Claude 3.5 Sonnet se comparent à ceux d'OpenAI et de Google. Bien sûr, c'est une bonne occasion de demander à Claude 3.5 Sonnet de créer un graphique :

Comparaison des prix de Claude AI avec Open AI et Google

Pour un usage personnel, les trois plateformes facturent environ 20 dollars par mois.

Conclusion

Ces dernières années, nous avons tous vu tellement de nouvelles et de percées dans le domaine de l'IA qu'il est devenu difficile de s'enthousiasmer pour les nouvelles versions, en particulier avec les nombreux exemples choisis dans les vidéos de démonstration.

Cependant, je suis réellement enthousiasmé par les capacités visuelles de Claude 3.5 Sonnet et par la fonction Artifacts. Personnellement, je l'essaierai pour le travail et je suivrai son évolution.

Obtenez une certification de haut niveau en matière d'IA

Démontrez que vous pouvez utiliser l'IA de manière efficace et responsable.

FAQ

Claude 3.5 est-il gratuit ?

Alors que Claude.ai offre un accès gratuit limité, l'utilisation régulière de Claude 3.5 Sonnet nécessite généralement un abonnement Pro. L'accès via l'API Anthropic, Amazon Bedrock ou Vertex AI de Google Cloud entraîne des coûts basés sur l'utilisation.

Qu'est-ce que le sonnet Claude 3.5 ?

Claude 3.5 Sonnet est le dernier modèle d'Anthropic, conçu pour améliorer les performances, notamment en matière de raisonnement, de codage et de sécurité. Il surpasse les modèles précédents et ses concurrents dans divers tests de référence.

En quoi Claude 3.5 Sonnet est-il différent des autres modèles ?

Sonnet se distingue par ses capacités de raisonnement avancées, ses solides compétences en matière de codage et ses fonctions de sécurité renforcées. Il introduit également une nouvelle fonctionnalité appelée "Artifacts", qui permet un traitement plus efficace des données.

Que sont les artefacts dans Claude 3.5 Sonnet ?

Artifacts est une nouvelle fonctionnalité de Claude 3.5 Sonnet qui vous permet d'interagir et de manipuler les sorties du modèle, telles que le code, le texte ou les données, directement dans l'interface de chat.

Comment puis-je utiliser les artefacts dans Claude 3.5 Sonnet ?

Vous pouvez activer les artefacts dans les paramètres de prévisualisation des fonctionnalités de l'interface de chat de Claude.ai. Une fois cette option activée, vous pouvez interagir avec les résultats générés, par exemple en modifiant le code ou en visualisant les données directement dans le chat.


Photo of Alex Olteanu
Author
Alex Olteanu
LinkedIn

Je suis l'homme de tous les métiers, le maître de Python, du marketing et de la stratégie de contenu, du référencement, de la rédaction, de l'écriture. Technicien - j'ai donné des cours sur Python, les statistiques et les probabilités. Mais j'ai également publié un roman primé. Montage vidéo et étalonnage dans DaVinci.

Sujets

Apprenez l'IA avec ces cours !

Track

Principes de base de l'IA pour les entreprises

11 heures hr
Accélérez votre parcours en matière d'intelligence artificielle, conquêtez ChatGPT et développez une stratégie complète d'intelligence artificielle.
See DetailsRight Arrow
Start Course
Certification disponible

Course

L'IA générative au service des entreprises

1 hr
7K
Découvrez le rôle que l'intelligence artificielle générative joue aujourd'hui et jouera à l'avenir dans un environnement professionnel.
Voir plusRight Arrow