Qu'est-ce que le sonnet Claude 3.5 ? Fonctionnement, cas d'utilisation et artefacts

Claude 3.5 Sonnet surpasse GPT-4o et Gemini Pro 1.5 dans plusieurs benchmarks et introduit une nouvelle fonctionnalité intéressante : Artefacts.

Actualisé 4 oct. 2024 · 8 min lire

GPT-4o et Gemini 1.5 Pro ont une sérieuse concurrence : Claude 3.5 Sonnet.

Anthropic a annoncé Claude 3.5 Sonnet comme faisant partie de la grande famille Claude 3.5 - qui sera complétée plus tard cette année, avec la sortie de Claude 3.5 Haiku et Claude 3.5 Opus.

Claude 3.5 Sonnet ne se contente pas de battre GPT-4o et Gemini 1.5 Pro dans plusieurs benchmarks, il introduit également une nouvelle fonctionnalité géniale appelée Artifacts.

Si vous souhaitez en savoir plus sur Claude 3.5 Sonnet, je vous recommande ces articles de blog :

Je suis impatient de vous montrer à quel point la fonction Artefacts est géniale, alors commençons !

Vous souhaitez vous lancer dans l'IA générative ?

Apprenez à travailler avec des LLM en Python directement dans votre navigateur

Commencez maintenant

Claude 3.5 Sonnet : Premières impressions

J'ai été intrigué par les résultats du benchmark, et je me suis donc rendu directement sur Claude.ai pour tester le nouveau modèle Claude 3.5 Sonnet.

J'ai d'abord demandé à Claude 3.5 Sonnet de créer un graphique à partir des données du tableau ci-dessous :

Je pense que je n'ai pas fait beaucoup d'efforts de réflexion pour l'invite que j'ai utilisée - Générerun graphique pour ce tableau - etpourtant le modèle a généré ce diagramme à barres groupées interactif :

Claude 3.5 Sonnet a implémenté le graphique comme un composant React en utilisant la bibliothèque Recharts. Nous pouvons voir et copier le code en passant à l'onglet Code dans le coin supérieur droit :

Une chose qui m'a gêné dans le diagramme à barres généré est que la légende des couleurs en bas chevauche les étiquettes de l'axe des abscisses. En outre, il y a tout simplement trop d'informations à consommer pour un seul graphique. J'ai pensé qu'il serait intéressant d'avoir une infographie distincte pour chaque critère de référence, et j'ai donc lancé le Sonnet de Claude 3.5 avec ceci :

Pour le code de référence, créez une infographie dans laquelle vous ajoutez une très courte explication de ce qu'est le code de référence et de ce qu'il mesure, ainsi qu'un petit graphique de comparaison sur le côté pour montrer comment chaque LLM se classe par rapport à ce code de référence.

Je dois dire que le résultat est assez impressionnant, compte tenu de la mauvaise qualité de mon message :

L'infographie est bien organisée, avec un bon choix de couleurs et de polices de caractères. Je vois déjà de nombreuses applications : grâce à des instructions détaillées, nous pourrions adapter la conception à nos besoins et ajouter des personnalisations spécifiques à une marque, par exemple.

Si vous n'avez pas encore essayé Claude 3.5 Sonnet vous-même, vous vous demandez peut-être quel est ce composant de l'interface utilisateur qui affiche à la fois le graphique et le code. Entrez dans les artefacts.

Artefacts : Nouvelle fonctionnalité de Claude AI

Il est inutile que j'explique ce que sont les artefacts alors que la vidéo officielle le fait bien mieux. La raison pour laquelle je vous encourage à regarder cette vidéo est qu'elle montre comment créer un jeu à défilement latéral en HTML 5 en une minute :

Les artefacts sont si dynamiques !

À première vue, la fonction Artefacts peut sembler n'être qu'une fenêtre ou un onglet de plus dans l'interface. Cependant, Anthropic ne se contente pas d'ajouter un autre moyen d'afficher des informations, elle propose une nouvelle façon d'interagir avec son IA.

Les artefacts vont au-delà des interactions textuelles traditionnelles en introduisant une couche dynamique et interactive. Cela nous permet de visualiser et de manipuler directement les résultats de l'IA, plutôt que de simplement les lire.

Ce changement constitue une évolution notable. Cela suggère une évolution vers une relation plus collaborative avec l'IA, dans laquelle nous pouvons nous engager activement et affiner les résultats de l'IA.

Il sera intéressant de voir comment cette fonctionnalité évoluera et quel sera son impact sur la façon dont nous utiliserons l'IA à l'avenir.

Et ce qui m'enthousiasme, c'est la promesse d'Antrophic de le concevoir pour la collaboration en équipe :

Ce n'est que le début d'une vision plus large pour Claude.ai, qui s'étendra bientôt à la collaboration en équipe. Dans un avenir proche, les équipes, et à terme des organisations entières, pourront centraliser en toute sécurité leurs connaissances, leurs documents et leurs travaux en cours dans un espace partagé, Claude faisant office de coéquipier à la demande.
Anthropic AI

Comment activer et utiliser les artefacts

Pour accéder à Claude Artifacts, vous devez l'activer dans les paramètres. Tout d'abord, cliquez sur les initiales de votre compte, puis sur Feature Preview.

Ensuite, activez les artefacts en plaçant le commutateur sur Activé.

Une fois la fonction activée, vous pouvez la déclencher en demandant à Claude de générer du contenu qui peut être affiché dans un artefact, comme du code, des visualisations de données ou même des maquettes.

Lorsque Claude crée un artefact, celui-ci apparaît dans un panneau séparé de l'interface, divisé en deux onglets :Code et Aperçu. L' onglet Code affiche le résultat brut généré par Claude, tandis que l' ongletAperçu fournit une représentation visuelle ou interactive de ce résultat.

Comment accéder à Claude 3.5 Sonnet

La façon la plus simple d'accéder à Claude 3.5 Sonnet est d'aller sur Claude.ai et de s'amuser avec leur interface graphique conviviale :

Claude 3.5 Sonnet est gratuit sur Claude.ai, mais je dois mentionner que j'ai atteint les limites d'utilisation très rapidement (après une dizaine d'invites).

Si vous souhaitez utiliser Claude 3.5 Sonnet régulièrement, il ne fait aucun doute que vous devrez acheter un abonnement Pro.

Claude 3.5 Sonnet est également disponible via l'API Anthropic, Vertex AI de Google Cloud et Amazon Bedrock.

Fonctionnement et performances de Claude 3.5 Sonnet

Bien qu'Anthropic n'ait pas dévoilé tous les détails techniques, nous savons que le Claude 3.5 Sonnet est construit sur la base du modèle précédent, le Claude 3 Opus. Il s'agit d'un modèle linguistique de grande taille, c'est-à-dire qu'il a été entraîné sur un ensemble massif de données de texte et de code, ce qui lui permet de comprendre et de générer un langage semblable à celui des humains.

Ce qui distingue Claude 3.5 Sonnet, ce sont ses performances accrues. Il a été affiné et optimisé, ce qui a permis d'apporter des améliorations dans différents domaines.

Le raisonnement de haut niveau est depuis longtemps considéré comme une caractéristique de l'intelligence humaine, un domaine dans lequel l'IA a toujours eu du mal à suivre. Bien qu'il reste encore beaucoup de travail à faire, Claude Sonnet 3.5 démontre des progrès significatifs.

En ce qui concerne les mathématiques, Claude 3.5 Sonnet est légèrement en retrait par rapport à GPT-4o, qui arrive en tête avec un score de 76,6 %. Mais le score de 71,1 % de Claude 3.5 Sonnet est encore très élevé. Cette performance suggère que Claude 3.5 Sonnet a une bonne maîtrise des concepts mathématiques, des formules et du raisonnement logique, ce qui en fait un outil prometteur pour les tâches qui requièrent une expertise mathématique.

Le benchmark BIG-Bench-Hard se concentre sur l'évaluation de la capacité des modèles d'IA à résoudre des problèmes à multiples facettes, à faire preuve d'un raisonnement avancé et à appliquer des connaissances dans différents domaines. Claude 3.5 Sonnet surpasse de manière significative les autres modèles dans ce benchmark, obtenant un score de 93,1%. Cela indique que Claude 3.5 Sonnet possède un haut niveau de compétence pour gérer des tâches complexes, raisonner efficacement dans différents domaines et appliquer ses connaissances avec souplesse à des situations nouvelles.

En ce qui concerne les capacités visuelles, Claude 3.5 Sonnet excelle particulièrement dans le raisonnement mathématique visuel, obtenant un score de 67,7 % au test MathVista, soit une avance significative sur les autres modèles. Claude 3.5 Sonnet obtient également de bons résultats en réponse à des questions visuelles (MMMU) et en questions et réponses visuelles sur des documents (score ANLS), ce qui démontre sa capacité à comprendre et à traiter efficacement des informations visuelles.

Bien que ses performances sur les diagrammes scientifiques et les questions-réponses soient légèrement inférieures à celles de GPT-4o et de Gemini 1.5 Pro, il conserve un taux de précision élevé, supérieur à 90 %. Dans l'ensemble, les résultats mettent en évidence les fortes capacités de Claude 3.5 Sonnet à comprendre des données visuelles et textuelles, ce qui en fait un outil prometteur pour diverses applications nécessitant une compréhension multimodale.

Claude 3.5 Cas d'utilisation de Sonnet

Claude 3.5 Sonnet est le modèle de vision le plus puissant d'Anthropic, et il n'est pas surprenant qu'il réussisse si bien les tâches qui nécessitent un raisonnement visuel, comme l'interprétation et la création de graphiques. Cependant, il est également présenté comme un excellent partenaire de codage ou d'écriture, alors regardons de plus près.

Présentations visuelles

Si vous avez des données à présenter visuellement, Claude 3.5 Sonnet semble pouvoir faire des miracles.

Dans l'exemple d'Anthropic, un professeur de biologie présente au modèle deux graphiques et demande à Claude d'extraire les informations pertinentes pour créer une présentation basée sur Javascript qui utilise reveal-js, un cadre populaire pour créer des présentations HTML. Voyons si la professeure a obtenu les diapositives qu'elle souhaitait :

Comparaison des prix : Sonnet vs. GPT-4o vs. Gemini Pro 1.5

Voyons comment les prix de Claude 3.5 Sonnet se comparent à ceux d'OpenAI et de Google. Bien sûr, c'est une bonne occasion de demander à Claude 3.5 Sonnet de créer un graphique :

Pour un usage personnel, les trois plateformes facturent environ 20 dollars par mois.

Conclusion

Ces dernières années, nous avons tous vu tellement de nouvelles et de percées dans le domaine de l'IA qu'il est devenu difficile de s'enthousiasmer pour les nouvelles versions, en particulier avec les nombreux exemples choisis dans les vidéos de démonstration.

Cependant, je suis réellement enthousiasmé par les capacités visuelles de Claude 3.5 Sonnet et par la fonction Artifacts. Personnellement, je l'essaierai pour le travail et je suivrai son évolution.

Obtenez une certification de haut niveau en matière d'IA

Démontrez que vous pouvez utiliser l'IA de manière efficace et responsable.

Obtenez une certification, faites-vous embaucher

Claude 3.5 est-il gratuit ?