Track
Was ist Claude 3.5 Sonnet? Funktionsweise, Anwendungsfälle und Artefakte
GPT-4o und Gemini 1.5 Pro haben ernsthafte Konkurrenz: Claude 3.5 Sonett.
Anthropic kündigte Claude 3.5 Sonnet als Teil der größeren Claude 3.5-Familie an, die später in diesem Jahr mit der Veröffentlichung von Claude 3.5 Haiku und Claude 3.5 Opus komplettiert wird.
Claude 3.5 Sonnet schlägt nicht nur GPT-4o und Gemini 1.5 Pro in mehreren Benchmarks, sondern führt auch eine neue, fantastische Funktion namens Artifacts ein.
Wenn du mehr über Claude 3.5 Sonnet lesen möchtest, empfehle ich dir diese Blogbeiträge:
Ich freue mich darauf, dir zu zeigen, wie cool das Artefakt-Feature ist, also lass uns anfangen!
Willst du mit generativer KI beginnen?
Lerne, wie du mit LLMs in Python direkt in deinem Browser arbeiten kannst
Claude 3.5 Sonett: Erste Eindrücke
Die Benchmark-Ergebnisse haben mich neugierig gemacht, also bin ich direkt zu Claude.ai gegangen, um das neue Modell Claude 3.5 Sonnet zu testen.
Zuerst habe ich Claude 3.5 Sonnet gebeten, ein Diagramm mit den Daten in der Tabelle unten zu erstellen:
Ich glaube, ich habe nicht viel über die Aufforderung nachgedacht, die ich verwendet habe - Erstelleein Diagramm für diese Tabelle - undtrotzdem hat das Modell dieses interaktive gruppierte Balkendiagramm erstellt:
Claude 3.5 Sonnet hat das Diagramm als React-Komponente mit der Recharts-Bibliothek implementiert. Wir können den Code sehen und kopieren, indem wir oben rechts auf die Registerkarte Code wechseln:
Eine Sache, die mich an dem erstellten Balkendiagramm gestört hat, ist, dass sich die Farblegende am unteren Rand mit den Beschriftungen der x-Achse überschneidet. Außerdem gibt es einfach zu viele Informationen, um sie in einer einzigen Grafik zu verarbeiten. Ich dachte, es wäre eine coole Idee, für jeden Benchmark eine eigene Infografik zu erstellen, also habe ich Claude 3.5 Sonnet mit dieser Infografik eingeleitet:
Erstelle für den Code-Benchmark eine Infografik, in der du kurz erklärst, was der Benchmark ist und was er misst, und eine kleine Vergleichsgrafik an der Seite erstellst, die zeigt, wie jeder LLM bei diesem Benchmark abschneidet
Ich muss sagen, das Ergebnis war ziemlich beeindruckend, wenn man bedenkt, wie schlecht meine Eingabeaufforderung war:
Die Infografik ist gut organisiert, mit einer guten Auswahl an Farben und Schrifteigenschaften. Ich sehe hier schon so viele Anwendungsmöglichkeiten - mit einer detaillierten Eingabeaufforderung könnten wir das Design auf unsere Bedürfnisse zuschneiden und zum Beispiel markenspezifische Anpassungen vornehmen.
Wenn du Claude 3.5 Sonnet noch nicht selbst ausprobiert hast, fragst du dich vielleicht, was diese UI-Komponente ist, die sowohl die Grafik als auch den Code anzeigt. Gib Artefakte ein.
Artefakte: Die neue Funktion von Claude AI
Es macht keinen Sinn, dass ich erkläre, was Artefakte sind, wenn das offizielle Video es so viel besser macht. Der Grund, warum ich dir empfehle, dir das anzusehen, ist, weil sie zeigen, wie man in einer Minute ein Side-Scrolling-Spiel in HTML 5 erstellt:
Artefakte fühlen sich so dynamisch an!
Auf den ersten Blick mag die Funktion "Artefakte" wie ein weiteres Fenster oder eine weitere Registerkarte in der Benutzeroberfläche erscheinen. Anthropic bietet jedoch nicht nur eine weitere Möglichkeit, Informationen anzuzeigen, sondern auch eine neue Art der Interaktion mit seiner KI.
Artefakte gehen über die traditionelle textbasierte Interaktion hinaus, indem sie eine dynamische, interaktive Ebene einführen. So können wir die Ergebnisse der KI direkt visualisieren und manipulieren, anstatt sie nur zu lesen.
Diese Veränderung ist eine bemerkenswerte Entwicklung. Das deutet auf eine kollaborative Beziehung mit der KI hin, bei der wir uns aktiv einbringen und die Ergebnisse der KI verbessern können.
Es wird interessant sein zu sehen, wie sich diese Funktion entwickelt und wie sie sich auf die Art und Weise auswirkt, wie wir KI in Zukunft einsetzen.
Und was mich begeistert, ist das Versprechen von Antrophic, es für die Zusammenarbeit im Team zu entwickeln:
Das ist nur der Anfang einer umfassenderen Vision für Claude.ai, die bald erweitert werden soll, um die Zusammenarbeit im Team zu unterstützen. In naher Zukunft werden Teams - und schließlich ganze Organisationen - in der Lage sein, ihr Wissen, ihre Dokumente und ihre laufende Arbeit sicher in einem gemeinsamen Raum zu zentralisieren, wobei Claude als Teamkollege auf Abruf fungiert.
Anthropic AI
Wie man Artefakte aktiviert und verwendet
Um auf Claude Artifacts zuzugreifen, musst du sie in den Einstellungen aktivieren. Klicke zunächst auf die Initialen deines Kontos und dann auf Funktionsvorschau.
Aktiviere dann die Artefakte, indem du den Schalter umlegst auf Ein.
Einmal aktiviert, kannst du die Funktion auslösen, indem du Claude aufforderst, Inhalte zu erstellen, die in einem Artefakt angezeigt werden können, wie z. B. Code, Datenvisualisierungen oder sogar Mockups.
Wenn Claude ein Artefakt erstellt, erscheint es in einem separaten Bereich der Benutzeroberfläche, der in die RegisterkartenCode und Vorschau unterteilt ist . Die Registerkarte Code zeigt die von Claude erzeugte Rohausgabe an, während die RegisterkarteVorschau eine visuelle oder interaktive Darstellung dieser Ausgabe bietet.
Wie man auf Claude 3.5 Sonnet zugreift
Der einfachste Weg, um auf Claude 3.5 Sonnet zuzugreifen, ist, zu Claude.ai zu gehen und sich in der freundlichen grafischen Benutzeroberfläche zu vergnügen:
Claude 3.5 Sonnet kann kostenlos auf Claude.ai genutzt werden, aber ich muss erwähnen, dass ich sehr schnell an die Grenzen der Nutzung gestoßen bin (nach etwa zehn Aufforderungen).
Wenn du Claude 3.5 Sonnet regelmäßig nutzen willst, musst du zweifelsohne ein Pro-Abonnement kaufen.
Claude 3.5 Sonnet ist auch über die Anthropic API, Google Clouds Vertex AI und Amazon Bedrock verfügbar.
Wie Claude 3.5 Sonnet funktioniert und wirkt
Anthropic hat zwar noch keine vollständigen technischen Details veröffentlicht, aber wir wissen, dass Claude 3.5 Sonnet auf dem Vorgängermodell Claude 3 Opus aufbaut. Es ist ein großes Sprachmodell, d.h. es wurde auf einem riesigen Datensatz von Text und Code trainiert, so dass es menschenähnliche Sprache verstehen und erzeugen kann.
Was die Claude 3.5 Sonnet auszeichnet, ist ihre verbesserte Leistung. Sie wurde feinabgestimmt und optimiert, was zu Verbesserungen in verschiedenen Bereichen geführt hat.
Das logische Denken auf hohem Niveau gilt seit langem als Markenzeichen menschlicher Intelligenz - eine Grenze, mit der die KI bisher nur schwer Schritt halten konnte. Es gibt zwar noch viel zu tun, aber Claude Sonnet 3.5 zeigt einen deutlichen Fortschritt.
In Mathe liegt Claude 3.5 Sonnet leicht hinter GPT-4o zurück, das mit 76,6 % an der Spitze liegt. Aber Claude 3.5 Sonnets Wert von 71,1% ist immer noch bemerkenswert hoch. Diese Leistung deutet darauf hin, dass Claude 3.5 Sonnet mathematische Konzepte, Formeln und logisches Denken gut beherrscht, was es zu einem vielversprechenden Werkzeug für Aufgaben macht, die mathematisches Fachwissen erfordern.
Der BIG-Bench-Hard-Benchmark konzentriert sich darauf, die Fähigkeit von KI-Modellen zu bewerten, vielschichtige Probleme zu lösen, fortschrittliches Denken zu demonstrieren und Wissen in verschiedenen Domänen anzuwenden. Claude 3.5 Sonnet schneidet in diesem Benchmark deutlich besser ab als andere Modelle und erreicht eine Punktzahl von 93,1 %. Dies zeigt, dass Claude 3.5 Sonnet über ein hohes Maß an Fähigkeiten verfügt, komplexe Aufgaben zu bewältigen, effektiv über verschiedene Themenbereiche hinweg zu denken und sein Wissen flexibel auf neue Situationen anzuwenden.
Wenn es um visuelle Fähigkeiten geht, glänzt Claude 3.5 Sonnet vor allem im visuellen mathematischen Denken: Mit 67,7 % im MathVista-Test hat sie einen deutlichen Vorsprung vor den anderen Modellen. Claude 3.5 Sonnet schneidet auch bei der Beantwortung visueller Fragen (MMMU) und bei visuellen Q&A-Dokumenten (ANLS-Punktzahl) gut ab und beweist damit seine Fähigkeit, visuelle Informationen effektiv zu verstehen und zu verarbeiten.
Auch wenn die Leistung bei wissenschaftlichen Diagrammen und Q&A-Tabellen etwas geringer ist als bei GPT-4o und Gemini 1.5 Pro, liegt die Genauigkeit immer noch bei über 90%. Insgesamt unterstreichen die Ergebnisse die starken Fähigkeiten von Claude 3.5 Sonnet, sowohl visuelle als auch textuelle Daten zu verstehen, was es zu einem vielversprechenden Werkzeug für verschiedene Anwendungen macht, die multimodales Verstehen erfordern.
Claude 3.5 Sonnet Use Cases
Claude 3.5 Sonnet ist das stärkste Sehmodell von Anthropic und es ist keine Überraschung, dass es bei Aufgaben, die visuelles Denken erfordern, wie das Interpretieren und Erstellen von Diagrammen, so gut abschneidet. Es wird aber auch als großartiger Programmier- oder Schreibpartner vermarktet, also sehen wir uns das mal genauer an.
Visuelle Präsentationen
Wenn du Daten hast, die du visuell präsentieren musst, scheint Claude 3.5 Sonnet wirklich zaubern zu können.
In Anthropics Beispiel fordert ein Biologieprofessor das Modell mit zwei Graphen auf und bittet Claude, relevante Informationen zu extrahieren, um eine Javascript-basierte Präsentation zu erstellen, die reveal-js nutzt, ein beliebtes Framework zur Erstellung von HTML-Präsentationen. Mal sehen, ob die Professorin die Folien bekommen hat, die sie wollte:
Kodierpartner
Angenommen, du bist ein Softwareentwickler, der versucht, Tests zu schreiben und Fehler in einem Code zu beheben, der Bilder zu Kreisen zuschneidet (damit die Nutzer schöne Profilbilder haben). Kann Claude 3.5 Sonnet dabei helfen? Schauen wir mal:
Schreibpartner
Anthropic stellt auch Claude 3.5 Sonnet als Schreibpartner vor, aber ihr Beispiel könnte nicht weiter von einem realen Anwendungsfall entfernt sein - Romane handeln in der Regel nicht von "sarkastischen Krabben, die auf belebten Riffen leben". Das Genogramm, das Claude erstellt, ist jedoch großartig und zeigt einmal mehr seine erstaunlichen visuellen Fähigkeiten.
Preisvergleich: Sonett vs. GPT-4o vs. Gemini Pro 1.5
Mal sehen, wie die Preise von Claude 3.5 Sonnet im Vergleich zu denen von OpenAI und Google sind. Das ist natürlich eine gute Gelegenheit, Claude 3.5 Sonnet zu bitten, ein Diagramm zu erstellen:
Für die private Nutzung verlangen alle drei Plattformen etwa 20$/Monat.
Fazit
In den letzten Jahren haben wir alle so viele Neuigkeiten und Durchbrüche im Bereich der KI gesehen, dass es schwieriger geworden ist, sich für neue Veröffentlichungen zu begeistern - vor allem, weil es so viele herausgepickte Beispiele in Demonstrationsvideos gibt.
Aber ich bin wirklich begeistert von den visuellen Fähigkeiten von Claude 3.5 Sonnet und der Funktion "Artefakte". Ich werde es persönlich für die Arbeit ausprobieren und die Entwicklung im Auge behalten.
Verdiene eine Top-KI-Zertifizierung
FAQs
Ist Claude 3.5 kostenlos?
Während Claude.ai einen begrenzten kostenlosen Zugang bietet, ist für die regelmäßige Nutzung von Claude 3.5 Sonnet normalerweise ein Pro-Abonnement erforderlich. Für den Zugang über die Anthropic API, Amazon Bedrock oder Google Clouds Vertex AI fallen nutzungsabhängige Kosten an.
Was ist Claude 3.5 Sonnet?
Claude 3.5 Sonnet ist das neueste Modell von Anthropic, das für eine verbesserte Leistung entwickelt wurde, vor allem in den Bereichen Argumentation, Codierung und Sicherheit. Er übertrifft seine Vorgängermodelle und Konkurrenten in verschiedenen Benchmarks.
Wie unterscheidet sich die Claude 3.5 Sonnet von anderen Modellen?
Sonnet zeichnet sich durch seine fortschrittlichen Argumentationsfähigkeiten, seine starken Programmierfähigkeiten und seine erweiterten Sicherheitsfunktionen aus. Außerdem wird eine neue Funktion namens "Artefakte" eingeführt, die eine effizientere Datenverarbeitung ermöglicht.
Was sind Artefakte in Claude 3.5 Sonnet?
Artefakte ist eine neue Funktion in Claude 3.5 Sonnet, mit der du direkt in der Chat-Oberfläche mit Ausgaben des Modells wie Code, Text oder Daten interagieren und diese bearbeiten kannst.
Wie kann ich Artefakte in Claude 3.5 Sonnet verwenden?
Du kannst Artefakte in den Einstellungen für die Funktionsvorschau in der Claude.ai-Chatoberfläche aktivieren. Sobald diese Funktion aktiviert ist, kannst du mit den erzeugten Ergebnissen interagieren, z. B. Code bearbeiten oder Datenvisualisierungen direkt im Chat anzeigen.
Lerne KI mit diesen Kursen!
Course
Generative KI für Unternehmen
Track