Saltar al contenido principal

¿Qué es el Soneto Claude 3.5? Cómo funciona, casos de uso y artefactos

Claude 3.5 Sonnet supera a GPT-4o y Gemini Pro 1.5 en varias pruebas de rendimiento e introduce una nueva función muy interesante: Artefactos.
Actualizado 29 jul 2024  · 8 min de lectura

GPT-4o y Gemini 1.5 Pro tienen una seria competencia: Soneto Claude 3.5.

Anthropic anunció Claude 3.5 Sonnet como parte de la gran familia Claude 3.5, que se completará a finales de este año con el lanzamiento de Claude 3.5 Haiku y Claude 3.5 Opus.

Claude 3.5 Sonnet no sólo supera a GPT-4o y Gemini 1.5 Pro en varios benchmarks, sino que también introduce una nueva función impresionante llamada Artefactos.

Si quieres leer más sobre el Soneto Claude 3.5, te recomiendo estas entradas del blog:

Estoy deseando enseñarte lo genial que es la función Artefactos, ¡así que empecemos!

Soneto Claude 3.5: Primeras impresiones

Me intrigaron los resultados del benchmark, así que fui directamente a Claude.ai para probar el nuevo modelo Claude 3.5 Sonnet.

Primero pedí a Claude 3.5 Sonnet que creara un gráfico utilizando los datos de la tabla siguiente:

Claude 3.5 Resultados de la prueba comparativa Sonnet

Creo que no me esforcé mucho en pensar en la instrucción que utilicé -Generaun gráfico para esta tabla- y, sin embargo, el modelo generó este gráfico de barras agrupadas interactivo:

Claude 3.5 Sonnet genera gráficos interactivos.

Claude 3.5 Sonnet implementó el gráfico como un componente React utilizando la biblioteca Recharts. Podemos ver y copiar el código cambiando a la pestaña Código de la esquina superior derecha:

Claude 3.5 Vista del código de Sonnet

Una cosa que me molestó del gráfico de barras generado es que la leyenda de colores de la parte inferior se solapa con las etiquetas del eje x. Además, hay demasiada información que consumir para un solo gráfico. Pensé que sería una buena idea tener una infografía separada para cada punto de referencia, así que incité a Claude 3.5 Sonnet con esto:

Para el punto de referencia del código, genera una infografía en la que añadas una explicación muy breve sobre qué es el punto de referencia y qué mide, y un pequeño gráfico comparativo al lado para mostrar cómo puntúa cada LLM en ese punto de referencia.

Tengo que decir que el resultado fue bastante impresionante, teniendo en cuenta lo malo que era mi pronóstico:

Infografía del Soneto Claude 3.5

La infografía está bien organizada, con una buena elección de colores y propiedades tipográficas. Ya veo muchas aplicaciones aquí: con indicaciones detalladas, podríamos adaptar el diseño a nuestras necesidades y añadir personalizaciones específicas de la marca, por ejemplo.

Si aún no has probado Claude 3.5 Sonnet por ti mismo, quizá te preguntes qué es ese componente de la interfaz de usuario que muestra tanto el gráfico como el código. Entra en Artefactos.

Artefactos: Nueva función de Claude AI

No tiene sentido que explique qué son los Artefactos cuando el vídeo oficial lo hace mucho mejor. La razón por la que te animo a verlo es porque muestran cómo crear un juego de desplazamiento lateral en HTML 5 en un minuto:

¡Los artefactos son tan dinámicos!

A primera vista, la función Artefactos puede parecer una ventana o pestaña más de la interfaz. Sin embargo, Anthropic no se limita a añadir otra forma de mostrar la información, sino que proporciona una nueva forma de interactuar con su IA.

Los artefactos van más allá de las interacciones tradicionales basadas en texto al introducir una capa dinámica e interactiva. Esto nos permite visualizar y manipular directamente los resultados de la IA, en lugar de limitarnos a leerlos.

Este cambio es un avance notable. Sugiere un cambio hacia una relación más colaborativa con la IA, en la que podamos participar activamente y perfeccionar los resultados de la IA.

Será interesante ver cómo evoluciona esta función y cómo influye en la forma en que utilizaremos la IA en el futuro.

Y lo que me entusiasma es la promesa de Antrophic de diseñarlo para la colaboración en equipo:

Es sólo el principio de una visión más amplia de Claude.ai, que pronto se ampliará para apoyar la colaboración en equipo. En un futuro próximo, los equipos -y con el tiempo organizaciones enteras- podrán centralizar de forma segura sus conocimientos, documentos y trabajo en curso en un espacio compartido, en el que Claude actuará como compañero de equipo a petición.

Anthropic AI

Cómo activar y utilizar los Artefactos

Para acceder a Claude Artifacts, tendrás que activarlo en la configuración. Primero, haz clic en las iniciales de tu cuenta y, a continuación, en Vista previa de funciones.

Activar artefactos Claude

A continuación, activa los Artefactos cambiando el conmutador a Activar.

Activar artefactos Claude

Una vez activada, puedes activar la función pidiendo a Claude que genere contenido que pueda mostrarse en un Artefacto, como código, visualizaciones de datos o incluso maquetas.

Cuando Claude crea un Artefacto, éste aparece en un panel independiente dentro de la interfaz, dividido en las pestañasCódigo y Vista previa. La pestaña Código muestra la salida bruta generada por Claude, mientras que la pestañaVista previa proporciona una representación visual o interactiva de esa salida.

Utilizar artefactos Claude

Cómo acceder al Soneto Claude 3.5

La forma más sencilla de acceder al Soneto Claude 3.5 es ir a Claude.ai y divertirte en su amigable interfaz gráfica de usuario:

Interfaz gráfica de usuario Claude AI

El Soneto Claude 3.5 es de uso gratuito en Claude.ai, pero debo mencionar que alcancé los límites de uso muy rápidamente (después de unos diez avisos).

Claude 3.5 Límites de uso del Sonnet

Si quieres utilizar Claude 3.5 Sonnet con regularidad, no hay duda de que tendrás que comprar una suscripción Pro.

Claude 3.5 Sonnet también está disponible a través de la API Antrópica, Vertex AI de Google Cloud y Amazon Bedrock.

Cómo funciona y se comporta el Sonnet Claude 3.5

Aunque Anthropic no ha hecho públicos todos los detalles técnicos, sabemos que Claude 3.5 Sonnet se basa en su modelo anterior, Claude 3 Opus. Es un gran modelo lingüístico, lo que significa que está entrenado en un conjunto masivo de datos de texto y código, lo que le permite comprender y generar un lenguaje similar al humano.

Lo que diferencia al Claude 3.5 Sonnet es su rendimiento mejorado. Se ha afinado y optimizado, lo que ha dado lugar a mejoras en diversas áreas.

Claude 3.5 Resultados de la prueba comparativa Sonnet

El razonamiento de nivel graduado se considera desde hace tiempo una característica distintiva de la inteligencia humana, una frontera en la que la IA ha luchado tradicionalmente por seguir el ritmo.  Aunque todavía queda mucho trabajo por hacer, el Soneto Claude 3.5 demuestra un progreso significativo.

En cuanto a las matemáticas, Claude 3.5 Sonnet va ligeramente por detrás de GPT-4o, que va en cabeza con una puntuación del 76,6%. Pero la puntuación de 71,1% de Claude 3.5 Sonnet sigue siendo notablemente alta. Este rendimiento sugiere que Claude 3.5 Sonnet tiene una sólida comprensión de los conceptos matemáticos, las fórmulas y el razonamiento lógico, lo que la convierte en una herramienta prometedora para tareas que requieran conocimientos matemáticos.

El punto de referencia BIG-Bench-Hard se centra en evaluar la capacidad de los modelos de IA para abordar problemas polifacéticos, demostrar un razonamiento avanzado y aplicar conocimientos en varios dominios. Claude 3.5 Sonnet supera significativamente a otros modelos en esta prueba comparativa, alcanzando una puntuación del 93,1%. Esto indica que el Soneto Claude 3.5 posee un alto nivel de competencia para manejar tareas complejas, razonar eficazmente en diferentes áreas temáticas y aplicar sus conocimientos con flexibilidad a situaciones novedosas.

En cuanto a las capacidades visuales, Claude 3.5 Sonnet destaca especialmente en razonamiento matemático visual, con una puntuación del 67,7% en la prueba MathVista, una ventaja significativa sobre los demás modelos. Claude 3.5 Sonnet también obtiene buenos resultados en la respuesta a preguntas visuales (MMMU) y en las preguntas y respuestas visuales sobre documentos (puntuación ANLS), lo que demuestra su capacidad para comprender y procesar eficazmente la información visual.

Aunque su rendimiento en diagramas científicos y preguntas y respuestas de gráficos es ligeramente inferior al de GPT-4o y Gemini 1.5 Pro, sigue manteniendo un alto índice de precisión superior al 90%. En general, los resultados ponen de relieve la gran capacidad de Claude 3.5 Sonnet para comprender datos tanto visuales como textuales, lo que la convierte en una herramienta prometedora para diversas aplicaciones que requieran comprensión multimodal.

Claude 3.5 Casos de uso de Sonnet

Claude 3.5 Sonnet es el modelo de visión más potente de Anthropic, y no es de extrañar que lo haga tan bien en tareas que requieren razonamiento visual, como interpretar y crear gráficos. Sin embargo, también se comercializa como un gran compañero de codificación o escritura, así que echemos un vistazo más de cerca.

Presentaciones visuales

Si tienes datos que necesitas presentar visualmente, parece que Claude 3.5 Sonnet puede hacer realmente magia.

En el ejemplo de Anthropic, un profesor de biología solicita al modelo dos gráficos y pide a Claude que extraiga la información relevante para crear una presentación basada en Javascript que utiliza reveal-js, un popular framework para crear presentaciones HTML. Veamos si la profesora consiguió las diapositivas que quería:

Socio codificador

Supongamos que eres un ingeniero de software que intenta escribir pruebas y corregir errores en un código que recorta imágenes en círculos (para que los usuarios puedan tener bonitas imágenes de perfil). ¿Puede Claude 3.5 Sonnet ayudar con eso? Veamos:

Compañero de redacción

Anthropic también exhibe Claude 3.5 Sonnet como compañero de escritura, pero su ejemplo no podría estar más lejos de un caso de uso en el mundo real: las novelas no suelen tratar de "cangrejos cargados de sarcasmo que viven en arrecifes bulliciosos". Sin embargo, el genograma que crea Claude es asombroso, y una vez más pone de manifiesto sus increíbles capacidades visuales.

Comparación de precios: Soneto vs. GPT-4o vs. Géminis Pro 1.5

Veamos cómo se comparan los precios de Claude 3.5 Sonnet con los de OpenAI y Google. Por supuesto, ésta es una buena oportunidad para pedir a Claude 3.5 Sonnet que cree un gráfico:

Comparación de precios de Claude AI con Open AI y Google

Para uso personal, las tres plataformas cobran unos 20 $/mes.

Conclusión

En los últimos años, todos hemos visto tantas noticias y tantos avances en el ámbito de la IA que cada vez resulta más difícil entusiasmarse con los nuevos lanzamientos, sobre todo con tantos ejemplos escogidos en vídeos de demostración.

Sin embargo, estoy realmente entusiasmado con las capacidades visuales y la función Artefactos de Claude 3.5 Sonnet. Personalmente lo probaré para el trabajo y estaré atento a su evolución.

Preguntas frecuentes

¿Claude 3.5 es gratuito?

Aunque Claude.ai ofrece un acceso gratuito limitado, el uso regular de Claude 3.5 Sonnet suele requerir una suscripción Pro. El acceso a través de la API Antrópica, Amazon Bedrock o Vertex AI de Google Cloud conlleva costes basados en el uso.

¿Qué es el Soneto Claude 3.5?

Claude 3.5 Sonnet es el último modelo de Anthropic, diseñado para mejorar el rendimiento, especialmente en razonamiento, codificación y seguridad. Supera a los modelos anteriores y a la competencia en varias pruebas comparativas.

¿En qué se diferencia Claude 3.5 Sonnet de otros modelos?

Sonnet destaca por sus avanzadas capacidades de razonamiento, su gran capacidad de codificación y sus características de seguridad mejoradas. También introduce una novedosa función llamada "Artefactos", que permite un manejo más eficaz de los datos.

¿Qué son los artefactos en el Soneto Claude 3.5?

Artefactos es una nueva función de Claude 3.5 Sonnet que te permite interactuar y manipular salidas del modelo, como código, texto o datos, directamente dentro de la interfaz del chat.

¿Cómo puedo utilizar Artefactos en Claude 3.5 Sonnet?

Puedes activar Artefactos en los ajustes de previsualización de funciones de la interfaz de chat de Claude.ai. Una vez activado, puedes interactuar con los resultados generados, como editar código o ver visualizaciones de datos directamente dentro del chat.

Temas

Aprende IA con estos cursos

programa

AI Business Fundamentals

11hrs hr
Accelerate your AI journey, conquer ChatGPT, and develop a comprehensive Artificial Intelligence strategy.
Ver detallesRight Arrow
Comienza el curso
Ver másRight Arrow
Relacionado

blog

¿Qué es Mistral Large 2? Cómo funciona, casos de uso y más

Mistral Large 2 es el último modelo lingüístico de Mistral AI, que compite con modelos como GPT-4o, Llama 3.1 y Claude 3 Opus.
Ryan Ong's photo

Ryan Ong

8 min

An avian AI exits its cage

blog

12 alternativas de código abierto a GPT-4

Alternativas de código abierto a GPT-4 que pueden ofrecer un rendimiento similar y requieren menos recursos informáticos para funcionar. Estos proyectos vienen con instrucciones, fuentes de código, pesos del modelo, conjuntos de datos e IU de chatbot.
Abid Ali Awan's photo

Abid Ali Awan

9 min

blog

Todo lo que sabemos sobre GPT-5

Predecir cómo podría ser la próxima evolución de la tecnología de IA de OpenAI y qué avances podría tener el modelo GPT-5.
Josep Ferrer's photo

Josep Ferrer

10 min

tutorial

Primeros pasos con Claude 3 y la API de Claude 3

Conozca los modelos Claude 3, las pruebas de rendimiento detalladas y cómo acceder a ellas. Además, descubra la nueva API Python de Claude 3 para generar texto, acceder a funciones de visión y streaming.
Abid Ali Awan's photo

Abid Ali Awan

tutorial

Cómo ajustar GPT 3.5: Liberar todo el potencial de la IA

Explore GPT-3.5 Turbo y descubra el potencial transformador del ajuste fino. Aprenda a personalizar este modelo de lenguaje avanzado para aplicaciones especializadas, mejore su rendimiento y comprenda los costes asociados, la seguridad y las consideraciones de privacidad.
Moez Ali's photo

Moez Ali

11 min

tutorial

Tutorial de DeepSeek-Coder-V2: Ejemplos, instalación, puntos de referencia

DeepSeek-Coder-V2 es un modelo de lenguaje de código de código abierto que rivaliza con el rendimiento de GPT-4, Gemini 1.5 Pro, Claude 3 Opus, Llama 3 70B o Codestral.
Dimitri Didmanidze's photo

Dimitri Didmanidze

8 min

Ver másVer más