¿Qué es el Soneto Claude 3.5? Cómo funciona, casos de uso y artefactos

Claude 3.5 Sonnet supera a GPT-4o y Gemini Pro 1.5 en varias pruebas de rendimiento e introduce una nueva función muy interesante: Artefactos.

Actualizado 29 jul 2024 · 8 min leer

GPT-4o y Gemini 1.5 Pro tienen una seria competencia: Soneto Claude 3.5.

Anthropic anunció Claude 3.5 Sonnet como parte de la gran familia Claude 3.5, que se completará a finales de este año con el lanzamiento de Claude 3.5 Haiku y Claude 3.5 Opus.

Claude 3.5 Sonnet no sólo supera a GPT-4o y Gemini 1.5 Pro en varios benchmarks, sino que también introduce una nueva función impresionante llamada Artefactos.

Si quieres leer más sobre el Soneto Claude 3.5, te recomiendo estas entradas del blog:

Estoy deseando enseñarte lo genial que es la función Artefactos, ¡así que empecemos!

Soneto Claude 3.5: Primeras impresiones

Me intrigaron los resultados del benchmark, así que fui directamente a Claude.ai para probar el nuevo modelo Claude 3.5 Sonnet.

Primero pedí a Claude 3.5 Sonnet que creara un gráfico utilizando los datos de la tabla siguiente:

Creo que no me esforcé mucho en pensar en la instrucción que utilicé -Generaun gráfico para esta tabla- y, sin embargo, el modelo generó este gráfico de barras agrupadas interactivo:

Claude 3.5 Sonnet implementó el gráfico como un componente React utilizando la biblioteca Recharts. Podemos ver y copiar el código cambiando a la pestaña Código de la esquina superior derecha:

Una cosa que me molestó del gráfico de barras generado es que la leyenda de colores de la parte inferior se solapa con las etiquetas del eje x. Además, hay demasiada información que consumir para un solo gráfico. Pensé que sería una buena idea tener una infografía separada para cada punto de referencia, así que incité a Claude 3.5 Sonnet con esto:

Para el punto de referencia del código, genera una infografía en la que añadas una explicación muy breve sobre qué es el punto de referencia y qué mide, y un pequeño gráfico comparativo al lado para mostrar cómo puntúa cada LLM en ese punto de referencia.

Tengo que decir que el resultado fue bastante impresionante, teniendo en cuenta lo malo que era mi pronóstico:

La infografía está bien organizada, con una buena elección de colores y propiedades tipográficas. Ya veo muchas aplicaciones aquí: con indicaciones detalladas, podríamos adaptar el diseño a nuestras necesidades y añadir personalizaciones específicas de la marca, por ejemplo.

Si aún no has probado Claude 3.5 Sonnet por ti mismo, quizá te preguntes qué es ese componente de la interfaz de usuario que muestra tanto el gráfico como el código. Entra en Artefactos.

Artefactos: Nueva función de Claude AI

No tiene sentido que explique qué son los Artefactos cuando el vídeo oficial lo hace mucho mejor. La razón por la que te animo a verlo es porque muestran cómo crear un juego de desplazamiento lateral en HTML 5 en un minuto:

¡Los artefactos son tan dinámicos!

A primera vista, la función Artefactos puede parecer una ventana o pestaña más de la interfaz. Sin embargo, Anthropic no se limita a añadir otra forma de mostrar la información, sino que proporciona una nueva forma de interactuar con su IA.

Los artefactos van más allá de las interacciones tradicionales basadas en texto al introducir una capa dinámica e interactiva. Esto nos permite visualizar y manipular directamente los resultados de la IA, en lugar de limitarnos a leerlos.

Este cambio es un avance notable. Sugiere un cambio hacia una relación más colaborativa con la IA, en la que podamos participar activamente y perfeccionar los resultados de la IA.

Será interesante ver cómo evoluciona esta función y cómo influye en la forma en que utilizaremos la IA en el futuro.

Y lo que me entusiasma es la promesa de Antrophic de diseñarlo para la colaboración en equipo:

Es sólo el principio de una visión más amplia de Claude.ai, que pronto se ampliará para apoyar la colaboración en equipo. En un futuro próximo, los equipos -y con el tiempo organizaciones enteras- podrán centralizar de forma segura sus conocimientos, documentos y trabajo en curso en un espacio compartido, en el que Claude actuará como compañero de equipo a petición.
Anthropic AI

Cómo activar y utilizar los Artefactos

Para acceder a Claude Artifacts, tendrás que activarlo en la configuración. Primero, haz clic en las iniciales de tu cuenta y, a continuación, en Vista previa de funciones.

A continuación, activa los Artefactos cambiando el conmutador a Activar.

Una vez activada, puedes activar la función pidiendo a Claude que genere contenido que pueda mostrarse en un Artefacto, como código, visualizaciones de datos o incluso maquetas.

Cuando Claude crea un Artefacto, éste aparece en un panel independiente dentro de la interfaz, dividido en las pestañasCódigo y Vista previa. La pestaña Código muestra la salida bruta generada por Claude, mientras que la pestañaVista previa proporciona una representación visual o interactiva de esa salida.

Cómo acceder al Soneto Claude 3.5

La forma más sencilla de acceder al Soneto Claude 3.5 es ir a Claude.ai y divertirte en su amigable interfaz gráfica de usuario:

El Soneto Claude 3.5 es de uso gratuito en Claude.ai, pero debo mencionar que alcancé los límites de uso muy rápidamente (después de unos diez avisos).

Si quieres utilizar Claude 3.5 Sonnet con regularidad, no hay duda de que tendrás que comprar una suscripción Pro.

Claude 3.5 Sonnet también está disponible a través de la API Antrópica, Vertex AI de Google Cloud y Amazon Bedrock.

Cómo funciona y se comporta el Sonnet Claude 3.5

Aunque Anthropic no ha hecho públicos todos los detalles técnicos, sabemos que Claude 3.5 Sonnet se basa en su modelo anterior, Claude 3 Opus. Es un gran modelo lingüístico, lo que significa que está entrenado en un conjunto masivo de datos de texto y código, lo que le permite comprender y generar un lenguaje similar al humano.

Lo que diferencia al Claude 3.5 Sonnet es su rendimiento mejorado. Se ha afinado y optimizado, lo que ha dado lugar a mejoras en diversas áreas.

El razonamiento de nivel graduado se considera desde hace tiempo una característica distintiva de la inteligencia humana, una frontera en la que la IA ha luchado tradicionalmente por seguir el ritmo. Aunque todavía queda mucho trabajo por hacer, el Soneto Claude 3.5 demuestra un progreso significativo.

En cuanto a las matemáticas, Claude 3.5 Sonnet va ligeramente por detrás de GPT-4o, que va en cabeza con una puntuación del 76,6%. Pero la puntuación de 71,1% de Claude 3.5 Sonnet sigue siendo notablemente alta. Este rendimiento sugiere que Claude 3.5 Sonnet tiene una sólida comprensión de los conceptos matemáticos, las fórmulas y el razonamiento lógico, lo que la convierte en una herramienta prometedora para tareas que requieran conocimientos matemáticos.

El punto de referencia BIG-Bench-Hard se centra en evaluar la capacidad de los modelos de IA para abordar problemas polifacéticos, demostrar un razonamiento avanzado y aplicar conocimientos en varios dominios. Claude 3.5 Sonnet supera significativamente a otros modelos en esta prueba comparativa, alcanzando una puntuación del 93,1%. Esto indica que el Soneto Claude 3.5 posee un alto nivel de competencia para manejar tareas complejas, razonar eficazmente en diferentes áreas temáticas y aplicar sus conocimientos con flexibilidad a situaciones novedosas.

En cuanto a las capacidades visuales, Claude 3.5 Sonnet destaca especialmente en razonamiento matemático visual, con una puntuación del 67,7% en la prueba MathVista, una ventaja significativa sobre los demás modelos. Claude 3.5 Sonnet también obtiene buenos resultados en la respuesta a preguntas visuales (MMMU) y en las preguntas y respuestas visuales sobre documentos (puntuación ANLS), lo que demuestra su capacidad para comprender y procesar eficazmente la información visual.

Aunque su rendimiento en diagramas científicos y preguntas y respuestas de gráficos es ligeramente inferior al de GPT-4o y Gemini 1.5 Pro, sigue manteniendo un alto índice de precisión superior al 90%. En general, los resultados ponen de relieve la gran capacidad de Claude 3.5 Sonnet para comprender datos tanto visuales como textuales, lo que la convierte en una herramienta prometedora para diversas aplicaciones que requieran comprensión multimodal.

Claude 3.5 Casos de uso de Sonnet

Claude 3.5 Sonnet es el modelo de visión más potente de Anthropic, y no es de extrañar que lo haga tan bien en tareas que requieren razonamiento visual, como interpretar y crear gráficos. Sin embargo, también se comercializa como un gran compañero de codificación o escritura, así que echemos un vistazo más de cerca.

Presentaciones visuales

Si tienes datos que necesitas presentar visualmente, parece que Claude 3.5 Sonnet puede hacer realmente magia.

En el ejemplo de Anthropic, un profesor de biología solicita al modelo dos gráficos y pide a Claude que extraiga la información relevante para crear una presentación basada en Javascript que utiliza reveal-js, un popular framework para crear presentaciones HTML. Veamos si la profesora consiguió las diapositivas que quería:

Comparación de precios: Soneto vs. GPT-4o vs. Géminis Pro 1.5

Veamos cómo se comparan los precios de Claude 3.5 Sonnet con los de OpenAI y Google. Por supuesto, ésta es una buena oportunidad para pedir a Claude 3.5 Sonnet que cree un gráfico:

Para uso personal, las tres plataformas cobran unos 20 $/mes.

Conclusión

En los últimos años, todos hemos visto tantas noticias y tantos avances en el ámbito de la IA que cada vez resulta más difícil entusiasmarse con los nuevos lanzamientos, sobre todo con tantos ejemplos escogidos en vídeos de demostración.

Sin embargo, estoy realmente entusiasmado con las capacidades visuales y la función Artefactos de Claude 3.5 Sonnet. Personalmente lo probaré para el trabajo y estaré atento a su evolución.

¿Claude 3.5 es gratuito?

¿Qué es el Soneto Claude 3.5?

¿En qué se diferencia Claude 3.5 Sonnet de otros modelos?

¿Qué son los artefactos en el Soneto Claude 3.5?

¿Cómo puedo utilizar Artefactos en Claude 3.5 Sonnet?

Temas

Inteligencia Artificial

Aprende IA con estos cursos

programa

Fundamentos del negocio de la IA

12 h

Acelera tu viaje hacia la IA, domina chatGPT y desarrolla una estrategia integral de inteligencia artificial.

Ver detalles

Iniciar curso

programa

Desarrollo de aplicaciones de IA

21 h

Aprende a crear aplicaciones potenciadas por IA con las últimas herramientas para desarrolladores de IA, como la API OpenAI, Hugging Face y LangChain.

Ver detalles

Iniciar curso

Curso

IA generativa para empresas

1 h

58.6K

Aprende el papel que la Inteligencia Artificial Generativa desempeña hoy y desempeñará en el futuro en un entorno empresarial.

Ver detalles

Iniciar curso

Relacionado

blog

¿Qué es Mistral Large 2? Cómo funciona, casos de uso y más

Mistral Large 2 es el último modelo lingüístico de Mistral AI, que compite con modelos como GPT-4o, Llama 3.1 y Claude 3 Opus.

Ryan Ong

8 min

blog

12 alternativas de código abierto a GPT-4

Alternativas de código abierto a GPT-4 que pueden ofrecer un rendimiento similar y requieren menos recursos informáticos para funcionar. Estos proyectos vienen con instrucciones, fuentes de código, pesos del modelo, conjuntos de datos e IU de chatbot.

Abid Ali Awan

9 min

Tutorial

Primeros pasos con Claude 3 y la API de Claude 3

Conozca los modelos Claude 3, las pruebas de rendimiento detalladas y cómo acceder a ellas. Además, descubra la nueva API Python de Claude 3 para generar texto, acceder a funciones de visión y streaming.

Abid Ali Awan

Tutorial

Cómo ajustar GPT 3.5: Liberar todo el potencial de la IA

Explore GPT-3.5 Turbo y descubra el potencial transformador del ajuste fino. Aprenda a personalizar este modelo de lenguaje avanzado para aplicaciones especializadas, mejore su rendimiento y comprenda los costes asociados, la seguridad y las consideraciones de privacidad.

Moez Ali

Tutorial

Tutorial de DeepSeek-Coder-V2: Ejemplos, instalación, puntos de referencia

DeepSeek-Coder-V2 es un modelo de lenguaje de código de código abierto que rivaliza con el rendimiento de GPT-4, Gemini 1.5 Pro, Claude 3 Opus, Llama 3 70B o Codestral.

Dimitri Didmanidze

Ver más Ver más

¿Qué es el Soneto Claude 3.5? Cómo funciona, casos de uso y artefactos

Soneto Claude 3.5: Primeras impresiones