Saltar al contenido principal
InicioBlogInteligencia Artificial (IA)

Todo lo que sabemos sobre GPT-5

Predecir cómo podría ser la próxima evolución de la tecnología de IA de OpenAI y qué avances podría tener el modelo GPT-5.
may 2024  · 10 min leer

Ya ha pasado más de un año desde que ChatGPT se lanzó por primera vez y se abrió al público. Al principio nos asombró a todos con su capacidad para comprender y generar lenguaje natural.

Sin embargo, la actual marcha constante de la innovación en IA significa que OpenAI no puede acaparar todo el protagonismo. Desde el lanzamiento del Bard de Google hasta el anuncio de su nuevo y vanguardista modelo Gemini, pasando por la entrada de nuevos competidores como Anthropic y el fuerte movimiento de código abierto impulsado por el LLaMA de Meta, OpenAI tendrá que moverse con rapidez si quiere mantener su liderazgo en el campo de la IA.

Hoy, cuando nos encontramos en el inicio de otro hito tecnológico, crecen las expectativas en torno a la GPT-5. Alimentado principalmente por nuestra imaginación y las especulaciones que circulan en la comunidad tecnológica.

Este artículo trata de arrojar algo de luz sobre lo que podríamos esperar de la GPT-5, tomando ideas de sus predecesoras como la GPT-4 y de la trayectoria de los principales avances en el campo de la IA.

Es importante tener en cuenta que gran parte de lo que aquí se expone se basa en predicciones y dibuja un futuro tan apasionante como extremadamente incierto.

Así pues, intentemos descubrir algo de verdad sobre lo que está por venir con GPT-5.

¿Qué es GPT-5?

Generative Pre-trained Transformer o GPT es una serie de grandes modelos lingüísticos (LLM) desarrollados por OpenAI que han influido significativamente tanto en el campo del ML como en el de la IA.

GPT, en esencia, está diseñado para comprender y generar texto similar al humano a partir de la información que recibe. Estos modelos se entrenan a partir de vastos conjuntos de datos. La familia de modelos GPT ha desempeñado un papel decisivo en la popularización de las aplicaciones basadas en LLM, estableciendo nuevos puntos de referencia para lo que es posible en el procesamiento del lenguaje natural, la generación y más allá.

GPT-5 representa la siguiente iteración de la serie GPT. Algunos de ustedes se preguntarán qué significa la próxima iteración. Veamos la historia de los modelos GPT hasta la fecha: 

GPT-1

En 2018, OpenAI introdujo el concepto de preentrenamiento generativo con GPT-1, utilizando una arquitectura de transformadores para mejorar la comprensión del lenguaje natural. Este modelo, detallado en su artículo "Improving Language Understanding by Generative Pre-Training", sirvió como prueba de concepto y no se hizo público.

GPT-2

Un año después, OpenAI lanzó GPT-2, que presentaba mejoras significativas en la generación de texto. GPT-2 era capaz de generar pasajes cortos de texto, lo que suponía un notable avance respecto a su predecesor. Se puso a disposición del público, lo que permitió una mayor experimentación en la comunidad del aprendizaje automático.

GPT-3

Con el lanzamiento de GPT-3 en 2020, OpenAI amplió significativamente su modelo, con 100 veces más parámetros que GPT-2. Esta ampliación permitió a GPT-3 producir textos mucho más largos y coherentes, con un rendimiento impresionante en diversas tareas. La introducción de ChatGPT, una iteración centrada en la conversación dentro de la serie GPT-3.5, demostró la notable capacidad del modelo para generar texto similar al humano, logrando una rápida adopción y alcanzando los 100 millones de usuarios en sólo dos meses.

GPT-4

GPT-4, la última iteración de la serie, perfecciona aún más las capacidades introducidas por sus predecesoras. Con un conjunto de datos aún mayor y más parámetros, GPT-4 mejora las capacidades de comprensión y generación de lenguaje natural de GPT-3. Presenta un rendimiento mejorado en la generación de textos coherentes y contextualmente relevantes en pasajes extensos y muestra una mejor comprensión en escenarios de conversación complejos.

Los avances de GPT-4 incluyen una comprensión más matizada del contexto, una mayor veracidad de los hechos y una reducción de la generación de contenidos sesgados o perjudiciales. Su adopción abarca diversas aplicaciones, desde agentes conversacionales avanzados hasta sofisticadas herramientas de creación de contenidos, lo que pone de relieve su versatilidad y la evolución continua de las tecnologías de procesamiento del lenguaje natural impulsadas por la IA. 

 En noviembre de 2023, OpenAI presentó GPT-4 Turbo con Vision, que actualizaba varias funciones. Puede obtener más información sobre la evolución de la familia GPT en nuestro artículo anterior sobre GPT-4.

GPT-5

Así pues, es probable que GPT-5 represente la próxima versión del Transformador Generativo Preentrenado.

Aunque la información sobre la posible próxima iteración es escasa, sabemos que GPT-4 presentó mejoras significativas respecto a sus predecesores, sobre todo en su capacidad de razonamiento lógico. Aunque sigue sin estar al tanto de los acontecimientos posteriores a abril de 2023, GPT-4 cuenta con una base de conocimientos generales más amplia y una comprensión más profunda de nuestro mundo. Así pues, todo indica hasta ahora que GPT-5 seguirá la misma tendencia y mejorará el modelo actual GPT-4.

Una imagen creada con DALLE-3 en GPT-4 con la indicación "la evolución de los modelos GPT".

Una imagen creada con DALLE-3 en GPT-4 con la indicación "la evolución de los modelos GPT

¿Cuándo saldrá a la venta GPT-5?

En una conversación de Sam Altman con Bill Gates en enero de 2024, Gates recibió la confirmación de que se había empezado a trabajar en la GPT-5, sin dar ninguna pista sobre cuándo podría ser la fecha de lanzamiento.

Podemos considerar lo ocurrido con GPT-4 para intentar predecir lo que podría ocurrir con el lanzamiento de GPT-5. A pesar de que OpeanAI lanzó GPT-4 sólo unos meses después de ChatGPT, sabemos que el ciclo de desarrollo de GPT-4, incluyendo una fase de formación, desarrollo y pruebas, duró más de dos años.

Por lo tanto, si la GPT-5 sigue un calendario similar, su lanzamiento podría prolongarse hasta finales de 2025. Aunque este nuevo lanzamiento parece lejano, esto no significa necesariamente que OpenAI no vaya a seguir mejorando GPT-4.

Lo más probable es que OpenAI siga mejorando GPT-4, y podríamos ver la introducción de una actualización intermedia, GPT-4.5, como ya vimos con GPT-3.5.

¿Qué características podemos esperar de GPT-5?

Con el lanzamiento de GPT-5 posiblemente uno o dos años en el futuro, la mayoría de las predicciones sobre sus avances se basan en las tendencias actuales marcadas por Google y las iniciativas de IA de código abierto. Esta evolución nos da una valiosa idea de la futura dirección de la industria.

Sin embargo, hay algunas primeras pistas que proceden directamente del equipo central de OpenAI. Durante la entrevista de Gates, Altman destacó que los esfuerzos de OpenAI se centrarían en mejorar la capacidad de razonamiento e incorporar capacidades de procesamiento de vídeo.

Así pues, vamos a intentar entenderlo todo un poco y a comentar algunas de las principales mejoras que se esperan de GPT-5.

Tamaño de los parámetros

Aunque el tamaño exacto de los parámetros de la GPT-4 permanece en secreto, existe una tendencia constante hacia modelos más complejos y capaces. La mayoría de las fuentes indican que la cifra podría rondar los 1,5 billones de parámetros.

Imagen del autor. Evolución del número de parámetros de la familia GPT.

Imagen del autor. Evolución del número de parámetros de la familia GPT.

Si esta trayectoria continúa, GPT-5 podría redefinir los límites de los actuales LLM, ofreciendo un tamaño sin precedentes.

Multimodalidad

Dado que el modelo GPT-4 existente ya admite funciones de voz e imagen, la integración del procesamiento de vídeo surge como una progresión natural para GPT-5. Ya hemos visto cómo Google empezaba a experimentar con esta función en su modelo Gemini, así que es sólo cuestión de tiempo que la competencia obligue a OpenAI a innovar también.

Por lo tanto, GPT-5 podría mejorar las capacidades multimodales actuales de GPT-4 y añadir nuevas funciones como la integración de vídeo, generando un cambio fundamental en la forma en que interactuamos con la IA, permitiendo formas de comunicación más naturales y versátiles.

De chatbot a agente

La transición de los chatbots a los agentes totalmente autónomos es otra frontera apasionante. Imagina que pudieras asignar tareas o trabajos menores a una aplicación con GPT. Esto podría hacerse realidad si OpenAI sigue integrando servicios de terceros. Ya hemos visto la introducción de GPT personalizadas, y es probable que esto siga desarrollándose.

Esta nueva función permitiría a GPT-5 conectarse a diversos servicios y realizar acciones en el mundo sin problemas, actuando en nombre de los usuarios para llevar a cabo tareas sin supervisión humana directa. Por ejemplo, podríamos pedir a un agente autónomo que nos comprara la comida basándose en nuestras preferencias dietéticas.

Mayor precisión

Con cada iteración, la precisión de los modelos GPT ha mejorado, haciéndolos más fiables a la hora de comprender el contexto y generar respuestas adecuadas. Una nueva generación de modelos GPT supondría un aumento del tamaño y la variedad de su conjunto de datos de entrenamiento.

El actual modelo GPT-4 es un 40% mejor que su predecesor GPT-3, por lo que se espera que GPT-5 continúe esta tendencia, reduciendo los errores y mejorando la fidelidad de sus interacciones.

Aumento de las ventanas contextuales

Una de las limitaciones de los modelos actuales es el tamaño de la ventana contextual que pueden considerar para generar respuestas. Dado que GPT-5 podría entrenarse con una mayor cantidad de datos, se prevé que disponga de una ventana de contexto ampliada, lo que le permitiría comprender y referenciar mayores porciones de texto, dando lugar a resultados más coherentes y relevantes desde el punto de vista contextual.

Uso rentable de la API OpenAI

A medida que surjan nuevos modelos, también podemos prever una reducción del coste de uso de la API OpenAI, lo que hará más accesibles tecnologías como GPT-4 y GPT-3.5. El lanzamiento de la GPT-5 podría significar que la GPT-4 pasara a ser accesible y más barata de utilizar.

Esta democratización del acceso podría espolear una oleada de innovación que permitiría a un abanico más amplio de desarrolladores y organizaciones integrar la IA avanzada en sus aplicaciones.

Una vez que se abarate y sea más accesible, los modelos GPT podrían llegar a ser más competentes en la realización de tareas complejas como la codificación o la investigación. Si aún no has probado la API de OpenAI, te recomiendo encarecidamente que sigas la guía de DataCamp sobre la API de OpenAI para hacerte una idea.

Conclusión

Mientras esperamos con impaciencia detalles concretos sobre la GPT-5, es crucial recordar que nuestros debates actuales se basan en especulaciones y meras predicciones basadas en hechos históricos, tendencias generales de la IA y algunas pequeñas pistas que el equipo de OpenAI parece compartir.

La historia sugiere que es posible que veamos actualizaciones incrementales, como una GPT-4.5, antes de la llegada de la GPT-5 a medio plazo.

Independientemente de la cronología, la evolución de la serie GPT sigue cautivando la imaginación y promete un futuro en el que el potencial de la IA sólo estará limitado por nuestra capacidad para imaginar sus aplicaciones.

Si está ansioso por empezar a explorar todo lo que los modelos GPT pueden ofrecerle, empiece con nuestro curso Introducción a ChatGPT o, si ya está familiarizado con el modelo, con nuestro seminario web sobre Uso del análisis avanzado de datos de ChatGPT.

Temas

Comience hoy mismo su viaje a la IA

Course

Introduction to ChatGPT

1 hr
194.5K
Learn how to use ChatGPT. Discover best practices for writing prompts and explore common business use cases for the powerful AI tool.
See DetailsRight Arrow
Start Course
Ver másRight Arrow
Relacionado

blog

Los 16 mejores marcos y bibliotecas de IA: Guía para principiantes

Explore los mejores marcos y bibliotecas de IA y sus fundamentos en esta guía definitiva para profesionales de datos noveles que comienzan su carrera profesional.
Yuliya Melnik's photo

Yuliya Melnik

15 min

blog

¿Qué es la tokenización?

La tokenización divide el texto en partes más pequeñas para facilitar el análisis mecánico y ayudar a las máquinas a comprender el lenguaje humano.
Abid Ali Awan's photo

Abid Ali Awan

9 min

tutorial

Primeros pasos con Claude 3 y la API de Claude 3

Conozca los modelos Claude 3, las pruebas de rendimiento detalladas y cómo acceder a ellas. Además, descubra la nueva API Python de Claude 3 para generar texto, acceder a funciones de visión y streaming.
Abid Ali Awan's photo

Abid Ali Awan

tutorial

Guía introductoria para perfeccionar los LLM

La puesta a punto de grandes modelos lingüísticos (LLM) ha revolucionado el Procesamiento del Lenguaje Natural (PLN), ofreciendo capacidades sin precedentes en tareas como la traducción de idiomas, el análisis de sentimientos y la generación de textos. Este enfoque transformador aprovecha modelos preentrenados como GPT-2, mejorando su rendimiento en dominios específicos mediante el proceso de ajuste fino.
Josep Ferrer's photo

Josep Ferrer

12 min

tutorial

Cómo utilizar la API de conversión de texto a voz de OpenAI

La API TTS de OpenAI es un punto final que permite a los usuarios interactuar con su modelo de inteligencia artificial TTS, que convierte el texto en lenguaje hablado con sonido natural.
Kurtis Pykes 's photo

Kurtis Pykes

12 min

tutorial

Tutorial de la API de OpenAI Assistants

Una visión completa de la API Assistants con nuestro artículo, que ofrece una mirada en profundidad a sus características, usos en la industria, guía de configuración y las mejores prácticas para maximizar su potencial en diversas aplicaciones empresariales.
Zoumana Keita 's photo

Zoumana Keita

14 min

See MoreSee More