Saltar al contenido principal

Todo lo que sabemos sobre GPT-5

Descubre cómo GPT-5 evolucionará hasta convertirse en un sistema unificado con funciones avanzadas, cuyo lanzamiento está previsto para el verano de 2025, basándose en la última hoja de ruta de OpenAI y en la historia de GPT.
Actualizado 21 feb 2025  · 8 min de lectura

Han pasado más de dos años desde el lanzamiento de ChatGPT en noviembre de 2022. Cuando escribí originalmente este artículo el 14 de febrero de 2024, había pasado poco más de un año, y OpenAI seguía siendo una fuerza dominante en la IA. Desde entonces, el campo ha evolucionado, y Gemini de Google, Claude de Anthropic y LLaMA de Meta han surgido como competidores importantes.

El 12 de febrero de 2025, Sam Altman publicó una hoja de ruta en X, proporcionando detalles sobre GPT-4.5 y GPT-5 y esbozando planes para simplificar las ofertas de OpenAI bajo el concepto de "inteligencia unificada mágica". Estoy actualizando este artículo basándome en esa información.

Este artículo examina la GPT-5, combinando las recientes declaraciones de Altman con la progresión de los modelos anteriores de OpenAI.

¿Qué es la GPT-5?

El Transformador Preentrenado Generativo o GPT es una serie de grandes modelos lingüísticos (LLM) desarrollados por OpenAI que han influido significativamente tanto en el campo del ML como en el de la IA.

GPT, en esencia, está diseñado para comprender y generar texto similar al humano basándose en la información que recibe. Estos modelos se entrenan a partir de amplios conjuntos de datos. La familia de modelos GPT ha desempeñado un papel decisivo en la popularización de las aplicaciones basadas en LLM, estableciendo nuevos puntos de referencia sobre lo que es posible en el procesamiento del lenguaje natural, la generación y más allá.

GPT-5 representa la siguiente iteración de la serie GPT. Algunos os estaréis preguntando qué significa la siguiente iteración. Veamos la historia de los modelos GPT hasta ahora: 

GPT-1

En 2018, OpenAI introdujo el concepto de preentrenamiento generativo con GPT-1, utilizando una arquitectura de transformadores para mejorar la comprensión del lenguaje natural. Este modelo, detallado en su artículo "Improving Language Understanding by Generative Pre-Training", sirvió como prueba de concepto y no se hizo público.

GPT-2

Un año después, OpenAI publicó GPT-2, que presentaba mejoras significativas en la generación de texto. El GPT-2 era capaz de generar pasajes cortos de texto, lo que suponía un notable avance respecto a su predecesor. Estaba disponible públicamente, lo que permitió una experimentación más amplia en la comunidad del aprendizaje automático.

GPT-3

Con la publicación de GPT-3 en 2020, OpenAI amplió significativamente su modelo, con 100 veces más parámetros que GPT-2. Esta ampliación permitió a GPT-3 producir textos mucho más largos y coherentes, con un rendimiento impresionante en diversas tareas. La introducción de ChatGPT, una iteración centrada en la conversación dentro de la serie GPT-3.5, demostró la notable capacidad del modelo para generar texto similar al humano, logrando una rápida adopción y alcanzando los 100 millones de usuarios en sólo dos meses.

GPT-4

La GPT-4, la última iteración de la serie, perfecciona aún más las capacidades introducidas por sus predecesoras. Con un conjunto de datos aún mayor y más parámetros, GPT-4 mejora las capacidades de comprensión y generación de lenguaje natural de GPT-3. Presenta un rendimiento mejorado en la generación de texto coherente y contextualmente relevante en pasajes extensos y muestra una mejor comprensión en escenarios de conversación complejos.

Los avances de la GPT-4 incluyen una comprensión más matizada del contexto, una mayor veracidad de los hechos y una reducción de la generación de contenidos sesgados o perjudiciales. Su adopción abarca diversas aplicaciones, desde agentes conversacionales avanzados hasta sofisticadas herramientas de creación de contenidos, lo que pone de relieve su versatilidad y la evolución continua de las tecnologías de procesamiento del lenguaje natural impulsadas por la IA.

En noviembre de 2023, OpenAI presentó GPT-4 Turbo con Visión, que actualizaba varias funciones. Después, en mayo de 2024, se lanzó el GPT-4o, un modelo multimodal que ofrece velocidades aún más rápidas y costes más bajos. Puedes saber más sobre la evolución de la familia GPT en nuestro artículo anterior sobre GPT-4.

GPT-5

Según el post X de Altman del 12 de febrero de 2025, GPT-5 será la próxima evolución de la serie de Transformadores Preentrenados Generativos. La reciente hoja de ruta de Altman proporciona detalles claros sobre la GPT-5, indicando que no será un modelo independiente, sino un sistema que integrará los modelos de la serie GPT y de la serie o, como la o3.

Sabemos que la GPT-4 presentaba mejoras significativas respecto a sus predecesoras, sobre todo en su capacidad de razonamiento lógico. Aunque la GPT-4o, lanzada en mayo de 2024, sigue estando limitada a los conocimientos anteriores a su corte de formación, ofrece capacidades de razonamiento y multimodales mejoradas. Espero que GPT-5 se base en estos avances, incorporando el razonamiento de o3 y herramientas adicionales, tal y como se indica en la hoja de ruta.

¿Cuándo saldrá a la venta la GPT-5?

En una conversación de Sam Altman con Bill Gates en enero de 2024, Gates recibió la confirmación de que se había empezado a trabajar en la GPT-5, sin dar ninguna pista sobre cuándo podría ser la fecha de lanzamiento.

El post X de Altman del 12 de febrero de 2025 especifica que la GPT-5 se lanzará en "meses" a partir de esa fecha, lo que indica un lanzamiento en verano de 2025. El ciclo de desarrollo de GPT-4, incluyendo formación, desarrollo y pruebas, superó los dos años, con su lanzamiento inicial a principios de 2023, tras el debut de ChatGPT en noviembre de 2022. El GPT-4o, lanzado en mayo de 2024, supuso una actualización posterior.

La hoja de ruta de Altman acelera el lanzamiento de la GPT-5 a mediados de 2025 y confirma que la GPT-4.5, cuyo nombre en clave es Orión, se lanzará en "semanas" a partir del 12 de febrero de 2025, probablemente en marzo de 2025, como precursora.

¿Qué características podemos esperar de la GPT-5?

Con el lanzamiento de la GPT-5 posiblemente uno o dos años en el futuro, la mayoría de las predicciones sobre sus avances se basan en las tendencias actuales marcadas por Google y las iniciativas de IA de código abierto. Estos avances nos dan una valiosa visión de la futura dirección de la industria.

Sin embargo, hay algunas primeras pistas que proceden directamente del equipo central de OpenAI. Durante la entrevista de Gates, Altman destacó que los esfuerzos de OpenAI se centrarían en mejorar las capacidades de razonamiento e incorporar capacidades de procesamiento de vídeo.

Así que vamos a intentar darle un poco de sentido a todo esto y a discutir algunas mejoras clave que se esperan de la GPT-5.

Tamaño del parámetro

El tamaño exacto de los parámetros de la GPT-4 sigue sin revelarse, aunque las estimaciones apuntan a unos 1,5 billones. GPT-5, como sistema y no como modelo independiente, integrará múltiples arquitecturas, incluidas las capacidades de razonamiento de o3. Preveo que su capacidad reflejará este enfoque combinado en lugar de un simple aumento de los parámetros.

Familia GPT número de parámetros evolución

Si esta trayectoria continúa, la GPT-5 podría redefinir los límites de los LLM actuales, ofreciendo un tamaño sin precedentes.

Multimodalidad

Actualmente, la GPT-4o procesa voz, imágenes y texto. La hoja de ruta de Altman confirma que la GPT-5 incluirá funciones de voz, lienzo y búsqueda, con potencial para el procesamiento de vídeo, según insinuaciones anteriores de su conversación de enero de 2024 con Bill Gates. Esto mejorará las capacidades multimodales de OpenAI, alineándose con las tendencias observadas en competidores como Gemini de Google.

De Chatbot a Agente

La transición de los chatbots a los agentes totalmente autónomos es otra frontera apasionante. Imagina que pudieras asignar tareas o trabajos menores a una aplicación con GPT. Esto podría hacerse realidad si OpenAI sigue integrando servicios de terceros. Ya hemos visto la introducción de GPT y Operador personalizados, y es probable que esto siga desarrollándose.

Esta nueva función permitiría a la GPT-5 conectarse a diversos servicios y realizar acciones en el mundo sin problemas, actuando en nombre de los usuarios para realizar tareas sin supervisión humana directa. Por ejemplo, podríamos pedir a un agente autónomo que nos comprara la comida basándose en nuestras preferencias alimentarias.

Mayor precisión

El modelo actual GPT-4 es un 40% mejor que su predecesor GPT-3. Con el razonamiento de cadena de pensamiento de o3 integrado en GPT-5, preveo mayores ganancias en fiabilidad y comprensión contextual, reduciendo los errores en diversas aplicaciones.

Aumento de las ventanas contextuales

Una de las limitaciones de los modelos actuales es el tamaño de la ventana de contexto que pueden considerar para generar respuestas. Dado que GPT-5 podría entrenarse con una mayor cantidad de datos, se prevé que tenga una ventana de contexto ampliada, lo que le permitiría comprender y referenciar porciones más grandes de texto, dando lugar a resultados más coherentes y contextualmente relevantes.

Uso rentable de la API OpenAI

A medida que surjan nuevos modelos, también podemos prever una reducción del coste de utilización de la API OpenAI, haciendo más accesibles tecnologías como la GPT-4o.

Esta democratización del acceso podría espolear una oleada de innovación, permitiendo que un abanico más amplio de desarrolladores y organizaciones integren la IA avanzada en sus aplicaciones.

Una vez que se abarate y sea más accesible, los modelos GPT podrían llegar a ser más competentes en la realización de tareas complejas como la codificación o la investigación. Si aún no has probado la API de OpenAI, te recomiendo encarecidamente que sigas la guía de DataCamp sobre la API de OpenAI para hacerte una idea.

Conclusión

La hoja de ruta de Sam Altman del 12 de febrero de 2025 proporciona detalles concretos sobre la GPT-5, yendo más allá de las especulaciones que dieron forma a los debates anteriores. Confirma que la GPT-4.5 se lanzará en unas semanas, seguida de la GPT-5 en unos meses, con el objetivo de lanzarla en verano de 2025 con un enfoque de sistema unificado. Lo considero un paso importante en la evolución de OpenAI, que integra funciones avanzadas y acceso escalonado para satisfacer necesidades diversas.

Si estás deseando empezar a explorar todo lo que pueden ofrecerte los modelos GPT, empieza con nuestro curso Introducción a ChatGPT o, si ya estás familiarizado con el modelo, con nuestro seminario web sobre el Uso del Análisis Avanzado de Datos de ChatGPT.


Josep Ferrer's photo
Author
Josep Ferrer
LinkedIn
Twitter

Josep es Científico de Datos y Gestor de Proyectos en la Agencia Catalana de Turismo, utilizando datos para mejorar la experiencia de los turistas en Cataluña. Su experiencia incluye la gestión del almacenamiento y procesamiento de datos, junto con la analítica avanzada y la comunicación eficaz de las perspectivas de los datos.

También es un dedicado educador, que imparte clases en el Máster de Big Data de la Universidad de Navarra, y contribuye regularmente con artículos perspicaces sobre ciencia de datos en Medium y KDNuggets.

Es Licenciado en Ingeniería Física por la Universidad Politécnica de Cataluña y Máster en Sistemas Interactivos Inteligentes por la Universidad Pompeu Fabra.

En la actualidad, se dedica con pasión a hacer que las tecnologías relacionadas con los datos sean más accesibles a un público más amplio a través de la publicación de Medium ForCode'Sake.

Temas

¡Comienza hoy tu viaje a la IA!

Curso

Introduction to ChatGPT

1 hr
325.8K
Learn how to use ChatGPT. Discover best practices for writing prompts and explore common business use cases for the powerful AI tool.
Ver detallesRight Arrow
Comienza el curso
Ver másRight Arrow
Relacionado

blog

¿Qué es GPT-4 y por qué es importante?

OpenAI ha anunciado el lanzamiento de su último gran modelo lingüístico, GPT-4. Este modelo es un gran modelo multimodal que puede aceptar tanto entradas de imagen como de texto y generar salidas de texto.
Abid Ali Awan's photo

Abid Ali Awan

9 min

An avian AI exits its cage

blog

12 alternativas de código abierto a GPT-4

Alternativas de código abierto a GPT-4 que pueden ofrecer un rendimiento similar y requieren menos recursos informáticos para funcionar. Estos proyectos vienen con instrucciones, fuentes de código, pesos del modelo, conjuntos de datos e IU de chatbot.
Abid Ali Awan's photo

Abid Ali Awan

9 min

Tutorial

Visión GPT-4: Guía completa para principiantes

Este tutorial le presentará todo lo que necesita saber sobre GPT-4 Vision, desde cómo acceder a él hasta ejemplos prácticos del mundo real y sus limitaciones.
Arunn Thevapalan's photo

Arunn Thevapalan

12 min

Tutorial

Cómo ajustar GPT 3.5: Liberar todo el potencial de la IA

Explore GPT-3.5 Turbo y descubra el potencial transformador del ajuste fino. Aprenda a personalizar este modelo de lenguaje avanzado para aplicaciones especializadas, mejore su rendimiento y comprenda los costes asociados, la seguridad y las consideraciones de privacidad.
Moez Ali's photo

Moez Ali

11 min

Tutorial

Cómo hacer modelos de ChatGPT personalizados: 5 sencillos pasos para conseguir GPT personalizados

Echa un vistazo a estos cinco sencillos pasos para liberar todo el potencial de ChatGPT con tus propios GPT personalizados.
Moez Ali's photo

Moez Ali

9 min

Tutorial

Ajuste fino de GPT-3 mediante la API OpenAI y Python

Libere todo el potencial de GPT-3 mediante el ajuste fino. Aprenda a utilizar la API de OpenAI y Python para mejorar este modelo de red neuronal avanzado para su caso de uso específico.
Zoumana Keita 's photo

Zoumana Keita

12 min

Ver másVer más