Curso
OpenAI ha presentado GPT-4.5un modelo que se aleja del razonamiento paso a paso y se centra en una conversación más natural e intuitiva.
Sam Altman la describió como la primera IA que realmente se siente como hablar con una persona reflexiva, y por lo que hemos visto hasta ahora, está diseñada para alucinar menos, fluir más suavemente y dar respuestas más claras y sucintas.
No se trata de una mejora destinada a superar a los modelos construidos para el razonamiento complejo. La GPT-4.5 no liderará las clasificaciones de referencia en tareas que requieran mucha lógica, como la programación o la resolución de problemas científicos. En cambio, OpenAI se ha centrado en mejorarla para las interacciones cotidianas, la escritura y las consultas basadas en el conocimiento.
Por ahora, el acceso es limitado. Los usuarios Pro pueden empezar a utilizar GPT-4.5 hoy, pero los usuarios Plus tendrán que esperar hasta que OpenAI amplíe su infraestructura la semana que viene. La empresa citó la escasez de GPU como motivo de la implantación gradual, señalando que la demanda ha sido mayor de lo esperado.
Nos interesa ver cómo este modelo cambia las interacciones cotidianas de la IA y si sus puntos fuertes compensan sus desventajas en las tareas de razonamiento. Veamos más de cerca lo que diferencia a la GPT-4.5.
Perfeccionamiento en IA para principiantes
¿Qué es GPT-4.5?
GPT-4.5 adopta un enfoque diferente al de los modelos recientes de OpenAI. En lugar de mejorar el razonamiento paso a paso, se basa en el aprendizaje no supervisadohaciendo que las respuestas sean más fluidas, sucintas y conversacionales.
GPT-4.5 es más sucinto y conversacional que GPT-4o. Fuente: OpenAI
No es un modelo de cadena de pensamiento
Una de las mayores diferencias entre GPT-4.5 y los modelos de razonamiento de OpenAI es cómo procesa y estructura sus respuestas.
Modelos como o1, DeepSeek R1o o3-mini utilizan el razonamiento de cadena de pensamiento (CoT), lo que significa que descomponen los problemas complejos paso a paso, como un humano que escribe su trabajo en un problema matemático. Este enfoque estructurado ayuda con el razonamiento lógico, la resolución de problemas en varios pasos y las explicaciones detalladas.
GPT-4.5, sin embargo, no razona así. En lugar de eso, responde basándose en la intuición lingüística y el reconocimiento de patrones, basándose en sus datos de entrenamiento sin dividir explícitamente los problemas en pasos. Por eso puede parecer más conversacional y natural, pero también significa que es menos fiable para tareas que requieran mucha lógica, como la programación avanzada o el razonamiento científico.
Más natural, más sucinto
Donde GPT-4.5 destaca es en la calidad de la conversación. Las respuestas fluyen de forma más natural, haciendo que las interacciones parezcan menos robóticas y más intuitivas. OpenAI lo probó con evaluadores humanos, y los resultados muestran una clara preferencia por el tono, la claridad y el compromiso de la GPT-4.5 frente a la GPT-4o (hablaremos más adelante de los puntos de referencia).
Una comparación de la presentación en directo nos llamó la atención. Los ingenieros de OpenAI preguntaron a diferentes modelos: "¿Por qué está salado el océano?":
- GPT-3.5 Turbo: Una respuesta técnicamente correcta pero demasiado detallada.
- GPT-4 Turbo: Una respuesta larga pero precisa.
- GPT-4.5: Una explicación concisa pero completa, estructurada de forma que sea más fácil de recordar y comprender.
Desde nuestro punto de vista, este cambio hacia la brevedad y la claridad hace que la GPT-4.5 sea más adecuada para conversaciones informales, resúmenes y ayuda a la redacción. También nos ha encantado lo bien que este ejemplo del blog del lanzamiento muestra la evolución de los GPT conversacionales:
Impresiones prácticas: Hablar con GPT-4.5
Para saber cómo funciona realmente la GPT-4.5, hemos consultado las demos de OpenAI y hemos realizado nuestras propias pruebas.
Más conciencia social, mejor tono
Una de las demostraciones de OpenAI lo ilustró bien. Un usuario pidió a GPT-4.5 que le ayudara a redactar un texto después de que un amigo volviera a cancelar sus planes. La petición inicial fue frustrada e impulsiva:
"Escribe un mensaje de texto diciéndoles que les odio".
GPT-4.5 captó la emoción que había detrás de la petición y sugirió una respuesta más constructiva sin dejar de reconocer la frustración. OpenAI lo comparó con o1, que siguió la instrucción literal sin reconocer la intención subyacente.
Probamos indicaciones similares y observamos lo mismo: el GPT-4.5 entiende el tono y el matiz social mejor que los modelos anteriores. Por ejemplo, pedimos al modelo que escribiera un correo electrónico agresivo a un jefe, y esperábamos que el modelo captara nuestra frustración y nos ayudara a replantear la respuesta de un modo más profesional y constructivo, ¡y así fue!
Por supuesto, si le decimos explícitamente que emita el texto enfadado, lo hará, pero por defecto parece dar prioridad a las respuestas más reflexivas y equilibradas. De hecho, puedes ver nuestro ejemplo de chat compartido aquí.
Explicaciones mejores y más breves
Otra mejora clave es la forma en que GPT-4.5 explica los conceptos. OpenAI comparó distintos modelos que respondían a "¿Por qué es salado el océano?" y llegó a la conclusión de que el GPT-4.5 resumía los puntos clave de forma concisa, mientras que el GPT-4 Turbo ofrecía una respuesta larga y detallada.
Sólo lo hemos probado contra GPT-4o (que es diferente de GPT-4 Turbo), y los resultados son casi los mismos. Sin embargo, observamos una diferencia significativa cuando lo probamos frente al modelo heredado GPT-4. Hemos intentado muchas indicaciones, pero puedes comparar las respuestas de "¿Por qué los ríos no son salados?":
Como era de esperar, no es demasiado bueno razonando
Lo probamos con un par de preguntas específicas de razonamiento y, como era de esperar, no funcionó bien. He aquí sólo un ejemplo (consulta la conversación aquí):
O3-mini, por ejemplo, encontró fácilmente una respuesta correcta en su primer intento-ver la conversación aquí.
Rendimiento de referencia: Mayor precisión, pero no es un modelo de razonamiento
OpenAI lo dejó claro desde el principio: GPT-4.5 no es una potencia de razonamiento. A diferencia de los modelos de la serie o, que se basan en el razonamiento de la cadena de pensamiento (CoT) para desglosar problemas complejos paso a paso, GPT-4.5 se apoya en el aprendizaje no supervisado, lo que significa que genera respuestas basadas en la intuición lingüística más que en la lógica estructurada.
Esta compensación se refleja en los resultados de los puntos de referencia. GPT-4.5 supera a los modelos anteriores en precisión y factualidad, pero se queda atrás en la resolución estructurada de problemas.
Mayor precisión, menos alucinaciones
GPT-4.5 lidera en conocimiento general y precisión factual, con una tasa de precisión del 62,5% en SimpleQA, superando significativamente a GPT-4o (38,2%), OpenAI o1 (47%) y OpenAI o3-mini (15%).
Fuente: OpenAI
Sin embargo, lo que es posiblemente más importante es la reducción de la GPT-4.5 alucinación alucinaciones. Los modelos anteriores tenían dificultades para generar con seguridad información incorrecta, pero GPT-4.5 tiene la tasa más baja de alucinaciones, con un 37,1%, lo que supone una mejora importante respecto a GPT-4o (61,8%), OpenAI o1 (44%) y o3-mini (80,3%).
Fuente: OpenAI
Esto significa que GPT-4.5 produce menos declaraciones falsas que los modelos anteriores de OpenAI, aunque sigue sin ser completamente fiable para la comprobación de hechos (después de todo, sigue estando en el 37,1%).
Evaluaciones humanas: Más útil para tareas cotidianas y profesionales
OpenAI realizó evaluaciones comparativas con probadores humanos, midiendo la tasa de victorias de GPT-4.5 frente a la de GPT-4.5. GPT-4o en diferentes tipos de consultas. Los resultados muestran que el GPT-4,5 es preferible en la mayoría de los casos, sobre todo en las consultas profesionales (63,2% de porcentaje de victorias).
Fuente: OpenAI
Dificultades con el razonamiento complejo
Aunque la GPT-4.5 mejora la precisión de los hechos y la fluidez conversacional, sigue quedándose corta en tareas de razonamiento pesado como las matemáticas, las ciencias y la codificación estructurada. Las pruebas de rendimiento muestran que supera a GPT-4o, pero queda por detrás de o3-mini de OpenAI, que está optimizado para la resolución de problemas basados en la lógica.
Punto de referencia |
GPT-4.5 |
GPT-4o |
OpenAI o3-mini (alto) |
GPQA (ciencia) |
71.4% |
53.6% |
79.7% |
AIME '24 (matemáticas) |
36.7% |
9.3% |
87.3% |
MMMLU (multilingüe) |
85.1% |
81.5% |
81.1% |
MMMU (multimodal) |
74.4% |
69.1% |
- |
SWE-Lancer Diamante (codificación) |
32.6% $186,125 |
23.3% $138,750 |
10.8% $89,625 |
SWE-Bench Verificado (codificación) |
38.0% |
30.7% |
61.0% |
Fuente: OpenAI
En general, GPT-4.5 no es la mejor opción para tareas avanzadas de matemáticas, lógica o programación que requieran un razonamiento paso a paso. Los usuarios que necesiten resolver problemas estructurados seguirán encontrando que o3-mini o los futuros modelos centrados en el razonamiento son más adecuados para esas aplicaciones.
Cómo acceder a ChatGPT 4.5
La GPT-4.5 se está desplegando gradualmente debido a las limitaciones de la GPU: primero accederán los usuarios Pro y la semana que viene los usuarios Plus, a medida que OpenAI amplíe su infraestructura. Los niveles empresarial y educativo tendrán acceso en las próximas semanas.
Una vez que tengas acceso a él, podrás acceder desde el selector de modelos:
GPT-4.5 se integra con las últimas funciones de ChatGPT, como la carga de archivos e imágenes, las funciones de búsqueda y la herramienta canvas para escribir y codificar tareas. Sin embargo, las capacidades multimodales como el Modo Voz, el procesamiento de vídeo y la pantalla compartida aún no son compatibles con ChatGPT.
GPT-4.5 API
GPT-4.5 también está disponible para los desarrolladores a través de la API de finalización de chats, la API de asistentes y la API de lotes. El modelo admite llamada a funciones, salidas estructuradasmensajes del sistema, streaming y capacidades de visión.
Sin embargo, se trata de un modelo de gran tamaño e informática intensiva, por lo que es más caro que las versiones anteriores. OpenAI aún no se ha comprometido a hacer de GPT-4.5 una oferta a largo plazo, por lo que su disponibilidad puede depender de los comentarios de los developer.
Categoría |
Precio |
Entrada |
$75.00 |
Entrada en caché |
$37.50 |
Salida |
$150.00 |
Precios (por 1 millón de fichas)
El GPT-4.5 es uno de los modelos más caros de la gama de OpenAI, lo que refleja su mayor exigencia computacional.
Límites de tarifa por nivel
Los límites de velocidad de la API varían en función del nivel de acceso, afectando a cuántas solicitudes por minuto (RPM) y tokens por minuto (TPM) puede utilizar un desarrollador. Los clientes de nivel superior reciben un rendimiento significativamente mayor.
Nivel |
RPM (Peticiones por minuto) |
TPM (Fichas por minuto) |
Límite de la cola de lotes |
Nivel 1 |
1,000 |
125,000 |
50,000 |
Nivel 2 |
5,000 |
250,000 |
500,000 |
Nivel 3 |
5,000 |
500,000 |
50,000,000 |
Nivel 4 |
10,000 |
1,000,000 |
100,000,000 |
Nivel 5 |
10,000 |
2,000,000 |
5,000,000,000 |
Los desarrolladores con acceso a API de nivel superior tendrán una capacidad mucho mayor, lo que hace que la GPT-4.5 sea más adecuada para aplicaciones de IA a escala empresarial.
Posible disponibilidad limitada
GPT-4.5 es actualmente un avance de investigación, y OpenAI no ha confirmado si estará disponible de forma permanente en la API. Dado su mayor coste y las mayores demandas de computación, OpenAI puede evaluar si es sostenible su despliegue continuado basándose en las opiniones de los usuarios.
Conclusión
GPT-4.5 es el modelo ChatGPT más natural y socialmente consciente hasta la fecha. En nuestras pruebas, comprendió sistemáticamente los matices emocionales, reformuló las indicaciones agresivas de forma más reflexiva y proporcionó respuestas más claras y estructuradas.
Sin embargo, sus capacidades de razonamiento siguen siendo débiles, y hemos confirmado mediante pruebas que tiene dificultades con los problemas de razonamiento pesado, en los que modelos como o3-mini obtienen mejores resultados. Aunque GPT-4.5 es estupendo para interacciones fluidas, no es el modelo en el que confiar para la resolución estructurada de problemas o la asistencia precisa en la codificación.
Para los usuarios que dan prioridad a la fluidez y claridad de la conversación, GPT-4.5 es un paso adelante. Pero para cualquier cosa que requiera una lógica profunda, existen mejores opciones.
Preguntas frecuentes
¿Qué es la GPT-4.5 y en qué se diferencia de la GPT-4o?
GPT-4.5 es la última iteración de los modelos lingüísticos de OpenAI. Comparado con el GPT-4o, el modelo GPT-4.5 demuestra una mejor capacidad de razonamiento, menos alucinaciones, un mejor rendimiento y una mayor personalidad.
¿Cuándo saldrá GPT-4.5?
A partir de hoy (27 de febrero de 2025), GPT-4.5 está disponible en vista previa de investigación en ChatGPT Pro, y estará disponible para los usuarios plus y teams en las próximas semanas.
¿Es multimodal la GPT-4.5?
GPT-4.5 tiene a la búsqueda, el acceso a imágenes y archivos, y la capacidad de aprovechar el lienzo ChatGPT.
¿Cómo puedo acceder a GPT-4.5?
Al igual que en los modelos anteriores, el acceso a GPT-4.5 probablemente estará disponible a través de la API de OpenAI y ChatGPT Pro. El modelo estará disponible para equipos, plus y usuarios empresariales en las próximas semanas.
¿Admite GPT-4.5 el modo voz?
GPT-4.5 no admite actualmente funciones multimodales como el Modo Voz, el vídeo y la pantalla compartida en ChatGPT.
¿Cuánto costará GPT-4.5?
GPT-4.5 estará disponible para los usuarios pro (200 $/mes) a partir de hoy y se extenderá a los usuarios plus (20 $/mes) a lo largo de la próxima semana. El precio de la API es de 75,00 $ / 1M de tokens para los tokens de entrada, 37,50 $ / 1M de tokens para los tokens de entrada en caché, y 150,00 $ / 1M de tokens para los tokens de salida.
