Saltar al contenido principal

ERNIE 4.5 y X1 de Baidu: Características, Acceso, Comparación DeepSeek

Infórmate sobre los últimos modelos de IA de Baidu, ERNIE 4.5 y ERNIE X1, sus capacidades, pruebas de referencia, precios y cómo se comparan con competidores como GPT-4o y DeepSeek-R1.
Actualizado 17 mar 2025  · 8 min de lectura

Baidu ha anunciado recientemente dos nuevos modelos de IA: ERNIE 4.5 y ERNIE X1.

ERNIE 4.5 es un modelo multimodal generalista útil para las tareas cotidianas, que compite con el de OpenAI GPT-4o de OpenAI y V3 de DeepSeek.

ERNIE X1, por su parte, es un modelo de razonamiento especializado diseñado para tareas avanzadas como las matemáticas y la codificación compleja. Entrará en un mercado altamente competitivo, junto a DeepSeek-R1 y el o3-mini.

El mayor argumento de venta de Baidu para el modelo X1 es que es el doble de barato que el DeepSeek-R1, aunque supuestamente ofrece un rendimiento similar. Sin embargo, hasta ahora no hemos visto ninguna prueba de rendimiento del X1, así que esta afirmación está por verificar.

Por otra parte, ERNIE 4.5 tiene buenos resultados de referencia, pero no parece especialmente fácil de usar para el público de fuera de China, lo que creo que afectará significativamente a su adopción.

¿Constituirán los nuevos lanzamientos de ERNIE de Baidu otro "momento DeepSeek"? Mi impresión inicial es que no. Pero conozcamos mejor estos nuevos modelos. En este blog, dejaré de lado el ruido y desglosaré lo esencial de ERNIE 4.5 y X1.

Perfeccionamiento en IA para principiantes

Aprende los fundamentos de la IA y ChatGPT desde cero.
Aprende IA gratis

¿Qué es el ERNIE 4.5 de Baidu?

ERNIE 4.5 es la última IA multimodal IA multimodal multimodal de Baidu, un generalista versátil diseñado para las tareas e interacciones cotidianas. Como sistema multimodal, ERNIE 4.5 maneja varios tipos de datos a la vez, integrando texto, imágenes, audio y vídeo.

En la breve demostración oficial, vemos un ejemplo de ERNIE 4.5 trabajando con texto y vídeo:

Fuente: Baidu

Este no es el primer paso de Baidu en la IA. La empresa, fundada originalmente en 2000 como el principal motor de búsqueda de China (a menudo llamado el "Google de China"), empezó a invertir seriamente en inteligencia artificial hace varios años. Baidu lleva desarrollando ERNIE (Representación Mejorada a través de la Integración del Conocimiento) desde 2019, y lanzaron el Bot ERNIE en 2023.

Sin embargo, el dominio de Baidu en el mercado asiático de la IA se ha visto presionado recientemente por los modelos Qwen de Alibaba y por nuevos competidores innovadores como DeepSeek.

Con ERNIE 4.5, Baidu compite directamente con la V3 de DeepSeek, Qwen 2.5 Maxo el GPT-4o de OpenAI.

¿Qué es el ERNIE X1 de Baidu?

ERNIE X1 es un modelo de razonamiento especializado diseñado para tareas avanzadas como las matemáticas y la codificación compleja. Similar a DeepSeek-R1 o OpenAI o1este tipo de modelo muestra explícitamente su proceso de pensamiento al usuario, facilitando la comprensión de cómo llega a una respuesta o solución concreta.

Las empresas siguen invirtiendo mucho en modelos centrados en el razonamiento, como ERNIE X1, porque estos modelos se dirigen directamente a tareas que aportan un claro valor empresarial. Según datos recientes de Anthropic, las tareas de razonamiento y codificación son los principales casos de uso empresarial, y constituyen una parte significativa de la adopción de la IA.

el índice económico antrópico

Fuente: El Índice Económico Antrópico

A pesar del rápido desarrollo de la IA, la adopción por parte de las empresas sigue siendo baja en todo el mundo, y los modelos que destacan en dominios de razonamiento intensivo (matemáticas, codificación, análisis avanzado) tienen más probabilidades de aportar un valor empresarial tangible, impulsando los ingresos y acelerando la adopción de la IA en el mercado empresarial.

El principal argumento de venta de Baidu para el ERNIE X1 es su agresiva estrategia de precios. He aquí una rápida comparación con DeepSeek-R1 (la información sobre precios es exacta a 17 de marzo de 2025):

Modelo

Coste de entrada (el más bajo) por 1M de fichas

Coste de producción por 1M de fichas

DeepSeek-R1

0,135 $ (con descuento) - 0,55 $ (estándar)

0,55 $ (con descuento) - 2,19 $ (normal)

ERNIE X1

$0.28

$1.10

Con las tarifas estándar (y excluyendo la caché de contenidos), la afirmación de Baidu -que ERNIE X1 iguala el rendimiento de DeepSeek-R1 a mitad de precio- es cierta, sobre todo en lo que respecta al precio de los tokens de salida.

Sin embargo, con las tarifas con descuento de DeepSeek (que se aplican durante las 16:30-00:30 UTC de cada día), se aplica la afirmación inversa: La ERNIE X1 pasa a ser el doble de cara.

A pesar de su atractivo precio, Baidu aún no ha proporcionado pruebas comparativas detalladas que confirmen el rendimiento de ERNIE X1 en relación con DeepSeek-R1, lo que deja cierta incertidumbre sobre su competitividad en el mundo real.

Mientras esperamos las pruebas comparativas del ERNIE X1, vamos a conocer más detalles sobre el rendimiento del ERNIE 4.5.

Puntos de referencia ERNIE 4.5

Baidu ha publicado pruebas comparativas entre ERNIE 4.5 y los principales modelos multimodales y basados en texto, incluido el GPT-4o de OpenAI, GPT-4.5y V3 de DeepSeek. Repasemos los resultados clave, empezando por las capacidades multimodales.

Puntos de referencia multimodales

En las pruebas comparativas multimodales, ERNIE 4.5 superó a GPT-4o, alcanzando una puntuación media de 77,77, frente a los 73,92 de GPT-4o, lo que supone una ventaja de 3,85 puntos.

puntos de referencia de ernie 4.5

Fuente: Baidu

En concreto, ERNIE 4.5 superó a GPT-4o en seis de los siete puntos de referencia evaluados:

  • CCBench: Evalúa el razonamiento de sentido común en textos e imágenes. ERNIE 4.5 obtuvo una puntuación aproximada de 81, superando ligeramente los ~79 de GPT-4o.
  • OCRBench: Evalúa las capacidades de reconocimiento óptico de caracteres, centrándose en la extracción de texto a partir de imágenes. ERNIE 4.5 alcanzó alrededor de 88, superando los ~81 de GPT-4o.
  • ChartQA: Comprueba la comprensión de los datos presentados en gráficos. ERNIE 4.5 obtuvo una puntuación de ~82, ligeramente por delante de los ~81 de GPT-4o.
  • MMMU: Mide el razonamiento multimodal en varios temas. Aquí, GPT-4o lideró con ~70, mientras que ERNIE 4.5 obtuvo ~64, lo que indica un área de mejora.
  • MathVista: Evalúa el razonamiento matemático en contextos visuales. ERNIE 4.5 obtuvo una puntuación de ~69, superando los ~61 de GPT-4o.
  • DocVQA: Evalúa la capacidad de responder a preguntas basadas en documentos visuales. ERNIE 4.5 sobresalió con una puntuación de ~91, frente a los ~85 de GPT-4o.
  • MVBench: Se centra en la comprensión temporal en tareas de vídeo dinámico, que requieren razonar sobre secuencias de fotogramas. ERNIE 4.5 obtuvo una puntuación de ~72, superando significativamente los ~63 de GPT-4o.

Puntos de referencia sólo texto

En las tareas de sólo texto, ERNIE 4.5 obtuvo una puntuación media de 79.6superando ligeramente la media de GPT-4.5 (79,14) y también a DeepSeek-V3 (~77).

ernie 4.5 pruebas comparativas de sólo texto

Fuente: Baidu

Estos resultados sugieren que la ERNIE 4.5 es especialmente competitiva en las pruebas de comprensión de documentos multimodales, matemáticas y lengua china. Sin embargo, su menor rendimiento en pruebas de codificación específicas, como LiveCodeBench, pone de manifiesto posibles limitaciones en tareas de codificación especializadas.

Vamos a desglosar rápidamente algunos puntos de referencia clave:

  • MMLU-Pro: Evalúa el aprendizaje multitarea en varias disciplinas. ERNIE 4.5 obtuvo una puntuación de ~78, ligeramente inferior a los ~79 de GPT-4.5.
  • GPQA: Evalúa la respuesta a preguntas de propósito general. ERNIE 4.5 consiguió ~57, por detrás de los ~61 de GPT-4.5.
  • C-Eval: Mide los conocimientos generales y el razonamiento chinos. ERNIE 4.5 lideró con ~88, superando los ~80 de GPT-4.5.
  • CMMLU: Comprueba la comprensión multitarea en chino. ERNIE 4.5 obtuvo una puntuación de ~88, por delante de los ~80 de GPT-4.5.
  • Matemáticas-500: Mide la capacidad de un modelo para resolver problemas matemáticos desafiantes de nivel de secundaria. ERNIE 4.5 (~82) está por detrás del líder DeepSeek-V3 (~88) y GPT-4.5 (~84).
  • CMath: Evalúa la resolución de problemas matemáticos en chino. ERNIE 4.5 lideró con ~95, superando los ~85 de DeepSeek-V3.
  • LiveCodeBench: Mide la capacidad de codificación en tiempo real. ERNIE 4.5 obtuvo una puntuación de ~35, por debajo de los ~45 de GPT-4.5, lo que indica un margen de mejora en las tareas de codificación.

Cómo acceder a ERNIE 4.5 y ERNIE X1

Puedes probar directamente ERNIE 4.5 y X1 de Baidu a través de la aplicación oficial de chatbot disponible en su sitio web: yiyan.baidu.com.

Sin embargo, según mi experiencia personal, hay algunos problemas de usabilidad. Actualmente, la interfaz está disponible principalmente en chino, lo que la convierte en un reto para los no hablantes de chino: aunque puedes utilizar la función de traducción automática del navegador, la traducción no es fluida y la UX se resiente.

Fuente: Baidu

Además, el inicio de sesión en Google o GitHub no está disponible, un problema que no he encontrado con competidores como DeepSeek o Qwen. Seguí intentando crear una cuenta, pero no se me permitió rellenar el formulario de registro con mi número de teléfono europeo.

Cómo acceder a ERNIE a través de la API

Para los desarrolladores interesados en integrar ERNIE 4.5, el acceso a la API ya está disponible a través de la plataforma oficial de Baidu, Qianfan. Los precios empiezan en 0,55 $ por 1 millón de fichas de entrada y 2,20 $ por 1 millón de fichas de salida.

A 17 de marzo de 2024, ERNIE X1 aún no está disponible a través de la API, pero Baidu mencionó que lo estará pronto.

Además, Baidu ha anunciado planes para abrir ERNIE 4.5 a partir del 30 de junio de 2025. Este paso podría mejorar la adopción a nivel internacional al hacer el modelo más accesible y adaptable.

Baidu también tiene la intención de integrar ERNIE 4.5 y X1 en varios productos de su ecosistema, como Baidu Search y la aplicación Wenxiaoyan, aunque los plazos y detalles aún están por confirmar.

Impacto de ERNIE en el mercado de la IA

El lanzamiento de ERNIE 4.5 y ERNIE X1 de Baidu sigue una pauta notable que he visto surgir en la industria china de la IA: una estrategia que da prioridad a la disrupción frente a la usabilidad inmediata.

A diferencia de empresas como Google, OpenAI o Mistral, que suelen dedicar largos periodos de tiempo (a menudo de 8 a 12 meses o más) a garantizar que sus productos cumplen las estrictas normas de estabilidad, seguridad, privacidad y protección, las empresas chinas de IA parecen favorecer el despliegue rápido de productos que son convincentes pero que aún se encuentran en un estado inicial y sin pulir.

Al igual que ManusAI y DeepSeek, los modelos ERNIE de Baidu siguen una tendencia similar. Entran en el mercado de forma agresiva, con el objetivo principal de trastocar las estructuras de precios y los supuestos competitivos. El modelo ERNIE X1, en particular, se posiciona explícitamente como comparable en rendimiento al DeepSeek-R1 a mitad de coste, aunque Baidu todavía no ha respaldado públicamente estas afirmaciones con pruebas comparativas detalladas.

Y, aunque ERNIE 4.5 muestra unos resultados de referencia realmente competitivos, los usuarios internacionales como yo seguimos encontrando barreras, sobre todo un proceso de registro difícil y problemas de accesibilidad lingüística.

En general, los lanzamientos de ERNIE 4.5 y X1 refuerzan la idea de que las empresas chinas de IA se sienten cómodas sacrificando algo de estabilidad y experiencia de usuario a corto plazo, siempre que sean capaces de impulsar rápidamente el mercado y provocar conversaciones en todo el sector.

Queda por ver si este enfoque es sostenible, pero no se puede negar que es eficaz para obligar al mercado mundial de la IA a moverse más deprisa y a pensar de forma diferente sobre lo que significa competir en el mercado actual.

Conclusión

El lanzamiento por Baidu de ERNIE 4.5 y ERNIE X1 representa otro ambicioso paso en el competitivo panorama chino de la IA. ERNIE 4.5 demuestra claros puntos fuertes, sobre todo en comprensión multimodal, matemáticas y tareas de lengua china, lo que la posiciona con fuerza frente a rivales globales como GPT-4o y DeepSeek V3.

Por otro lado, la promesa de ERNIE X1 de ofrecer funciones de razonamiento avanzadas a mitad de precio que DeepSeek-R1 es intrigante, pero sin pruebas comparativas, sigue siendo especulativa.

A medida que estos modelos maduren, será interesante ver si Baidu y otras empresas chinas similares ajustan su enfoque para lograr un mejor equilibrio entre disrupción y estabilidad.

Preguntas frecuentes

¿Ernie 4.5 admite otros idiomas además del chino?

Actualmente, Ernie 4.5 es compatible principalmente con el chino y el inglés, aunque su mayor rendimiento se da en las tareas en chino. Todavía no se ha anunciado la compatibilidad oficial con otros idiomas.

¿Cuándo estará disponible exactamente Ernie X1 a través de la API de Baidu?

Baidu aún no ha facilitado una fecha exacta, pero ha mencionado que Ernie X1 estará disponible próximamente a través de APIs en su plataforma Qianfan MaaS.

¿Qué recursos de hardware necesito para ejecutar Ernie 4.5 localmente después de que sea de código abierto?

Baidu aún no ha publicado los requisitos de hardware detallados, pero normalmente los modelos multimodales de gran tamaño requieren GPU potentes (como las Nvidia A100 o H100) y recursos sustanciales de RAM.

¿Existe un límite en el uso gratuito de Ernie Bot para usuarios individuales?

Baidu aún no ha aclarado los límites específicos de uso, pero es habitual que este tipo de chatbots impongan límites diarios o mensuales para gestionar la carga del servidor.

¿Pueden las empresas de fuera de China acceder fácilmente a Ernie 4.5 e integrarlo en sus sistemas mediante API?

Técnicamente sí, a través de la plataforma Qianfan MaaS de Baidu; sin embargo, las barreras prácticas -como los problemas de registro o la compatibilidad lingüística- pueden complicar la adopción internacional.

¿Hasta qué punto son seguros Ernie 4.5 y X1 en cuanto a la privacidad de los datos?

Baidu aún no ha publicado documentación detallada sobre la privacidad de los datos o las certificaciones de cumplimiento, lo que dificulta por ahora las evaluaciones exhaustivas, especialmente para las empresas de fuera de China.

¿Existen alternativas a Ernie 4.5 y X1 dentro de China que puedan ofrecer experiencias de usuario internacionales más fluidas?

Sí, los modelos Qwen de Alibaba y DeepSeek ofrecen actualmente una accesibilidad internacional más fluida, con procesos de registro más sencillos y mejor asistencia en inglés.


Alex Olteanu's photo
Author
Alex Olteanu
LinkedIn

Soy editora y redactora de blogs, tutoriales y noticias sobre IA, y me aseguro de que todo se ajuste a una sólida estrategia de contenidos y a las mejores prácticas de SEO. He escrito cursos de ciencia de datos sobre Python, estadística, probabilidad y visualización de datos. También he publicado una novela premiada y dedico mi tiempo libre a escribir guiones y dirigir películas.

Temas

Aprende IA con estos cursos

Programa

AI Business Fundamentals

11hrs hr
Accelerate your AI journey, conquer ChatGPT, and develop a comprehensive Artificial Intelligence strategy.
Ver detallesRight Arrow
Comienza el curso
Ver másRight Arrow
Relacionado
An avian AI exits its cage

blog

12 alternativas de código abierto a GPT-4

Alternativas de código abierto a GPT-4 que pueden ofrecer un rendimiento similar y requieren menos recursos informáticos para funcionar. Estos proyectos vienen con instrucciones, fuentes de código, pesos del modelo, conjuntos de datos e IU de chatbot.
Abid Ali Awan's photo

Abid Ali Awan

9 min

blog

Todo lo que sabemos sobre GPT-5

Descubre cómo GPT-5 evolucionará hasta convertirse en un sistema unificado con funciones avanzadas, cuyo lanzamiento está previsto para el verano de 2025, basándose en la última hoja de ruta de OpenAI y en la historia de GPT.
Josep Ferrer's photo

Josep Ferrer

8 min

Tutorial

Tutorial de DeepSeek-Coder-V2: Ejemplos, instalación, puntos de referencia

DeepSeek-Coder-V2 es un modelo de lenguaje de código de código abierto que rivaliza con el rendimiento de GPT-4, Gemini 1.5 Pro, Claude 3 Opus, Llama 3 70B o Codestral.
Dimitri Didmanidze's photo

Dimitri Didmanidze

8 min

Tutorial

Cómo ajustar GPT 3.5: Liberar todo el potencial de la IA

Explore GPT-3.5 Turbo y descubra el potencial transformador del ajuste fino. Aprenda a personalizar este modelo de lenguaje avanzado para aplicaciones especializadas, mejore su rendimiento y comprenda los costes asociados, la seguridad y las consideraciones de privacidad.
Moez Ali's photo

Moez Ali

11 min

Tutorial

Visión GPT-4: Guía completa para principiantes

Este tutorial le presentará todo lo que necesita saber sobre GPT-4 Vision, desde cómo acceder a él hasta ejemplos prácticos del mundo real y sus limitaciones.
Arunn Thevapalan's photo

Arunn Thevapalan

12 min

Tutorial

IA explicable - Comprender y confiar en los modelos de aprendizaje automático

Sumérjase en la IA explicable (XAI) y aprenda a generar confianza en los sistemas de IA con LIME y SHAP para la interpretabilidad de modelos. Comprender la importancia de la transparencia y la equidad en las decisiones basadas en la IA.
Zoumana Keita 's photo

Zoumana Keita

12 min

Ver másVer más