Direkt zum Inhalt

Baidu's ERNIE 4.5 & X1: Funktionen, Zugang, DeepSeek Vergleich

Erfahre mehr über die neuesten KI-Modelle von Baidu, ERNIE 4.5 und ERNIE X1, ihre Fähigkeiten, Benchmarks, Preise und wie sie im Vergleich zu Konkurrenten wie GPT-4o und DeepSeek-R1 abschneiden.
Aktualisierte 17. März 2025  · 8 Min. Lesezeit

Baidu hat kürzlich zwei neue KI-Modelle angekündigt: ERNIE 4.5 und ERNIE X1.

ERNIE 4.5 ist ein generalistisches multimodales Modell, das für alltägliche Aufgaben geeignet ist und mit OpenAIs GPT-4o und DeepSeek's V3.

ERNIE X1 hingegen ist ein spezialisiertes Argumentationsmodell, das für fortgeschrittene Aufgaben wie Mathematik und komplexe Codierung entwickelt wurde. Es wird in einen hart umkämpften Markt eintreten, neben DeepSeek-R1 und OpenAIs o3-mini.

Baidus größtes Verkaufsargument für das X1-Modell ist, dass es doppelt so günstig ist wie der DeepSeek-R1, obwohl es angeblich eine ähnliche Leistung bietet. Bislang haben wir jedoch noch keine Benchmarks für das X1 gesehen, sodass diese Behauptung noch überprüft werden muss.

Andererseits hat ERNIE 4.5 zwar gute Benchmark-Ergebnisse, aber es scheint für das Publikum außerhalb Chinas nicht besonders benutzerfreundlich zu sein, was sich meiner Meinung nach erheblich auf seine Akzeptanz auswirken wird.

Werden Baidus neue ERNIE-Veröffentlichungen ein weiterer "DeepSeek-Moment" sein? Mein erster Eindruck ist - nicht wirklich. Aber lass uns mehr über diese neuen Modelle erfahren. In diesem Blog werde ich das Wesentliche von ERNIE 4.5 und X1 aufschlüsseln.

KI-Upskilling für Einsteiger

Lerne die Grundlagen von KI und ChatGPT von Grund auf.
KI kostenlos lernen

Was ist Baidus ERNIE 4.5?

ERNIE 4.5 ist Baidus neueste multimodale KI Modell - ein vielseitiger Generalist, der für alltägliche Aufgaben und Interaktionen entwickelt wurde. Als multimodales System verarbeitet ERNIE 4.5 mehrere Datentypen auf einmal und integriert Text, Bilder, Audio und Video.

In der kurzen offiziellen Demo sehen wir ein Beispiel dafür, wie ERNIE 4.5 mit Text und Video arbeitet:

Quelle: Baidu

Dies ist nicht der erste Schritt von Baidu in die KI. Das Unternehmen, das ursprünglich im Jahr 2000 als Chinas führende Suchmaschine gegründet wurde (und oft als das "Google Chinas" bezeichnet wird), begann vor einigen Jahren ernsthaft in künstliche Intelligenz zu investieren. Baidu entwickelt ERNIE (Enhanced Representation through Knowledge Integration) seit 2019 und hat den ERNIE Bot 2023 veröffentlicht.

Allerdings ist Baidus Dominanz auf dem asiatischen KI-Markt in letzter Zeit durch Alibabas Qwen-Modelle und innovative neue Wettbewerber wie DeepSeek unter Druck geraten.

Mit ERNIE 4.5 konkurriert Baidu direkt mit der V3 von DeepSeek, Qwen 2.5 Maxoder OpenAIs GPT-4o.

Was ist das ERNIE X1 von Baidu?

ERNIE X1 ist ein spezielles Argumentationsmodell, das für fortgeschrittene Aufgaben wie Mathematik und komplexes Programmieren entwickelt wurde. Ähnlich wie DeepSeek-R1 oder OpenAI's o1zeigt diese Art von Modell dem/der Nutzer/in explizit seinen/ihren Denkprozess, so dass er/sie leichter verstehen kann, wie er/sie zu einer bestimmten Antwort oder Lösung kommt.

Unternehmen investieren weiterhin stark in vernunftorientierte Modelle wie ERNIE X1, weil diese Modelle direkt auf Aufgaben ausgerichtet sind, die einen klaren geschäftlichen Nutzen bringen. Nach den jüngsten Daten von Anthropic sind Denk- und Codierungsaufgaben die wichtigsten Anwendungsfälle in Unternehmen und machen einen großen Teil der KI-Einführung aus.

der anthropische Wirtschaftsindex

Quelle: Der Anthropische Wirtschaftsindex

Trotz der rasanten Entwicklung der KI ist die Akzeptanz in den Unternehmen weltweit noch gering. Modelle, die sich durch eine hohe Denkleistung auszeichnen (Mathematik, Programmierung, fortgeschrittene Analysen), liefern mit größerer Wahrscheinlichkeit einen greifbaren Geschäftswert, der den Umsatz steigert und die Akzeptanz von KI im Unternehmensmarkt beschleunigt.

Baidus wichtigstes Verkaufsargument für ERNIE X1 ist seine aggressive Preisstrategie. Hier ist ein kurzer Vergleich mit DeepSeek-R1 (Preisinformationen entsprechen dem Stand vom 17. März 2025):

Modell

Inputkosten (niedrigste) pro 1 Mio. Token

Output Kosten pro 1 Mio. Token

DeepSeek-R1

0,135 $ (ermäßigt) - 0,55 $ (Standard)

$0,55 (ermäßigt) - $2,19 (Standard)

ERNIE X1

$0.28

$1.10

Bei den Standardtarifen (und ohne Content Caching) stimmt die Behauptung von Baidu, dass ERNIE X1 die Leistung von DeepSeek-R1 zum halben Preis erreicht, insbesondere bei den Preisen für Output-Token.

Bei den vergünstigten Tarifen von DeepSeek (die täglich zwischen 16:30 und 00:30 Uhr UTC gelten) gilt jedoch der umgekehrte Anspruch: ERNIE X1 wird doppelt so teuer.

Trotz des attraktiven Preises hat Baidu noch keine detaillierten Benchmarks vorgelegt, die die Leistung von ERNIE X1 im Vergleich zu DeepSeek-R1 bestätigen, was eine gewisse Ungewissheit über seine Wettbewerbsfähigkeit in der Praxis hinterlässt.

Während wir auf die Benchmarks zum ERNIE X1 warten, wollen wir mehr Details über die Leistung des ERNIE 4.5 erfahren.

ERNIE 4.5 Benchmarks

Baidu hat Benchmarks veröffentlicht, in denen ERNIE 4.5 mit führenden multimodalen und textbasierten Modellen verglichen wird, darunter OpenAIs GPT-4o, GPT-4.5und V3 von DeepSeek. Schauen wir uns die wichtigsten Ergebnisse an und beginnen mit den multimodalen Fähigkeiten.

Multimodale Benchmarks

Bei den multimodalen Benchmarks schnitt ERNIE 4.5 besser ab als GPT-4o und erreichte eine durchschnittliche Punktzahl von 77,77 im Vergleich zu 73,92 bei GPT-4o - ein Vorsprung von 3,85 Punkten.

ernie 4.5 benchmarks

Quelle: Baidu

Insbesondere übertraf ERNIE 4.5 GPT-4o in sechs von sieben bewerteten Benchmarks:

  • CCBench: Bewertet den gesunden Menschenverstand in Texten und Bildern. ERNIE 4.5 erzielte etwa 81 Punkte und übertraf damit leicht den Wert von GPT-4o (~79).
  • OCRBench: Bewertet die Fähigkeiten der optischen Zeichenerkennung mit Schwerpunkt auf der Textextraktion aus Bildern. ERNIE 4.5 erreichte rund 88 und übertraf damit den Wert von GPT-4o (~81).
  • ChartQA: Prüft das Verständnis der in Diagrammen dargestellten Daten. ERNIE 4.5 erreichte ~82, knapp vor GPT-4o mit ~81.
  • MMMU: Misst das multimodale logische Denken in verschiedenen Themenbereichen. Hier lag GPT-4o mit ~70 vorne, während ERNIE 4.5 ~64 erreichte, was auf einen verbesserungswürdigen Bereich hindeutet.
  • MathVista: Bewertet mathematisches Denken in visuellen Kontexten. ERNIE 4.5 erzielte ~69 Punkte und übertraf damit den Wert von GPT-4o (~61).
  • DocVQA: Bewertet die Fähigkeit, Fragen anhand von visuellen Dokumenten zu beantworten. ERNIE 4.5 schnitt mit einer Punktzahl von ~91 besser ab als GPT-4o mit ~85.
  • MVBench: Konzentriert sich auf das zeitliche Verständnis in dynamischen Videoaufgaben, bei denen Schlussfolgerungen über Bildfolgen gezogen werden müssen. ERNIE 4.5 erzielte ~72 Punkte und übertraf damit deutlich den Wert von GPT-4o (~63).

Reine Text-Benchmarks

Bei reinen Textaufgaben erreichte ERNIE 4.5 eine durchschnittliche Punktzahl von 79.6und liegt damit leicht vor dem Durchschnitt von GPT-4.5 (79,14) und auch vor DeepSeek-V3 (~77).

ernie 4.5 Nur-Text-Benchmarks

Quelle: Baidu

Diese Ergebnisse deuten darauf hin, dass ERNIE 4.5 in den Bereichen multimodales Dokumentenverständnis, Mathematik und chinesische Sprache besonders wettbewerbsfähig ist. Seine schwächere Leistung bei bestimmten Coding-Benchmarks, wie z. B. LiveCodeBench, verdeutlicht jedoch mögliche Einschränkungen bei speziellen Coding-Aufgaben.

Schauen wir uns kurz ein paar wichtige Eckdaten an:

  • MMLU-Pro: Bewertet das Multitasking-Lernen in verschiedenen Fächern. ERNIE 4.5 hat ~78 Punkte erreicht, etwas weniger als GPT-4.5 mit ~79 Punkten.
  • GPQA: Bewertet die Beantwortung von Fragen für allgemeine Zwecke. ERNIE 4.5 erreichte ~57 und lag damit hinter GPT-4.5s ~61.
  • C-Eval: Misst das chinesische Allgemeinwissen und das logische Denken. ERNIE 4.5 führte mit ~88 und übertraf damit die ~80 von GPT-4.5.
  • CMMLU: Prüft das Multitasking-Verständnis in chinesischer Sprache. ERNIE 4.5 erzielte ~88 Punkte und lag damit vor den ~80 Punkten von GPT-4.5.
  • Math-500: Misst die Fähigkeit eines Modells, anspruchsvolle mathematische Probleme auf Highschool-Niveau zu lösen. ERNIE 4.5 (~82) liegt hinter dem Spitzenreiter DeepSeek-V3 (~88) und GPT-4.5 (~84).
  • CMath: Bewertet das Lösen von mathematischen Problemen auf Chinesisch. ERNIE 4.5 führte mit ~95 und übertraf damit die ~85 von DeepSeek-V3.
  • LiveCodeBench: Misst die Echtzeit-Codierfähigkeiten. ERNIE 4.5 erreichte ~35 Punkte und lag damit unter dem Wert von GPT-4.5 (~45), was darauf hindeutet, dass es bei den Codieraufgaben noch Verbesserungspotenzial gibt.

Wie man auf ERNIE 4.5 und ERNIE X1 zugreift

Du kannst Baidus ERNIE 4.5 und X1 direkt über die offizielle Chatbot-Anwendung auf der Baidu-Website ausprobieren: yiyan.baidu.com.

Meiner persönlichen Erfahrung nach gibt es jedoch ein paar Probleme mit der Benutzerfreundlichkeit. Die Benutzeroberfläche ist derzeit hauptsächlich auf Chinesisch verfügbar, was für Nicht-Chinesischsprachige eine Herausforderung darstellt - obwohl du die automatische Übersetzungsfunktion des Browsers nutzen kannst, ist die Übersetzung nicht reibungslos und die Benutzerfreundlichkeit leidet.

Quelle: Baidu

Außerdem ist der Google- oder GitHub-Login nicht verfügbar, ein Problem, das ich bei Konkurrenten wie DeepSeek oder Qwen noch nicht hatte. Ich habe trotzdem versucht, ein Konto zu erstellen, aber ich durfte das Anmeldeformular nicht mit meiner europäischen Telefonnummer ausfüllen.

Wie man über die API auf ERNIE zugreift

Für Entwickler, die ERNIE 4.5 integrieren möchten, ist der API-Zugang bereits über die offizielle Plattform von Baidu verfügbar, Qianfan. Die Preise beginnen bei $0,55 pro 1 Million Input-Token und $2,20 pro 1 Million Output-Token.

Mit Stand vom 17. März 2024 ist ERNIE X1 noch nicht über die API verfügbar, aber Baidu erwähnte, dass dies bald der Fall sein wird.

Außerdem hat Baidu angekündigt, ERNIE 4.5 ab dem 30. Juni 2025 als Open Source zu veröffentlichen. Dieser Schritt könnte die Akzeptanz auf internationaler Ebene verbessern, indem er das Modell zugänglicher und anpassungsfähiger macht.

Baidu beabsichtigt außerdem, ERNIE 4.5 und X1 in verschiedene Produkte in seinem Ökosystem zu integrieren - darunter Baidu Search und die Wenxiaoyan App - obwohl Zeitpläne und Details noch nicht bestätigt sind.

Der Einfluss von ERNIE auf den KI-Markt

Die Veröffentlichung von Baidus ERNIE 4.5 und ERNIE X1 setzt ein bemerkenswertes Muster fort, das ich in Chinas KI-Industrie beobachtet habe - eine Strategie, bei der die Störung von Prozessen Vorrang vor der unmittelbaren Nutzbarkeit hat.

Im Gegensatz zu Unternehmen wie Google, OpenAI oder Mistral, die in der Regel einen langen Zeitraum (oft 8-12 Monate oder mehr) damit verbringen, sicherzustellen, dass ihre Produkte strenge Stabilitäts-, Sicherheits- und Datenschutzstandards erfüllen, scheinen chinesische KI-Unternehmen eine schnelle Bereitstellung von Produkten zu bevorzugen, die zwar überzeugend sind, sich aber noch in einem frühen, unausgereiften Stadium befinden.

Genau wie ManusAI und DeepSeek folgen die ERNIE-Modelle von Baidu einem ähnlichen Trend. Sie treten aggressiv in den Markt ein und zielen vor allem darauf ab, die Preisstrukturen und die Annahmen des Wettbewerbs zu stören. Insbesondere das Modell ERNIE X1 wird ausdrücklich als vergleichbar mit DeepSeek-R1 zum halben Preis angepriesen - auch wenn Baidu diese Behauptungen noch nicht öffentlich mit detaillierten Benchmarks untermauert hat.

Und obwohl ERNIE 4.5 wirklich konkurrenzfähige Benchmark-Ergebnisse aufweist, stoßen internationale Nutzerinnen und Nutzer wie ich immer noch auf Hindernisse, vor allem auf einen schwierigen Anmeldeprozess und Probleme mit der sprachlichen Verständlichkeit.

Insgesamt bestätigen die Veröffentlichungen von ERNIE 4.5 und X1 den Gedanken, dass chinesische KI-Firmen bereit sind, kurzfristig einige Abstriche bei der Stabilität und der Benutzerfreundlichkeit zu machen, solange sie in der Lage sind, den Markt schnell voranzutreiben und branchenweite Diskussionen zu provozieren.

Ob dieser Ansatz nachhaltig ist, bleibt abzuwarten, aber es ist unbestreitbar, dass er den globalen KI-Markt dazu zwingt, sich schneller zu bewegen und anders darüber nachzudenken, was es bedeutet, auf dem aktuellen Markt zu konkurrieren.

Fazit

Die Veröffentlichung von ERNIE 4.5 und ERNIE X1 durch Baidu ist ein weiterer ehrgeiziger Schritt in Chinas wettbewerbsfähiger KI-Landschaft. ERNIE 4.5 zeigt klare Stärken, vor allem in den Bereichen multimodales Verstehen, Mathematik und chinesische Sprache, und kann sich damit gegen globale Konkurrenten wie GPT-4o und DeepSeek V3 durchsetzen.

Andererseits ist das Versprechen von ERNIE X1, fortschrittliche Denkfähigkeiten zur Hälfte der Kosten von DeepSeek-R1 zu liefern, faszinierend - aber ohne Benchmarks bleibt es spekulativ.

Wenn diese Modelle reifen, wird es interessant sein zu sehen, ob Baidu und ähnliche chinesische Unternehmen ihren Ansatz anpassen, um ein besseres Gleichgewicht zwischen Störung und Stabilität zu finden.

FAQs

Unterstützt Ernie 4.5 auch andere Sprachen als Chinesisch?

Derzeit unterstützt Ernie 4.5 vor allem Chinesisch und Englisch, wobei seine stärkste Leistung bei chinesischsprachigen Aufgaben liegt. Die offizielle Unterstützung für weitere Sprachen wurde noch nicht angekündigt.

Wann genau wird Ernie X1 über die API von Baidu verfügbar sein?

Baidu hat noch kein genaues Datum genannt, aber sie haben erwähnt, dass Ernie X1 bald über APIs auf ihrer Qianfan MaaS-Plattform verfügbar sein wird.

Welche Hardware-Ressourcen brauche ich, um Ernie 4.5 lokal zu betreiben, nachdem es als Open Source veröffentlicht wurde?

Baidu hat noch keine detaillierten Hardware-Anforderungen veröffentlicht, aber in der Regel erfordern große multimodale Modelle leistungsstarke Grafikprozessoren (wie Nvidia A100 oder H100) und umfangreiche RAM-Ressourcen.

Gibt es ein Limit für die kostenlose Nutzung von Ernie Bot für einzelne Nutzer?

Baidu hat noch keine konkreten Nutzungsgrenzen genannt, aber es ist üblich, dass solche Chatbots tägliche oder monatliche Grenzen festlegen, um die Serverlast zu kontrollieren.

Können Unternehmen außerhalb Chinas einfach auf Ernie 4.5 zugreifen und es über eine API in ihre Systeme integrieren?

Technisch gesehen ja, über die Qianfan MaaS-Plattform von Baidu. Praktische Hindernisse wie Probleme bei der Registrierung oder Sprachunterstützung können die internationale Einführung jedoch erschweren.

Wie sicher sind Ernie 4.5 und X1 in Bezug auf den Datenschutz?

Baidu hat noch keine detaillierten Unterlagen zum Datenschutz oder zu Compliance-Zertifizierungen veröffentlicht, was eine gründliche Bewertung vor allem für Unternehmen außerhalb Chinas schwierig macht.

Gibt es in China Alternativen zu Ernie 4.5 und X1, die eine reibungslosere internationale Nutzererfahrung bieten?

Ja, die Modelle von Qwen und DeepSeek von Alibaba bieten derzeit eine leichtere internationale Erreichbarkeit, einschließlich einfacherer Registrierungsprozesse und besserem englischsprachigem Support.


Alex Olteanu's photo
Author
Alex Olteanu
LinkedIn

Ich bin Redakteurin und Autorin für KI-Blogs, Tutorials und Nachrichten und sorge dafür, dass alles zu einer starken Content-Strategie und SEO-Best Practices passt. Ich habe Data-Science-Kurse über Python, Statistik, Wahrscheinlichkeit und Datenvisualisierung geschrieben. Außerdem habe ich einen preisgekrönten Roman veröffentlicht und verbringe meine Freizeit mit Drehbuchschreiben und Filmregie.

Themen

Lerne KI mit diesen Kursen!

Lernpfad

KI-Geschäftsgrundlagen

11Std. hr
Beschleunige deine KI-Reise, erobere chatGPT und entwickle eine umfassende Strategie für künstliche Intelligenz.
Siehe DetailsRight Arrow
Kurs starten
Zertifizierung verfügbar

Kurs

Das EU-KI-Gesetz verstehen

1 hr
3K
Nimm deinen AI Act zusammen! Verstehe die Verpflichtungen, Risiken und Anforderungen des EU-KI-Gesetzes.
Mehr anzeigenRight Arrow
Verwandt

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.
Hesam Sheikh Hassani's photo

Hesam Sheikh Hassani

15 Min.

Der Blog

Die 50 besten AWS-Interview-Fragen und Antworten für 2025

Ein kompletter Leitfaden zur Erkundung der grundlegenden, mittleren und fortgeschrittenen AWS-Interviewfragen, zusammen mit Fragen, die auf realen Situationen basieren.
Zoumana Keita 's photo

Zoumana Keita

15 Min.

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

15 Min.

Der Blog

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Keine Hacks, keine Tricks. Schüler/innen und Lehrer/innen, lest weiter, um zu erfahren, wie ihr die Datenerziehung, die euch zusteht, kostenlos bekommen könnt.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

4 Min.

Der Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

Der Blog

2022-2023 DataCamp Classrooms Jahresbericht

Zu Beginn des neuen Schuljahres ist DataCamp Classrooms motivierter denn je, das Lernen mit Daten zu demokratisieren. In den letzten 12 Monaten sind über 7.650 neue Klassenzimmer hinzugekommen.
Nathaniel Taylor-Leach's photo

Nathaniel Taylor-Leach

8 Min.

Mehr anzeigenMehr anzeigen