Alibaba Behauptet, Sein Neues KI-Modell Übertrifft DeepSeek & ChatGPT

In einem mutigen Schritt, um in der schnell wachsenden Branche der künstlichen Intelligenz (KI) zu konkurrieren, hat das chinesische Technologieunternehmen Alibaba am Mittwoch eine neue Version seines KI-Modells, Qwen 2.5-Max, vorgestellt und behauptet, es übertreffe die Leistung bekannter Modelle wie DeepSeek’s KI, OpenAI’s GPT-4o und Metas Llama.

Die Veröffentlichung von Qwen 2.5-Max am ersten Tag des Mondneujahrs, einer Zeit, in der viele Chinesen traditionell nicht arbeiten und Zeit mit ihren Familien verbringen, unterstreicht strategisch den Druck, den der meteoritische Aufstieg von DeepSeek in den letzten drei Wochen nicht nur auf seine Übersee-Konkurrenten, sondern auch auf seine heimischen Wettbewerber wie Tencent Holdings Ltd. und Baidu Inc. ausgeübt hat.

Das neue Modell des Unternehmens wurde Berichten zufolge auf über 20 Billionen Tokens entwickelt und anschließend mit kuratiertem Supervised Fine-Tuning (SFT) und Reinforcement Learning from Human Feedback (RLHF) weiter trainiert.

„Qwen 2.5-Max übertrifft… fast durchweg GPT-4o, DeepSeek-V3 und Llama-3.1-405B“, sagte die Cloud-Einheit von Alibaba in einer Ankündigung, die auf ihrem offiziellen WeChat-Konto veröffentlicht wurde, und bezog sich dabei auf internationale Giganten wie OpenAI und Meta.

Alibaba gab bekannt, dass sein Qwen2.5-Max DeepSeek V3 in mehreren Benchmarks übertrifft, darunter Arena-Hard, LiveBench, LiveCodeBench und GPQA-Diamond.

Es zeigte auch beeindruckende Ergebnisse in anderen Bewertungen, einschließlich MMLU-Pro.

Die Basis-Modelle des Unternehmens haben erhebliche Verbesserungen in der Mehrheit der Benchmarks gezeigt, und es ist zuversichtlich, dass Fortschritte in den Methoden des Nachtrainings die nächste Version von Qwen2.5-Max auf noch höhere Leistungsniveaus heben werden.

„Beim Vergleich von Basis-Modellen können wir nicht auf die proprietären Modelle wie GPT-4o und Claude-3.5-Sonnet zugreifen. Daher bewerten wir Qwen2.5-Max im Vergleich zu DeepSeek V3, einem führenden Open-Weight MoE-Modell, Llama-3.1-405B, dem größten Open-Weight Dense-Modell, und Qwen2.5-72B, das ebenfalls zu den besten Open-Weight Dense-Modellen gehört“, sagte das Unternehmen in einem Blog.

Darüber hinaus fügte Alibabas Qwen hinzu: „Jetzt ist Qwen2.5-Max in Qwen Chat verfügbar, und Sie können direkt mit dem Modell chatten oder mit Artefakten spielen, suchen usw.“

Das alles ist DeepSeek zu verdanken, einem 2023 in Alibabas Heimatstadt Hangzhou gegründeten Start-up.

Mit der Veröffentlichung seiner DeepSeek-V3- und R1-Modelle hat DeepSeek Wellen im US-KI-Markt geschlagen.

Es hat auch schnell globale Aufmerksamkeit für seine signifikant niedrigen Kosten und Rechenleistung gewonnen, wobei Investoren die Rentabilität kostspieliger KI-Projekte von US-amerikanischen Unternehmen in Frage stellen.

Der Erfolg des Start-ups in China hat einen intensiven Wettbewerb unter den Technologieriesen des Landes ausgelöst.

Zum Beispiel reagierte das Mutterunternehmen von TikTok, ByteDance, nur zwei Tage nach der Einführung seines R1-Modells mit einem Update seines Flaggschiff-KI-Modells und behauptete, es übertreffe OpenAI’s o1 auf AIME, einem entscheidenden Benchmark-Test, der die KI-Leistung bei der Verständigung und Ausführung komplexer Anweisungen bewertet.

DeepSeek hatte jedoch bereits eine eigene mutige Behauptung aufgestellt und behauptet, dass sein R1-Modell in mehreren Leistungsbenchmarks mit OpenAI’s o1 konkurrieren oder es übertreffen könnte.

Erhalte neue Beiträge in deinem Posteingang.