Alibaba утверждает, что его новая модель ИИ превосходит DeepSeek и ChatGPT

В смелом шаге, чтобы конкурировать в быстрорастущей индустрии искусственного интеллекта (ИИ), китайская технологическая компания Alibaba в среду запустила новую версию своей модели ИИ, Qwen 2.5-Max, утверждая, что она превзошла производительность известных моделей, таких как ИИ DeepSeek, GPT-4o от OpenAI и Llama от Meta.

Выпуск Qwen 2.5-Max в первый день Лунного Нового года, когда многие китайцы традиционно отдыхают от работы и проводят время с семьями, стратегически подчеркивает давление, которое стремительный рост DeepSeek за последние три недели оказал не только на его зарубежных соперников, но и на его отечественных конкурентов, таких как Tencent Holdings Ltd. и Baidu Inc.

Новая модель компании, как сообщается, была разработана на основе более 20 триллионов токенов и дополнительно обучена с использованием курируемых методов Супервизионного Тонкого Настроя (SFT) и Обучения с Подкреплением на Основе Человеческой Обратной Связи (RLHF).

“Qwen 2.5-Max превосходит… почти во всех аспектах GPT-4o, DeepSeek-V3 и Llama-3.1-405B,” - заявила облачная единица Alibaba в объявлении, опубликованном на ее официальном аккаунте WeChat, ссылаясь на международных гигантов, таких как OpenAI и Meta.

Alibaba объявила, что ее Qwen2.5-Max превосходит DeepSeek V3 в нескольких бенчмарках, включая Arena-Hard, LiveBench, LiveCodeBench и GPQA-Diamond.

Она также продемонстрировала впечатляющие результаты в других оценках, включая MMLU-Pro.

Базовые модели компании показали значительные улучшения по большинству бенчмарков, и она уверена, что достижения в методах постобучения поднимут следующую версию Qwen2.5-Max на еще более высокий уровень производительности.

“При сравнении базовых моделей мы не можем получить доступ к проприетарным моделям, таким как GPT-4o и Claude-3.5-Sonnet. Поэтому мы оцениваем Qwen2.5-Max по сравнению с DeepSeek V3, ведущей моделью MoE с открытыми весами, Llama-3.1-405B, самой крупной моделью с открытыми весами, и Qwen2.5-72B, которая также входит в число лучших моделей с открытыми весами,” - говорится в блоге компании.

Кроме того, Qwen от Alibaba добавил: “Теперь Qwen2.5-Max доступен в Qwen Chat, и вы можете напрямую общаться с моделью или играть с артефактами, искать и т.д.”

Все это связано с DeepSeek, китайским стартапом, основанным в 2023 году в родном городе Alibaba Ханчжоу.

С выпуском своих моделей DeepSeek-V3 и R1, DeepSeek вызвал шок в американском ИИ-ландшафте.

Он также быстро привлек глобальное внимание благодаря своей значительной низкой стоимости и вычислительной мощности, при этом инвесторы ставят под сомнение жизнеспособность дорогих ИИ-проектов американских компаний.

Успех стартапа в Китае вызвал интенсивную конкуренцию среди технологических гигантов страны.

Например, всего через два дня после того, как DeepSeek запустил свою модель R1, материнская компания TikTok ByteDance ответила обновлением своей флагманской модели ИИ, утверждая, что она превосходит o1 от OpenAI в AIME, в важном тесте бенчмарка, который оценивает производительность ИИ в понимании и выполнении сложных инструкций.

Тем не менее, DeepSeek уже сделал свое смелое заявление, утверждая, что его модель R1 может соперничать или превосходить o1 от OpenAI по нескольким бенчмаркам производительности.

Get new posts in your inbox