Alibaba Afirma que Seu Novo Modelo de IA Supera DeepSeek e ChatGPT

Em um movimento ousado para competir na crescente indústria de inteligência artificial (IA), a empresa de tecnologia chinesa Alibaba lançou na quarta-feira uma nova versão de seu modelo de IA, Qwen 2.5-Max, afirmando que superou o desempenho de modelos conhecidos como a IA da DeepSeek, o GPT-4o da OpenAI e o Llama da Meta.

O lançamento do Qwen 2.5-Max no primeiro dia do Ano Novo Lunar, um momento em que muitos chineses tradicionalmente estão de folga e passando tempo com suas famílias, destaca estrategicamente a pressão que a ascensão meteórica da DeepSeek nas últimas três semanas colocou não apenas sobre seus rivais no exterior, mas também sobre seus concorrentes domésticos, como Tencent Holdings Ltd. e Baidu Inc.

O novo modelo da empresa foi desenvolvido com base em mais de 20 trilhões de tokens e foi posteriormente treinado com metodologias de Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF).

“Qwen 2.5-Max supera… quase todos os aspectos o GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, disse a unidade de Nuvem da Alibaba em um anúncio publicado em sua conta oficial do WeChat, referindo-se a gigantes internacionais como OpenAI e Meta.

A Alibaba anunciou que seu Qwen2.5-Max supera o DeepSeek V3 em múltiplos benchmarks, incluindo Arena-Hard, LiveBench, LiveCodeBench e GPQA-Diamond.

Ele também demonstrou resultados impressionantes em outras avaliações, incluindo MMLU-Pro.

Os modelos base da empresa mostraram melhorias substanciais na maioria dos benchmarks, e a empresa está confiante de que os avanços nas metodologias de pós-treinamento elevarão a próxima versão do Qwen2.5-Max a níveis de desempenho ainda maiores.

“Ao comparar modelos base, não conseguimos acessar os modelos proprietários como GPT-4o e Claude-3.5-Sonnet. Portanto, avaliamos o Qwen2.5-Max em relação ao DeepSeek V3, um modelo MoE de peso aberto líder, Llama-3.1-405B, o maior modelo denso de peso aberto, e Qwen2.5-72B, que também está entre os principais modelos densos de peso aberto”, disse a empresa em um blog.

Além disso, a Qwen da Alibaba acrescentou: “Agora o Qwen2.5-Max está disponível no Qwen Chat, e você pode conversar diretamente com o modelo, ou brincar com artefatos, pesquisar, etc.”

Tudo isso se deve à DeepSeek, uma startup chinesa fundada em 2023 na cidade natal da Alibaba, Hangzhou.

Com o lançamento de seus modelos DeepSeek-V3 e R1, a DeepSeek enviou ondas de choque pelo cenário de IA dos EUA.

Ela também rapidamente ganhou atenção global por seu custo baixo significativo e poder computacional, com investidores questionando a viabilidade de projetos de IA caros de empresas baseadas nos EUA.

O sucesso da startup na China gerou uma intensa competição entre os gigantes da tecnologia do país.

Por exemplo, apenas dois dias após o lançamento do modelo R1 da DeepSeek, a empresa controladora do TikTok, ByteDance, respondeu com uma atualização de seu modelo de IA principal, afirmando que superou o o1 da OpenAI no AIME, em um teste de benchmark crucial que avalia o desempenho da IA em entender e executar instruções complexas.

No entanto, a DeepSeek já havia feito sua própria afirmação ousada, alegando que seu modelo R1 poderia rivalizar ou superar o o1 da OpenAI em múltiplos benchmarks de desempenho.

Receba novas postagens na sua caixa de entrada