Alibaba Affirma che il Suo Nuovo Modello AI Supera DeepSeek e ChatGPT

In una mossa audace per competere nell’industria dell’intelligenza artificiale (AI) in rapida crescita, la compagnia tecnologica cinese Alibaba ha lanciato mercoledì una nuova versione del suo modello AI, Qwen 2.5-Max, affermando che ha superato le prestazioni di modelli ben noti come l’AI di DeepSeek, il GPT-4o di OpenAI e il Llama di Meta.

Il rilascio di Qwen 2.5-Max nel primo giorno del Capodanno Lunare, un momento in cui molti cinesi sono tradizionalmente in ferie e trascorrono tempo con le loro famiglie, sottolinea strategicamente la pressione che l’ascesa meteoria di DeepSeek nelle ultime tre settimane ha esercitato non solo sui suoi rivali esteri ma anche sui suoi concorrenti domestici, come Tencent Holdings Ltd. e Baidu Inc.

Il nuovo modello dell’azienda è stato sviluppato su oltre 20 trilioni di token e ulteriormente post-addestrato con metodologie curate di Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF).

“Qwen 2.5-Max supera… quasi in tutti i casi GPT-4o, DeepSeek-V3 e Llama-3.1-405B,” ha dichiarato l’unità Cloud di Alibaba in un annuncio pubblicato sul suo account ufficiale WeChat, riferendosi a giganti internazionali come OpenAI e Meta.

Alibaba ha annunciato che il suo Qwen2.5-Max supera DeepSeek V3 in molteplici benchmark, tra cui Arena-Hard, LiveBench, LiveCodeBench e GPQA-Diamond.

Ha anche dimostrato risultati impressionanti in altre valutazioni, tra cui MMLU-Pro.

I modelli base dell’azienda hanno mostrato miglioramenti sostanziali nella maggior parte dei benchmark, e l’azienda è fiduciosa che i progressi nei metodi di post-addestramento porteranno la prossima versione di Qwen2.5-Max a livelli di prestazione ancora maggiori.

“Quando confrontiamo i modelli base, non possiamo accedere ai modelli proprietari come GPT-4o e Claude-3.5-Sonnet. Pertanto, valutiamo Qwen2.5-Max rispetto a DeepSeek V3, un modello MoE a peso aperto leader, Llama-3.1-405B, il più grande modello denso a peso aperto, e Qwen2.5-72B, che è anche tra i migliori modelli densi a peso aperto,” ha dichiarato l’azienda in un blog.

Inoltre, Qwen di Alibaba ha aggiunto: “Ora Qwen2.5-Max è disponibile in Qwen Chat, e puoi chattare direttamente con il modello, o giocare con artefatti, cercare, ecc.”

Tutto ciò è dovuto a DeepSeek, una start-up cinese fondata nel 2023 nella città natale di Alibaba, Hangzhou.

Con il rilascio dei suoi modelli DeepSeek-V3 e R1, DeepSeek ha inviato onde d’urto nel panorama AI degli Stati Uniti.

Ha anche rapidamente guadagnato attenzione globale per il suo costo significativamente basso e la potenza di calcolo, con gli investitori che mettono in discussione la fattibilità dei costosi progetti AI delle aziende statunitensi.

Il successo della start-up in Cina ha scatenato una intensa competizione tra i giganti tecnologici del paese.

Ad esempio, solo due giorni dopo il lancio del suo modello R1, la società madre di TikTok, ByteDance, ha risposto con un aggiornamento al suo modello AI di punta, affermando che supera l’o1 di OpenAI su AIME, in un test di benchmark cruciale che valuta le prestazioni dell’AI nella comprensione e nell’esecuzione di istruzioni complesse.

Tuttavia, DeepSeek aveva già fatto la sua audace affermazione, sostenendo che il suo modello R1 potrebbe competere o superare l’o1 di OpenAI su molteplici benchmark di prestazione.

Ricevi i nuovi post nella tua casella di posta.