Alibaba Afirma que Su Nuevo Modelo de IA Supera a DeepSeek y ChatGPT

En un movimiento audaz para competir en la industria de inteligencia artificial (IA) de rápido crecimiento, la empresa tecnológica china Alibaba lanzó el miércoles una nueva versión de su modelo de IA, Qwen 2.5-Max, afirmando que superó el rendimiento de modelos bien conocidos como la IA de DeepSeek, GPT-4o de OpenAI y Llama de Meta.

El lanzamiento de Qwen 2.5-Max en el primer día del Año Nuevo Lunar, un momento en el que muchas personas chinas tradicionalmente están fuera del trabajo y pasan tiempo con sus familias, subraya estratégicamente la presión que el meteórico ascenso de DeepSeek en las últimas tres semanas ha ejercido no solo sobre sus rivales en el extranjero, sino también sobre sus competidores nacionales, como Tencent Holdings Ltd. y Baidu Inc.

El nuevo modelo de la compañía ha sido desarrollado, según informes, sobre más de 20 billones de tokens y posteriormente ajustado con metodologías de Supervised Fine-Tuning (SFT) y Reinforcement Learning from Human Feedback (RLHF).

“Qwen 2.5-Max supera… casi en todos los aspectos a GPT-4o, DeepSeek-V3 y Llama-3.1-405B,” dijo la unidad de Cloud de Alibaba en un anuncio publicado en su cuenta oficial de WeChat, refiriéndose a gigantes internacionales como OpenAI y Meta.

Alibaba anunció que su Qwen2.5-Max supera a DeepSeek V3 en múltiples benchmarks, incluyendo Arena-Hard, LiveBench, LiveCodeBench y GPQA-Diamond.

También demostró resultados impresionantes en otras evaluaciones, incluyendo MMLU-Pro.

Los modelos base de la compañía han mostrado mejoras sustanciales en la mayoría de los benchmarks, y están seguros de que los avances en los métodos de post-entrenamiento elevarán la próxima versión de Qwen2.5-Max a niveles de rendimiento aún mayores.

“Al comparar modelos base, no podemos acceder a los modelos propietarios como GPT-4o y Claude-3.5-Sonnet. Por lo tanto, evaluamos Qwen2.5-Max contra DeepSeek V3, un modelo MoE de peso abierto líder, Llama-3.1-405B, el modelo denso de peso abierto más grande, y Qwen2.5-72B, que también está entre los principales modelos densos de peso abierto,” dijo la compañía en un blog.

Además, Qwen de Alibaba agregó: “Ahora Qwen2.5-Max está disponible en Qwen Chat, y puedes chatear directamente con el modelo, o jugar con artefactos, buscar, etc.”

Todo esto se debe a DeepSeek, una startup china fundada en 2023 en la ciudad natal de Alibaba, Hangzhou.

Con el lanzamiento de sus modelos DeepSeek-V3 y R1, DeepSeek ha enviado ondas de choque a través del paisaje de IA de EE. UU.

También ha ganado rápidamente atención global por su bajo costo significativo y poder de computación, con inversores cuestionando la viabilidad de proyectos de IA costosos de empresas con sede en EE. UU.

El éxito de la startup en China ha desatado una intensa competencia entre los gigantes tecnológicos del país.

Por ejemplo, solo dos días después de que DeepSeek lanzara su modelo R1, la empresa matriz de TikTok, ByteDance, respondió con una actualización a su modelo de IA insignia, afirmando que superó a OpenAI’s o1 en AIME, en una prueba de benchmark crucial que evalúa el rendimiento de la IA en la comprensión y ejecución de instrucciones complejas.

Sin embargo, DeepSeek ya había hecho su propia afirmación audaz, afirmando que su modelo R1 podría rivalizar o superar a OpenAI’s o1 en múltiples benchmarks de rendimiento.

Recibe nuevas publicaciones en tu bandeja de entrada.