xAI Илона Маска запускает Grok 4, объявляя его самым умным ИИ на сегодняшний день

Компания ИИ Илона Маска, xAI, представила Grok 4, свою последнюю и самую мощную модель искусственного интеллекта (ИИ) на сегодняшний день, утверждая, что она теперь лидирует в области академических, логических и программных возможностей.

Маск не скупился на похвалы, назвав его “самым умным ИИ в мире” во время прямой трансляции в X (ранее Twitter) поздно вечером в среду.

В дополнение к Grok 4, xAI выпустила Grok 4 Heavy, более продвинутый вариант, который использует несколько ИИ-агентов, работающих вместе как виртуальная “учебная группа” для решения сложных задач. Выпуск также сопровождается новым подписочным планом высшего уровня: SuperGrok Heavy, который предлагает доступ к этой мощной модели за 300 долларов в месяц.

Сравнительные испытания: Grok против конкурентов

Согласно xAI, как Grok 4, так и его улучшенный аналог, Grok 4 Heavy, превзошли основных конкурентов, таких как Gemini 2.5 Pro от Google и o3-high от OpenAI, по различным ведущим показателям производительности ИИ:

Последний экзамен человечества (HLE): - Grok 4 набрал 4% без инструментов, обойдя Gemini 2.5 Pro (21.6%) и o3-high (21%).
Grok 4 Heavy, с инструментами, достиг 4%, значительно опередив Gemini с 26.9%.
ARC-AGI-2 (тест на распознавание образов): - Grok 4 набрал 2%, почти вдвое больше, чем следующий лучший модель, Claude Opus 4.
MMLU (массовое многозадачное понимание языка): - Grok 4 достиг 6% точности и индекса интеллекта 73, возглавив таблицы.

“Grok 4 - это первый случай, когда, по моему опыту, ИИ смог решить сложные инженерные задачи реального мира, где ответы нельзя найти нигде в Интернете или в книгах. И он станет намного лучше,” - написал Маск в X.

В области STEM и программирования модель выглядит еще сильнее:

Grok 4 Heavy набрал 100% на AIME, сложном тесте по математике для старшеклассников, в то время как Grok 4 достиг 98.8%.
На GPQA Grok 4 набрал 87.5%, в то время как вариант Grok 4 Heavy немного опередил его с 88.9%.
Для программистов xAI анонсировала предстоящий Grok 4 Code, который должен выйти в августе 2025 года и уже показывает 72–75% точности на SWE-bench.

Сравнивая PhD с Grok 4, Маск сказал, что “Grok 4 - это уровень аспирантуры, как уровень PhD, во всем. Лучше, чем PhD — без исключений. Большинство PhD провалились бы там, где Grok 4 сдал бы.”

Хотя он признал, что он все еще испытывает трудности с общим смыслом и не изобрел новые технологии или не открыл новую физику - “пока” но это всего лишь вопрос времени.

Новые цены

Цены на API Grok 4 будут такими же, как у его предшественника — 3 доллара за миллион входных токенов и 15 долларов за миллион выходных токенов ($0.75 за 1M кэшированных входных токенов).

Однако более крупный сюрприз заключается в обновленной подписочной линейке xAI:

Бесплатный уровень предоставляет пользователям ограниченный доступ к Grok 3.
План SuperGrok ($30/месяц) открывает доступ к обоим Grok 3 и новому Grok 4.
SuperGrok Heavy ($300/месяц) предлагает полный доступ к Grok 4 Heavy, Grok 4 и Grok 3, а также ранние превью предстоящих функций.

Grok 4 будет конкурировать с GPT-5?

Стремление xAI доминировать в области ИИ происходит как раз перед ожидаемым запуском GPT-5 от OpenAI позже этим летом. Хотя сильные результаты Grok 4 трудно игнорировать, вопрос остается: будут ли компании и клиенты игнорировать недавние споры и выбирать платформу Маска.

Get new posts in your inbox