Alibaba и Moonshot бросают вызов OpenAI и Google


Alibaba называет Qwen3-Max-Thinking «лучшей моделью на сегодняшний день», а Moonshot называет Kimi K2.5 самой мощной открытой моделью в мире. (SCMP)

Alibaba Group Holding и Moonshot AI представили свои последние флагманские модели искусственного интеллекта, сокращая разрыв с американскими лидерами отрасли OpenAI и Google DeepMind.
Новые модели от двух ведущих китайских разработчиков ИИ стали первыми крупными китайскими релизами моделей в этом году, поскольку наблюдатели отрасли продолжают внимательно следить за разрывом между США и Китаем в разработке передовых базовых моделей.

Alibaba Cloud в понедельник анонсировала свою самую крупную модель Qwen3-Max-Thinking, которая, по их словам, обладает более эффективными возможностями использования агентов и инструментов. Модель была выпущена на официальной облачной платформе Alibaba и сайте чат-бота, и вскоре она будет доступна в новом потребительском приложении Qwen, говорится в компании.

Alibaba Cloud — это подразделение по искусственному интеллекту и облачным вычислениям компании Alibaba Group Holding, которой принадлежит газета Post.

«Это наша лучшая модель на сегодняшний день», — написал исследователь Alibaba Чжэн Чуцзе в социальных сетях. «У нас есть ... приложить огромные усилия [в] улучшение реального пользовательского опыта.»

Эта модель является последней в серии Qwen3 компании из Ханчжоу, впервые выпущенной в мае, которая изначально состояла из моделей с объёмом от 600 миллионов до 235 миллиардов параметров и с тех пор достигла моделей с более чем 1 триллионом параметров, включая Qwen3-Max-Thinking.

Параметры — это переменные, кодирующие интеллект модели ИИ, которые корректируются во время обучения. В целом, большее количество параметров означает более функциональную модель, хотя также требуется больше вычислительных ресурсов.

В блоге Alibaba отметила, что производительность новой модели обусловлена дальнейшим увеличением размера модели и «значимыми вычислительными ресурсами для обучения с подкреплением».

Alibaba заявила, что использовала новые методы для повышения эффективности «масштабирования во время тестирования» — добавления дополнительных вычислительных ресурсов во время развертывания модели — за счёт фокуса вычислительных ресурсов на нерешённых неопределённостях, тем самым повышая производительность без значительных вычислительных расходов.

Во внутренних тестах Alibaba заявила, что модель достигла «сопоставимых» характеристик с ведущими американскими моделями, такими как Claude-Opus-4.5 от Anthropic и Gemini 3 Pro от Google DeepMind, на 19 тестах.

Однако некоторые поклонники Qwen выразили разочарование тем, что модель не была с открытым исходным кодом. Хотя Qwen — одна из самых популярных семейств открытых моделей в мире, Alibaba пока что сохранила свои самые крупные и мощные модели Max в закрытом виде и использовала их для работы в приложении Qwen.

Тем временем стартап Moonshot AI, поддерживаемый Alibaba, во вторник анонсировал свою новую модель Kimi K2.5, назвав её самой мощной в мире моделью с открытым исходным кодом.

Примечательно, что новая модель вводит функцию под названием agent swarm, позволяющую разработчикам лучше справляться со сложными задачами кода, используя до 100 субагентов, выполняющих рабочие процессы параллельно.

Компания заявила, что эта функция значительно поможет программистам, использующим модели Kimi, которые пекинский стартап позиционирует как более дешёвую альтернативу лидеру отрасли Anthropic, моделям Claude на ключевом рынке приложений для ИИ.

Новая модель стала первым случаем, когда Moonshot добавила мультимодальные возможности в свои продукты, позволяя обрабатывать и генерировать видео и изображения помимо текста.

И Moonshot, и команда Qwen выступают за законы масштабирования в ИИ — теорию о том, что добавление вычислительной мощности и данных обеспечит надежный рост производительности модели.

В дорожной карте, представленной в сентябре, команда Qwen объявила о целях масштабирования своих моделей до более чем 10 триллионов параметров, чтобы не отставать от американских аналогов, которые уже обучали модели такого размера.

Однако руководитель команды Qwen Линь Цзюнян на отраслевом мероприятии ранее в этом месяце намекнул, что вычислительные ограничения представляют собой серьёзную проблему, поскольку ресурсы загружены в ежедневную доставку, а не на исследования и разработки.
Винсент Чоу
(в пересказе) 

Мнение авторов может не совпадать с мнением редакции Некоммерческое сообщество журналистов Некоммерческая организация

No comments :