Рейтинг AI-моделей 2026

По данным Arena — крупнейшего независимого бенчмарка. 5 602 397 голосов, 330 моделей.

🥇
Claude Opus 4.6 (Thinking)
Anthropic
1502
11 801 голосов
🥈
Claude Opus 4.6
Anthropic
1501
12 546 голосов
🥉
Gemini 3.1 Pro Preview
Google
1493
14 677 голосов

Лидеры по компаниям

Anthropic
10 моделей в топ-30 · лучшая #1
1502
Google
5 моделей в топ-30 · лучшая #3
1493
OpenAI
5 моделей в топ-30 · лучшая #6
1485
xAI
4 моделей в топ-30 · лучшая #4
1492
Alibaba
2 моделей в топ-30 · лучшая #14
1464
ByteDance
1 моделей в топ-30 · лучшая #18
1462
Baidu
2 моделей в топ-30 · лучшая #25
1452
Moonshot
1 моделей в топ-30 · лучшая #22
1453

Полный рейтинг топ-30

#МодельКомпанияArena Score
1Claude Opus 4.6 (Thinking)Anthropic1502
2Claude Opus 4.6Anthropic1501
3Gemini 3.1 Pro PreviewGoogle1493
4Grok 4.20 BetaxAI1492
5Gemini 3 ProGoogle1486
6GPT-5.4 HighOpenAI1485
7GPT-5.2OpenAI1482
8Grok 4.20 (Reasoning)xAI1481
9Gemini 3 FlashGoogle1475
10Claude Opus 4.5 (Thinking)Anthropic1474
11Grok 4.1 (Thinking)xAI1472
12Claude Opus 4.5Anthropic1469
13Claude Sonnet 4.6Anthropic1465
14Qwen 3.5 Max PreviewAlibaba1464
15GPT-5.3OpenAI1464
16Gemini 3 Flash (Thinking)Google1463
17GPT-5.4OpenAI1463
18Dola Seed 2.0ByteDance1462
19Grok 4.1xAI1461
20GPT-5.1 HighOpenAI1455
21GLM-5Z.ai (Zhipu)1455
22Kimi K2.5 (Thinking)Moonshot1453
23Claude Sonnet 4.5Anthropic1453
24Claude Sonnet 4.5 (Thinking)Anthropic1453
25ERNIE 5.0Baidu1452
26Qwen 3.5 397B (Open Source)Alibaba1452
27ERNIE 5.0 PreviewBaidu1450
28Claude Opus 4.1 (Thinking)Anthropic1449
29Gemini 2.5 ProGoogle1448
30Claude Opus 4.1Anthropic1447

Как читать рейтинг

  • Arena Score — ELO-рейтинг по результатам слепых сравнений. Пользователи выбирают лучший ответ из двух анонимных моделей.
  • Голоса — количество сравнений, в которых участвовала модель. Больше голосов = надёжнее оценка.
  • Thinking — модели с цепочкой рассуждений (chain-of-thought). Обычно лучше на сложных задачах.

Источник: arena.ai. Обновлено: 22 марта 2026 г..

ещё 3
Сравнить (0)