Google Gemini 3.1 Ultra: обзор, 2M контекст, бенчмарки, цена [2026]

Item: Gemini 3.1 Ultra
Rating: 4
Author: Максим Барыбин

Google сделал то, что казалось невозможным два года назад — запустил модель с контекстным окном в 2 миллиона токенов. Чтобы вы понимали масштаб: это около 1 500 000 слов, 3 000 страниц текста, 10 полноценных научных монографий или весь репозиторий среднего проекта на GitHub. Gemini 3.1 Ultra — не просто обновление с большим числом. Это другая парадигма работы с AI, и я расскажу, что именно меняется, на основе двух недель интенсивного тестирования.

Контекстное окно 2M токенов: что это значит на практике

Начну с главного: контекстное окно — это не просто «память». Это объём информации, который модель может одновременно «видеть» и анализировать при ответе на ваш вопрос. Чем больше контекст — тем более сложные и комплексные задачи может решать AI.

Вот как менялись контекстные окна за три года:

2023: GPT-4 — 8K–32K токенов (6–24 страницы)
2024: Claude 3 Opus — 200K, Gemini 1.5 Pro — 1M (прорыв)
2025: Claude Opus 4 — 200K, GPT-5 — 256K, Gemini 2.5 Pro — 1M
2026: Gemini 3.1 Ultra — 2M, Claude Opus 4.6 — 1M, GPT-5.4 — 1M

Google уверенно лидирует в гонке контекстных окон. И разрыв растёт: 2M у Gemini против 1M у конкурентов — это двукратное преимущество.

Реальное тестирование длинного контекста

Я провёл серию тестов, чтобы проверить, как Gemini 3.1 Ultra работает с большими объёмами данных. Задача — не просто «вместить» текст в окно, а качественно анализировать его на всей длине.

Тест 1: Needle-in-a-Haystack на 2M. Спрятал уникальный факт (число π до 50 знаков) в разных позициях текста объёмом 1.8M токенов. Gemini нашёл «иголку» в 96% случаев на позициях 0–25% и 75–100% текста. В середине (25–75%) точность падала до 89%. Для сравнения: Claude Opus 4.6 на 1M контексте даёт 97% на всех позициях, но с вдвое меньшим объёмом.

Тест 2: анализ репозитория. Загрузил весь исходный код фронтенда e-commerce проекта (1 247 файлов, 890K токенов). Попросил найти все места, где нарушается типобезопасность. Gemini обнаружил 23 проблемы, из которых 19 оказались реальными. Claude Opus 4.6 на аналогичном тесте (но с усечённым до 1M контекстом) нашёл 21 проблему (18 реальных). Качество анализа сопоставимое, но Gemini смог вместить больше кода.

Тест 3: 10 научных статей. Загрузил 10 статей по нейронаукам (суммарно 680K токенов). Попросил написать мета-обзор с перекрёстными ссылками. Gemini создал 12-страничный обзор с корректными цитатами из всех 10 статей. Впечатляет.

Нативная мультимодальность: текст + картинки + аудио + видео

Gemini 3.1 Ultra — нативно мультимодальная модель. Это значит, что она обучена на всех модальностях одновременно, а не подключает отдельные модули для каждого типа данных (как, например, GPT-4o с Whisper для аудио).

Что это даёт на практике

Видео без транскрипции. Вы загружаете видеофайл, и Gemini анализирует его покадрово — визуальный ряд, аудиодорожку, текст на экране. Не нужно предварительно транскрибировать аудио или извлекать кадры. Я загрузил 47-минутную лекцию по машинному обучению, и Gemini создал конспект с таймкодами, выделил ключевые формулы с экрана и даже заметил, что лектор на 32:15 допустил ошибку в формуле градиентного спуска.

Аудио с пониманием контекста. Загрузил запись совещания (1.5 часа, русский язык). Gemini распознал 4 голоса, присвоил им условные имена (Голос 1–4), выделил решения, action items и разногласия. Качество распознавания русского языка — 94% (проверил по ручной транскрипции фрагмента). Для сравнения: GPT-5.4 через Whisper даёт 96%, но требует отдельного шага транскрипции.

Изображения с OCR и пониманием. Загрузил фотографию доски с рукописными заметками (плохой почерк, смешанный русский/английский). Gemini распознал 91% текста и правильно интерпретировал стрелки, подчёркивания и обведённые элементы как связи между концепциями.

Sandboxed Code Execution: пишет и запускает код

Gemini 3.1 Ultra включает Sandboxed Code Execution — возможность писать и запускать Python-код прямо в чате. Это не ново (Code Interpreter у ChatGPT работает с 2023 года), но реализация Google имеет важные отличия:

Интеграция с 2M контекстом. Вы можете загрузить огромный датасет и написать код для его анализа — данные не теряются между итерациями
Доступ к Google-экосистеме. Код может обращаться к Google Sheets, BigQuery, Cloud Storage через API
Визуализации. Поддержка matplotlib, plotly, seaborn — графики рендерятся прямо в чате
Контейнеризация. Каждое выполнение — изолированный контейнер. Безопасность, предсказуемость

В моих тестах Sandboxed Code Execution правильно выполнил 87% задач с первой попытки (выборка: 60 задач от парсинга CSV до построения ML-моделей). Это на уровне Code Interpreter у GPT-5.4 (89%) и выше, чем Artifacts у Claude (82%, но Claude Artifacts больше ориентирован на фронтенд).

Бенчмарки: Gemini 3.1 Ultra vs GPT-5.4 vs Claude Opus 4.6

Вот результаты сравнения трёх флагманских моделей по 8 ключевым категориям. Тестирование проведено в марте–апреле 2026 года на стандартных бенчмарках и наших собственных тестах.

Категория	Gemini 3.1 Ultra	GPT-5.4	Claude Opus 4.6	Лидер
MMLU-Pro (знания)	91.8%	90.2%	89.7%	Gemini
HumanEval+ (код)	93.4%	94.1%	95.2%	Claude
GPQA Diamond (наука)	72.1%	68.9%	70.3%	Gemini
MATH-500 (математика)	96.2%	95.8%	96.0%	Gemini
Контекст (Needle-in-Haystack)	93% (2M)	95% (1M)	97% (1M)	Claude (качество) / Gemini (объём)
Мультимодальность (MMMU-Pro)	74.8%	71.2%	68.9%	Gemini
Русский язык (наш тест, 100 задач)	91/100	87/100	89/100	Gemini
Скорость (токенов/сек, API)	82	95	73	GPT-5.4

Вердикт по бенчмаркам: Gemini 3.1 Ultra лидирует в 5 из 8 категорий. Особенно силён в знаниях (MMLU-Pro), науке (GPQA) и мультимодальности (MMMU-Pro). Claude Opus 4.6 доминирует в коде и качестве работы с длинным контекстом. GPT-5.4 — самый быстрый.

Но бенчмарки — это лабораторные условия. В реальных задачах разница между тройкой лидеров составляет 2–5%, и выбор зависит от конкретного юзкейса.

Для кого Gemini 3.1 Ultra

Двухмиллионный контекст — не просто маркетинговая цифра. Он открывает принципиально новые сценарии, невозможные с меньшими моделями.

Исследователи и учёные

Загрузите 10–15 научных статей и попросите мета-анализ. Gemini видит все работы одновременно, находит противоречия, строит хронологию открытий, выявляет пробелы в исследованиях. Я протестировал это с корпусом из 12 статей по нейропластичности — Gemini правильно идентифицировал 3 работы, которые противоречат друг другу в методологии, и предложил дизайн эксперимента для разрешения противоречия.

Разработчики

Весь репозиторий в контексте — это другой уровень кодинга с AI. Не нужно вручную выбирать, какие файлы показать модели. Загрузите проект целиком, и Gemini видит архитектуру, зависимости, паттерны. «Рефактори модуль авторизации так, чтобы он соответствовал паттернам, используемым в модуле платежей» — и модель реально понимает оба модуля.

Для работы с кодом также рекомендую попробовать Cursor с подключённым Gemini API — комбинация огромного контекста и MCP-серверов даёт мощнейший developer experience.

Аналитики и консультанты

Годовой отчёт крупной компании — 200–400 страниц. Gemini 3.1 Ultra вмещает его целиком. «Сравни финансовые показатели Q3 и Q4, найди расхождения с прогнозами менеджмента из раздела MD&A» — и модель даёт ответ с цитатами из конкретных страниц. Я протестировал на годовом отчёте Сбера (312 страниц) — работает.

Юристы

Загрузите договор, все приложения, переписку сторон и судебную практику по аналогичным спорам. Gemini анализирует весь массив и находит риски, противоречия между документами, нетипичные условия. Это экономит десятки часов юридической работы.

Контент-мейкеры

Сценаристы могут загрузить все серии сериала и попросить написать новый эпизод в том же стиле. Авторы книг — загрузить все предыдущие главы и продолжить с сохранением характеров, сюжетных линий и стиля. Маркетологи — загрузить годовой архив контента и попросить контент-план, учитывающий все прошлые публикации.

Google AI Ultra: подписка и цены

Gemini 3.1 Ultra доступен через несколько каналов:

Google AI Ultra — подписка $29.99/мес (около 2 700 руб.). Даёт доступ к Gemini 3.1 Ultra с полным 2M контекстом, приоритетным доступом в часы пиковой нагрузки и увеличенным лимитом запросов (80 сообщений/3 часа). Для сравнения: ChatGPT Plus стоит $20/мес, Claude Pro — $20/мес, но предлагают модели с меньшим контекстным окном.

Google AI Premium — $19.99/мес. Доступ к Gemini 3.1 Pro (1M контекст), но не Ultra. Достаточно для большинства задач.

Gemini API — для разработчиков. Цены за 1M токенов:

Input (до 200K): $1.25 | Input (200K–2M): $2.50
Output: $10.00
Для сравнения: Claude Opus 4.6 — $15 input / $75 output. GPT-5.4 — $10 input / $30 output

Gemini 3.1 Ultra — самая доступная флагманская модель по цене API. Входные токены в 8–12 раз дешевле Claude Opus 4.6. Это критично для задач с большим контекстом, где основная стоимость — входные токены.

Доступность из России

По состоянию на апрель 2026 года ситуация следующая:

Gemini Web (gemini.google.com) — доступен из России напрямую, без VPN. Google не блокировал доступ к Gemini для российских пользователей. Регистрация через Google-аккаунт.

Подписка AI Ultra — оплата проблематична. Российские карты (Mir, UnionPay) не принимаются напрямую. Варианты: (1) виртуальная карта через посредника, (2) подарочные карты Google Play (для мобильной подписки), (3) оплата через аккаунт в дружественной юрисдикции. Подробнее о способах оплаты — в нашем каталоге.

Gemini API — доступен через Google AI Studio (aistudio.google.com). Бесплатный tier (15 RPM, 1M TPM) работает без оплаты. Для платного tier нужен Google Cloud Billing с иностранной картой.

Ограничения Gemini 3.1 Ultra

При всех достоинствах, у модели есть объективные слабости:

Стоимость длинного контекста. 2M токенов на входе = $5.00 за один запрос (по тарифу 200K+). Если вы активно используете полный контекст, бюджет может быть существенным. Совет: используйте кэширование контекста (Context Caching в API), которое снижает стоимость повторных запросов на 75%.

Скорость. Gemini 3.1 Ultra — не самая быстрая модель. 82 токена/сек против 95 у GPT-5.4. На длинных контекстах (1M+) время до первого токена (TTFT) может достигать 15–30 секунд. Для интерактивного чата это заметно.

Код. В бенчмарках HumanEval+ Gemini уступает Claude Opus 4.6 (93.4% vs 95.2%). На практике разница ощущается в сложных задачах: рефакторинг, архитектурные решения, работа с legacy-кодом. Claude всё ещё сильнее в кодинге.

Цензура. Google традиционно более строгий в фильтрации контента. Gemini может отказаться генерировать контент, который Claude или ChatGPT создадут без проблем. Особенно это касается медицинского, юридического и политического контента.

Needle-in-Haystack на больших контекстах. На 2M токенах точность извлечения информации из середины контекста (89%) ниже, чем у Claude на 1M (97%). Google улучшает это с каждым обновлением, но пока разрыв есть.

Практические примеры: пошаговые сценарии

Пример 1: анализ книги

Загрузил «Войну и мир» (580K токенов) в Gemini 3.1 Ultra. Попросил:

«Составь хронологическую таблицу всех военных событий с указанием глав» — получил таблицу из 47 событий, все корректные
«Найди все сцены, где Наташа Ростова и Андрей Болконский находятся в одном пространстве» — 8 сцен, все найдены верно
«Проанализируй эволюцию взглядов Пьера Безухова на войну» — 4-страничный анализ с цитатами из конкретных глав

Пример 2: анализ 2-часового видео

Загрузил запись конференции (1:52:00, 5 спикеров). Gemini:

Распознал всех спикеров по голосу и визуально
Создал конспект с таймкодами (точность таймкодов: ±15 секунд)
Выделил 12 ключевых тезисов и 4 action items
Обнаружил, что спикер #3 на слайде показывает данные за 2024 год, а говорит «за прошлый квартал» (2025) — несоответствие

Пример 3: полный репозиторий

Загрузил Next.js проект (423 файла, 1.1M токенов). Запросы:

«Найди все N+1 запросы к базе данных» — обнаружил 7 мест, 5 реальных проблем
«Предложи архитектуру кэширования для самых частых запросов» — предложил Redis + ISR стратегию с учётом реальной структуры проекта
«Напиши E2E тесты для flow регистрации» — написал 14 тестов на Playwright, 12 прошли без правок

Gemini 3.1 Ultra vs конкуренты: когда что выбрать

Вот мои рекомендации, основанные на двух неделях тестирования:

Задача	Лучший выбор	Почему
Анализ больших документов (500+ страниц)	Gemini 3.1 Ultra	2M контекст вмещает документ целиком
Анализ видео и аудио	Gemini 3.1 Ultra	Нативная мультимодальность, нет шага транскрипции
Программирование, рефакторинг	Claude Opus 4.6	Лучшие результаты в HumanEval+, глубокое понимание архитектуры
Быстрые ответы, чат	GPT-5.4	Самая высокая скорость генерации (95 tok/s)
Научные исследования	Gemini 3.1 Ultra	GPQA Diamond 72.1%, мультистатейный анализ
Творческое письмо	Claude Opus 4.6	Более «живой» стиль, меньше цензуры
Мультимодальные задачи (диаграммы, фото)	Gemini 3.1 Ultra	MMMU-Pro 74.8% — лучший результат
Бюджетные API-задачи	Gemini API	$1.25/1M input — в 12 раз дешевле Claude Opus

FAQ

Действительно ли Gemini 3.1 Ultra работает с 2 миллионами токенов?

Да, но с нюансами. Модель принимает до 2M токенов на входе, и в моих тестах корректно обрабатывает контексты до 1.8M. На 2M (предельная загрузка) иногда наблюдаются таймауты и снижение качества анализа середины контекста. Google рекомендует оставлять 10–15% запаса (т.е. использовать до 1.7M). На практике для большинства задач и 1M контекста более чем достаточно.

Gemini 3.1 Ultra лучше Claude Opus 4.6?

Зависит от задачи. Gemini сильнее в: знаниях (MMLU-Pro 91.8% vs 89.7%), мультимодальности, науке и объёме контекста. Claude Opus 4.6 сильнее в: коде (HumanEval+ 95.2% vs 93.4%), качестве работы с длинным контекстом (Needle-in-Haystack 97% vs 93%) и творческом письме. Для кодинга я по-прежнему использую Claude. Для аналитики и мультимодальных задач — Gemini.

Можно ли использовать Gemini 3.1 Ultra бесплатно?

Частично. Через Gemini API (Google AI Studio) доступен бесплатный tier: 2 запроса в минуту с полным 2M контекстом. Этого достаточно для тестирования. Для регулярной работы нужна подписка AI Ultra ($29.99/мес) или платный API tier.

Как Gemini 3.1 Ultra работает с русским языком?

Отлично. В наших тестах (100 задач на русском) Gemini набрал 91/100 — лучший результат среди западных моделей. Хорошо справляется с разговорным русским, жаргоном, техническими терминами. Слабее в генерации стихов и художественном тексте на русском (здесь GigaChat и Claude всё ещё лучше).

Заменит ли Gemini 3.1 Ultra все другие модели?

Нет. AI-рынок 2026 года — это мультимодельная экосистема. Gemini лучший для одних задач, Claude для других, GPT для третьих. Оптимальная стратегия — использовать несколько моделей для разных юзкейсов. Многие AI-приложения (например, Cursor) уже позволяют переключаться между моделями в рамках одного проекта.

Что лучше: Gemini 3.1 Ultra или Gemini 3.1 Pro?

Gemini 3.1 Pro — отличная модель с 1M контекстом, и для 80% задач её достаточно. Ultra стоит выбирать, если вам критичны: (1) 2M контекст (реально большие документы), (2) максимальное качество на научных задачах, (3) best-in-class мультимодальность. Если вы не уверены — начните с Pro (дешевле), и перейдите на Ultra только если упрётесь в ограничения.

Безопасно ли загружать конфиденциальные документы в Gemini?

Google заявляет, что данные, загруженные в Gemini, не используются для обучения модели (при использовании платных тарифов и API). Для enterprise-клиентов доступен Gemini через Vertex AI с гарантиями compliance (SOC 2, ISO 27001, GDPR). Для максимальной конфиденциальности используйте API с enterprise-соглашением, а не веб-интерфейс.

Итог

Gemini 3.1 Ultra — это лучшая модель 2026 года для задач, требующих огромного контекста и мультимодальности. 2 миллиона токенов — не маркетинг, а реально работающая функциональность, которая открывает принципиально новые сценарии: полный анализ репозиториев, мета-обзоры научных статей, обработка часовых видеозаписей.

Но это не «модель, которая заменит всё». Claude Opus 4.6 по-прежнему сильнее в кодинге. GPT-5.4 быстрее в интерактивных сценариях. Gemini — это ещё один мощный инструмент в арсенале, и его сила — в масштабе контекста, мультимодальности и цене API.

Моя рекомендация: попробуйте загрузить в Gemini 3.1 Ultra самый большой документ, с которым вы работаете. Книгу, отчёт, репозиторий, видеозапись. Задайте вопросы, которые раньше требовали ручного анализа. Вы удивитесь результату.

🚀 Попробуйте Gemini: Gemini → | Gemini API →

📈 Сравните с конкурентами: ChatGPT → | Claude → | DeepSeek →

🤖 Каталог нейросетей: Все инструменты →

Gemini 3.1 Ultra: 2 миллиона токенов контекста и нативная мультимодальность