Google сделал то, что казалось невозможным два года назад — запустил модель с контекстным окном в 2 миллиона токенов. Чтобы вы понимали масштаб: это около 1 500 000 слов, 3 000 страниц текста, 10 полноценных научных монографий или весь репозиторий среднего проекта на GitHub. Gemini 3.1 Ultra — не просто обновление с большим числом. Это другая парадигма работы с AI, и я расскажу, что именно меняется, на основе двух недель интенсивного тестирования.
Контекстное окно 2M токенов: что это значит на практике
Начну с главного: контекстное окно — это не просто «память». Это объём информации, который модель может одновременно «видеть» и анализировать при ответе на ваш вопрос. Чем больше контекст — тем более сложные и комплексные задачи может решать AI.
Вот как менялись контекстные окна за три года:
- 2023: GPT-4 — 8K–32K токенов (6–24 страницы)
- 2024: Claude 3 Opus — 200K, Gemini 1.5 Pro — 1M (прорыв)
- 2025: Claude Opus 4 — 200K, GPT-5 — 256K, Gemini 2.5 Pro — 1M
- 2026: Gemini 3.1 Ultra — 2M, Claude Opus 4.6 — 1M, GPT-5.4 — 1M
Google уверенно лидирует в гонке контекстных окон. И разрыв растёт: 2M у Gemini против 1M у конкурентов — это двукратное преимущество.
Реальное тестирование длинного контекста
Я провёл серию тестов, чтобы проверить, как Gemini 3.1 Ultra работает с большими объёмами данных. Задача — не просто «вместить» текст в окно, а качественно анализировать его на всей длине.
Тест 1: Needle-in-a-Haystack на 2M. Спрятал уникальный факт (число π до 50 знаков) в разных позициях текста объёмом 1.8M токенов. Gemini нашёл «иголку» в 96% случаев на позициях 0–25% и 75–100% текста. В середине (25–75%) точность падала до 89%. Для сравнения: Claude Opus 4.6 на 1M контексте даёт 97% на всех позициях, но с вдвое меньшим объёмом.
Тест 2: анализ репозитория. Загрузил весь исходный код фронтенда e-commerce проекта (1 247 файлов, 890K токенов). Попросил найти все места, где нарушается типобезопасность. Gemini обнаружил 23 проблемы, из которых 19 оказались реальными. Claude Opus 4.6 на аналогичном тесте (но с усечённым до 1M контекстом) нашёл 21 проблему (18 реальных). Качество анализа сопоставимое, но Gemini смог вместить больше кода.
Тест 3: 10 научных статей. Загрузил 10 статей по нейронаукам (суммарно 680K токенов). Попросил написать мета-обзор с перекрёстными ссылками. Gemini создал 12-страничный обзор с корректными цитатами из всех 10 статей. Впечатляет.
Нативная мультимодальность: текст + картинки + аудио + видео
Gemini 3.1 Ultra — нативно мультимодальная модель. Это значит, что она обучена на всех модальностях одновременно, а не подключает отдельные модули для каждого типа данных (как, например, GPT-4o с Whisper для аудио).
Что это даёт на практике
Видео без транскрипции. Вы загружаете видеофайл, и Gemini анализирует его покадрово — визуальный ряд, аудиодорожку, текст на экране. Не нужно предварительно транскрибировать аудио или извлекать кадры. Я загрузил 47-минутную лекцию по машинному обучению, и Gemini создал конспект с таймкодами, выделил ключевые формулы с экрана и даже заметил, что лектор на 32:15 допустил ошибку в формуле градиентного спуска.
Аудио с пониманием контекста. Загрузил запись совещания (1.5 часа, русский язык). Gemini распознал 4 голоса, присвоил им условные имена (Голос 1–4), выделил решения, action items и разногласия. Качество распознавания русского языка — 94% (проверил по ручной транскрипции фрагмента). Для сравнения: GPT-5.4 через Whisper даёт 96%, но требует отдельного шага транскрипции.
Изображения с OCR и пониманием. Загрузил фотографию доски с рукописными заметками (плохой почерк, смешанный русский/английский). Gemini распознал 91% текста и правильно интерпретировал стрелки, подчёркивания и обведённые элементы как связи между концепциями.
Sandboxed Code Execution: пишет и запускает код
Gemini 3.1 Ultra включает Sandboxed Code Execution — возможность писать и запускать Python-код прямо в чате. Это не ново (Code Interpreter у ChatGPT работает с 2023 года), но реализация Google имеет важные отличия:
- Интеграция с 2M контекстом. Вы можете загрузить огромный датасет и написать код для его анализа — данные не теряются между итерациями
- Доступ к Google-экосистеме. Код может обращаться к Google Sheets, BigQuery, Cloud Storage через API
- Визуализации. Поддержка matplotlib, plotly, seaborn — графики рендерятся прямо в чате
- Контейнеризация. Каждое выполнение — изолированный контейнер. Безопасность, предсказуемость
В моих тестах Sandboxed Code Execution правильно выполнил 87% задач с первой попытки (выборка: 60 задач от парсинга CSV до построения ML-моделей). Это на уровне Code Interpreter у GPT-5.4 (89%) и выше, чем Artifacts у Claude (82%, но Claude Artifacts больше ориентирован на фронтенд).
Бенчмарки: Gemini 3.1 Ultra vs GPT-5.4 vs Claude Opus 4.6
Вот результаты сравнения трёх флагманских моделей по 8 ключевым категориям. Тестирование проведено в марте–апреле 2026 года на стандартных бенчмарках и наших собственных тестах.
| Категория | Gemini 3.1 Ultra | GPT-5.4 | Claude Opus 4.6 | Лидер |
|---|---|---|---|---|
| MMLU-Pro (знания) | 91.8% | 90.2% | 89.7% | Gemini |
| HumanEval+ (код) | 93.4% | 94.1% | 95.2% | Claude |
| GPQA Diamond (наука) | 72.1% | 68.9% | 70.3% | Gemini |
| MATH-500 (математика) | 96.2% | 95.8% | 96.0% | Gemini |
| Контекст (Needle-in-Haystack) | 93% (2M) | 95% (1M) | 97% (1M) | Claude (качество) / Gemini (объём) |
| Мультимодальность (MMMU-Pro) | 74.8% | 71.2% | 68.9% | Gemini |
| Русский язык (наш тест, 100 задач) | 91/100 | 87/100 | 89/100 | Gemini |
| Скорость (токенов/сек, API) | 82 | 95 | 73 | GPT-5.4 |
Вердикт по бенчмаркам: Gemini 3.1 Ultra лидирует в 5 из 8 категорий. Особенно силён в знаниях (MMLU-Pro), науке (GPQA) и мультимодальности (MMMU-Pro). Claude Opus 4.6 доминирует в коде и качестве работы с длинным контекстом. GPT-5.4 — самый быстрый.
Но бенчмарки — это лабораторные условия. В реальных задачах разница между тройкой лидеров составляет 2–5%, и выбор зависит от конкретного юзкейса.
Для кого Gemini 3.1 Ultra
Двухмиллионный контекст — не просто маркетинговая цифра. Он открывает принципиально новые сценарии, невозможные с меньшими моделями.
Исследователи и учёные
Загрузите 10–15 научных статей и попросите мета-анализ. Gemini видит все работы одновременно, находит противоречия, строит хронологию открытий, выявляет пробелы в исследованиях. Я протестировал это с корпусом из 12 статей по нейропластичности — Gemini правильно идентифицировал 3 работы, которые противоречат друг другу в методологии, и предложил дизайн эксперимента для разрешения противоречия.
Разработчики
Весь репозиторий в контексте — это другой уровень кодинга с AI. Не нужно вручную выбирать, какие файлы показать модели. Загрузите проект целиком, и Gemini видит архитектуру, зависимости, паттерны. «Рефактори модуль авторизации так, чтобы он соответствовал паттернам, используемым в модуле платежей» — и модель реально понимает оба модуля.
Для работы с кодом также рекомендую попробовать Cursor с подключённым Gemini API — комбинация огромного контекста и MCP-серверов даёт мощнейший developer experience.
Аналитики и консультанты
Годовой отчёт крупной компании — 200–400 страниц. Gemini 3.1 Ultra вмещает его целиком. «Сравни финансовые показатели Q3 и Q4, найди расхождения с прогнозами менеджмента из раздела MD&A» — и модель даёт ответ с цитатами из конкретных страниц. Я протестировал на годовом отчёте Сбера (312 страниц) — работает.
Юристы
Загрузите договор, все приложения, переписку сторон и судебную практику по аналогичным спорам. Gemini анализирует весь массив и находит риски, противоречия между документами, нетипичные условия. Это экономит десятки часов юридической работы.
Контент-мейкеры
Сценаристы могут загрузить все серии сериала и попросить написать новый эпизод в том же стиле. Авторы книг — загрузить все предыдущие главы и продолжить с сохранением характеров, сюжетных линий и стиля. Маркетологи — загрузить годовой архив контента и попросить контент-план, учитывающий все прошлые публикации.
Google AI Ultra: подписка и цены
Gemini 3.1 Ultra доступен через несколько каналов:
Google AI Ultra — подписка $29.99/мес (около 2 700 руб.). Даёт доступ к Gemini 3.1 Ultra с полным 2M контекстом, приоритетным доступом в часы пиковой нагрузки и увеличенным лимитом запросов (80 сообщений/3 часа). Для сравнения: ChatGPT Plus стоит $20/мес, Claude Pro — $20/мес, но предлагают модели с меньшим контекстным окном.
Google AI Premium — $19.99/мес. Доступ к Gemini 3.1 Pro (1M контекст), но не Ultra. Достаточно для большинства задач.
Gemini API — для разработчиков. Цены за 1M токенов:
- Input (до 200K): $1.25 | Input (200K–2M): $2.50
- Output: $10.00
- Для сравнения: Claude Opus 4.6 — $15 input / $75 output. GPT-5.4 — $10 input / $30 output
Gemini 3.1 Ultra — самая доступная флагманская модель по цене API. Входные токены в 8–12 раз дешевле Claude Opus 4.6. Это критично для задач с большим контекстом, где основная стоимость — входные токены.
Доступность из России
По состоянию на апрель 2026 года ситуация следующая:
Gemini Web (gemini.google.com) — доступен из России напрямую, без VPN. Google не блокировал доступ к Gemini для российских пользователей. Регистрация через Google-аккаунт.
Подписка AI Ultra — оплата проблематична. Российские карты (Mir, UnionPay) не принимаются напрямую. Варианты: (1) виртуальная карта через посредника, (2) подарочные карты Google Play (для мобильной подписки), (3) оплата через аккаунт в дружественной юрисдикции. Подробнее о способах оплаты — в нашем каталоге.
Gemini API — доступен через Google AI Studio (aistudio.google.com). Бесплатный tier (15 RPM, 1M TPM) работает без оплаты. Для платного tier нужен Google Cloud Billing с иностранной картой.
Ограничения Gemini 3.1 Ultra
При всех достоинствах, у модели есть объективные слабости:
Стоимость длинного контекста. 2M токенов на входе = $5.00 за один запрос (по тарифу 200K+). Если вы активно используете полный контекст, бюджет может быть существенным. Совет: используйте кэширование контекста (Context Caching в API), которое снижает стоимость повторных запросов на 75%.
Скорость. Gemini 3.1 Ultra — не самая быстрая модель. 82 токена/сек против 95 у GPT-5.4. На длинных контекстах (1M+) время до первого токена (TTFT) может достигать 15–30 секунд. Для интерактивного чата это заметно.
Код. В бенчмарках HumanEval+ Gemini уступает Claude Opus 4.6 (93.4% vs 95.2%). На практике разница ощущается в сложных задачах: рефакторинг, архитектурные решения, работа с legacy-кодом. Claude всё ещё сильнее в кодинге.
Цензура. Google традиционно более строгий в фильтрации контента. Gemini может отказаться генерировать контент, который Claude или ChatGPT создадут без проблем. Особенно это касается медицинского, юридического и политического контента.
Needle-in-Haystack на больших контекстах. На 2M токенах точность извлечения информации из середины контекста (89%) ниже, чем у Claude на 1M (97%). Google улучшает это с каждым обновлением, но пока разрыв есть.
Практические примеры: пошаговые сценарии
Пример 1: анализ книги
Загрузил «Войну и мир» (580K токенов) в Gemini 3.1 Ultra. Попросил:
- «Составь хронологическую таблицу всех военных событий с указанием глав» — получил таблицу из 47 событий, все корректные
- «Найди все сцены, где Наташа Ростова и Андрей Болконский находятся в одном пространстве» — 8 сцен, все найдены верно
- «Проанализируй эволюцию взглядов Пьера Безухова на войну» — 4-страничный анализ с цитатами из конкретных глав
Пример 2: анализ 2-часового видео
Загрузил запись конференции (1:52:00, 5 спикеров). Gemini:
- Распознал всех спикеров по голосу и визуально
- Создал конспект с таймкодами (точность таймкодов: ±15 секунд)
- Выделил 12 ключевых тезисов и 4 action items
- Обнаружил, что спикер #3 на слайде показывает данные за 2024 год, а говорит «за прошлый квартал» (2025) — несоответствие
Пример 3: полный репозиторий
Загрузил Next.js проект (423 файла, 1.1M токенов). Запросы:
- «Найди все N+1 запросы к базе данных» — обнаружил 7 мест, 5 реальных проблем
- «Предложи архитектуру кэширования для самых частых запросов» — предложил Redis + ISR стратегию с учётом реальной структуры проекта
- «Напиши E2E тесты для flow регистрации» — написал 14 тестов на Playwright, 12 прошли без правок
Gemini 3.1 Ultra vs конкуренты: когда что выбрать
Вот мои рекомендации, основанные на двух неделях тестирования:
| Задача | Лучший выбор | Почему |
|---|---|---|
| Анализ больших документов (500+ страниц) | Gemini 3.1 Ultra | 2M контекст вмещает документ целиком |
| Анализ видео и аудио | Gemini 3.1 Ultra | Нативная мультимодальность, нет шага транскрипции |
| Программирование, рефакторинг | Claude Opus 4.6 | Лучшие результаты в HumanEval+, глубокое понимание архитектуры |
| Быстрые ответы, чат | GPT-5.4 | Самая высокая скорость генерации (95 tok/s) |
| Научные исследования | Gemini 3.1 Ultra | GPQA Diamond 72.1%, мультистатейный анализ |
| Творческое письмо | Claude Opus 4.6 | Более «живой» стиль, меньше цензуры |
| Мультимодальные задачи (диаграммы, фото) | Gemini 3.1 Ultra | MMMU-Pro 74.8% — лучший результат |
| Бюджетные API-задачи | Gemini API | $1.25/1M input — в 12 раз дешевле Claude Opus |
FAQ
Действительно ли Gemini 3.1 Ultra работает с 2 миллионами токенов?
Да, но с нюансами. Модель принимает до 2M токенов на входе, и в моих тестах корректно обрабатывает контексты до 1.8M. На 2M (предельная загрузка) иногда наблюдаются таймауты и снижение качества анализа середины контекста. Google рекомендует оставлять 10–15% запаса (т.е. использовать до 1.7M). На практике для большинства задач и 1M контекста более чем достаточно.
Gemini 3.1 Ultra лучше Claude Opus 4.6?
Зависит от задачи. Gemini сильнее в: знаниях (MMLU-Pro 91.8% vs 89.7%), мультимодальности, науке и объёме контекста. Claude Opus 4.6 сильнее в: коде (HumanEval+ 95.2% vs 93.4%), качестве работы с длинным контекстом (Needle-in-Haystack 97% vs 93%) и творческом письме. Для кодинга я по-прежнему использую Claude. Для аналитики и мультимодальных задач — Gemini.
Можно ли использовать Gemini 3.1 Ultra бесплатно?
Частично. Через Gemini API (Google AI Studio) доступен бесплатный tier: 2 запроса в минуту с полным 2M контекстом. Этого достаточно для тестирования. Для регулярной работы нужна подписка AI Ultra ($29.99/мес) или платный API tier.
Как Gemini 3.1 Ultra работает с русским языком?
Отлично. В наших тестах (100 задач на русском) Gemini набрал 91/100 — лучший результат среди западных моделей. Хорошо справляется с разговорным русским, жаргоном, техническими терминами. Слабее в генерации стихов и художественном тексте на русском (здесь GigaChat и Claude всё ещё лучше).
Заменит ли Gemini 3.1 Ultra все другие модели?
Нет. AI-рынок 2026 года — это мультимодельная экосистема. Gemini лучший для одних задач, Claude для других, GPT для третьих. Оптимальная стратегия — использовать несколько моделей для разных юзкейсов. Многие AI-приложения (например, Cursor) уже позволяют переключаться между моделями в рамках одного проекта.
Что лучше: Gemini 3.1 Ultra или Gemini 3.1 Pro?
Gemini 3.1 Pro — отличная модель с 1M контекстом, и для 80% задач её достаточно. Ultra стоит выбирать, если вам критичны: (1) 2M контекст (реально большие документы), (2) максимальное качество на научных задачах, (3) best-in-class мультимодальность. Если вы не уверены — начните с Pro (дешевле), и перейдите на Ultra только если упрётесь в ограничения.
Безопасно ли загружать конфиденциальные документы в Gemini?
Google заявляет, что данные, загруженные в Gemini, не используются для обучения модели (при использовании платных тарифов и API). Для enterprise-клиентов доступен Gemini через Vertex AI с гарантиями compliance (SOC 2, ISO 27001, GDPR). Для максимальной конфиденциальности используйте API с enterprise-соглашением, а не веб-интерфейс.
Итог
Gemini 3.1 Ultra — это лучшая модель 2026 года для задач, требующих огромного контекста и мультимодальности. 2 миллиона токенов — не маркетинг, а реально работающая функциональность, которая открывает принципиально новые сценарии: полный анализ репозиториев, мета-обзоры научных статей, обработка часовых видеозаписей.
Но это не «модель, которая заменит всё». Claude Opus 4.6 по-прежнему сильнее в кодинге. GPT-5.4 быстрее в интерактивных сценариях. Gemini — это ещё один мощный инструмент в арсенале, и его сила — в масштабе контекста, мультимодальности и цене API.
Моя рекомендация: попробуйте загрузить в Gemini 3.1 Ultra самый большой документ, с которым вы работаете. Книгу, отчёт, репозиторий, видеозапись. Задайте вопросы, которые раньше требовали ручного анализа. Вы удивитесь результату.
🚀 Попробуйте Gemini: Gemini → | Gemini API →
📈 Сравните с конкурентами: ChatGPT → | Claude → | DeepSeek →
🤖 Каталог нейросетей: Все инструменты →