Google выпустила новый режим для своей флагманской модели — Gemini 3 Deep Think. Это не просто ещё одна итерация генеративного AI: Deep Think принципиально меняет подход к решению сложных задач, заставляя модель «думать» перед ответом — примерно так, как это делает учёный, разбирающий сложную проблему.
Что такое Deep Think: режим глубокого размышления
Deep Think — это специальный режим работы Gemini 3, при котором модель не генерирует ответ мгновенно, а проходит через несколько этапов внутреннего рассуждения:
- Декомпозиция задачи — модель разбивает сложный вопрос на подзадачи
- Генерация гипотез — формулирует несколько возможных подходов к решению
- Верификация — проверяет каждую гипотезу на внутреннюю непротиворечивость
- Синтез — объединяет проверенные результаты в финальный ответ
- Самокритика — оценивает уверенность в ответе и указывает на слабые места
Процесс занимает от 30 секунд до нескольких минут — значительно дольше, чем обычный ответ. Но результат качественно иной: модель решает задачи, которые ранее были недоступны любому AI.
Аналогия
Обычный режим Gemini — это как спросить эксперта на ходу: быстро, но поверхностно. Deep Think — как дать эксперту сесть за стол, взять бумагу и ручку и спокойно разобрать проблему. Ответ приходит позже, но его качество несопоставимо выше.
Чем отличается от обычного Gemini
| Параметр | Gemini 3 (обычный) | Gemini 3 Deep Think |
|---|---|---|
| Время ответа | 2–5 секунд | 30 секунд — 5 минут |
| Подход | Одна попытка генерации | Многоэтапное рассуждение |
| Сложные задачи | Часто ошибается | Решает олимпиадные задачи |
| Самокритика | Минимальная | Встроенная верификация |
| Цена (API) | $3.50 / 1M токенов | $25–50 / 1M токенов (вход + размышления) |
| Прозрачность | Только финальный ответ | Показывает цепочку рассуждений |
| Галлюцинации | Стандартный уровень | Значительно ниже (−43%) |
Ключевое отличие — прозрачность мышления. Deep Think показывает пользователю свою «цепочку рассуждений» (chain of thought), что позволяет понять, как модель пришла к ответу, и обнаружить ошибки в логике.
Бенчмарки: цифры, которые впечатляют
Главный бенчмарк, на котором Deep Think показал себя — Humanity's Last Exam (HLE). Это тест, составленный ведущими учёными мира, с задачами, которые требуют глубоких знаний и многоступенчатого рассуждения. На момент создания теста ни одна AI-модель не набирала более 10%.
Результаты Gemini 3 Deep Think
| Бенчмарк | Gemini 3 Deep Think | GPT-5.4 | Claude 3.5 Opus | Gemini 3 (обычный) |
|---|---|---|---|---|
| Humanity's Last Exam | 48.4% | 39.2% | 36.7% | 18.1% |
| MATH-500 (математика) | 97.8% | 96.1% | 94.3% | 87.2% |
| GPQA Diamond (наука) | 82.1% | 78.5% | 76.9% | 62.4% |
| SWE-bench (код) | 56.3% | 58.7% | 55.1% | 41.8% |
| ARC-AGI (абстрактное мышление) | 71.2% | 64.8% | 61.3% | 43.7% |
| PhD-level Physics | 89.6% | 83.2% | 81.7% | 64.5% |
| Анализ данных (DSTC) | 91.4% | 87.9% | 85.2% | 72.1% |
48.4% на Humanity's Last Exam — это прорыв. Для контекста: средний доктор наук набирает около 55–65% в своей области. Deep Think приближается к уровню эксперта в широком спектре дисциплин.
Где Deep Think особенно силён
- Математика — решает олимпиадные задачи уровня IMO, включая нестандартные доказательства
- Физика — многоступенчатые задачи, требующие комбинации нескольких принципов
- Анализ данных — находит неочевидные паттерны, строит сложные статистические модели
- Абстрактное мышление — задачи на аналогии, обобщения, поиск паттернов
Где пока уступает
- Программирование — GPT-5.4 остаётся лидером на SWE-bench, хотя разрыв минимален
- Творческие задачи — Deep Think оптимизирован на точность, не на креативность
- Скорость — для быстрых простых задач обычный режим значительно эффективнее
Для кого Gemini 3 Deep Think
Учёные и исследователи
Deep Think — инструмент для тех, кто работает на переднем крае науки. Он может помочь в формулировке гипотез, проверке математических доказательств, анализе экспериментальных данных. Модель не заменяет учёного, но выступает «умным ассистентом», который видит связи между областями, которые человек может упустить.
Инженеры и разработчики
Для сложных архитектурных задач, оптимизации алгоритмов, отладки нетривиальных багов. Deep Think особенно полезен, когда нужно разобраться в многокомпонентной системе — он может проследить цепочку зависимостей и найти корень проблемы.
Аналитики данных
Анализ больших датасетов, выявление скрытых корреляций, построение предиктивных моделей. Deep Think показывает не только результат, но и методологию, что критически важно для воспроизводимости анализа.
Студенты и преподаватели
Для подготовки к олимпиадам, разбора сложных тем, создания учебных материалов. Прозрачность рассуждений делает Deep Think отличным «репетитором», который показывает ход решения, а не просто ответ.
Как получить доступ
Google AI Ultra
Deep Think доступен в рамках подписки Google AI Ultra ($49.99/мес). Подписка включает доступ ко всем моделям Gemini 3, расширенный контекст (до 2M токенов), приоритетную обработку запросов и Deep Think без ограничений по количеству запросов.
API
Для разработчиков Deep Think доступен через Google AI API. Стоимость: $25 за 1M входных токенов + $50 за 1M выходных токенов (включая токены размышления). Лимиты: до 100 запросов Deep Think в час на Tier 2 и выше.
Google AI Studio
Бесплатный доступ с ограничениями: до 10 запросов Deep Think в день, максимальная длина контекста 128K токенов. Достаточно для тестирования и нерегулярного использования.
Доступность из России
Ситуация с доступом из России неоднозначная:
| Способ доступа | Доступность из РФ | Примечания |
|---|---|---|
| Google AI Studio | ❌ Заблокирован | Требуется VPN + аккаунт в поддерживаемом регионе |
| Google AI Ultra подписка | ❌ Заблокирован | Оплата российскими картами невозможна |
| API (Vertex AI) | ⚠ Ограничен | Доступ через VPN, оплата иностранной картой или криптовалютой |
| Через сторонние сервисы | ✔ Доступен | OpenRouter, ProxyAPI и другие прокси-сервисы предоставляют доступ к Deep Think |
Наиболее надёжный способ для российских пользователей — сторонние прокси-сервисы (OpenRouter, ProxyAPI), которые принимают оплату российскими картами и предоставляют доступ к API Gemini 3 Deep Think.
Практические примеры использования
Пример 1: Математическое доказательство
Задача: Доказать, что для всех простых p > 3, число p² − 1 делится на 24.
Deep Think: Модель разложила p² − 1 = (p−1)(p+1), показала, что для p > 3 оба множителя чётны и один из них делится на 4 (итого делится на 8), а среди трёх последовательных чисел p−1, p, p+1 ровно одно делится на 3 — и это не p (так как p простое и больше 3). Доказательство заняло 45 секунд и было корректным.
Пример 2: Анализ научной статьи
Задача: Найти методологические ошибки в исследовании о влиянии социальных сетей на подростков.
Deep Think: За 2 минуты модель выявила 4 проблемы: смещение выборки (только городские подростки), отсутствие контроля за временем экранного времени (самоотчёт vs. фактическое), путаницу корреляции с каузацией в выводах и недостаточный размер выборки для подгрупповых анализов.
Пример 3: Оптимизация алгоритма
Задача: Оптимизировать алгоритм маршрутизации для логистической компании с 500 точками доставки.
Deep Think: Предложил комбинацию кластеризации (K-means для географического разбиения на зоны) + модифицированного алгоритма Кларка-Райта для оптимизации внутри кластера + мета-эвристику (Simulated Annealing) для межкластерной балансировки. Включил оценку сложности O(n log n) и сравнение с наивным подходом O(n!).
Сравнение с конкурентами
Deep Think — не единственная модель с «режимом размышления». Аналогичные подходы есть у конкурентов:
| Модель | Режим | HLE Score | Цена (API, 1M) | Скорость |
|---|---|---|---|---|
| Gemini 3 Deep Think | Deep Think | 48.4% | $25–50 | 30 сек — 5 мин |
| GPT-5.4 | Reasoning (o3) | 39.2% | $15–60 | 15 сек — 3 мин |
| Claude 3.5 Opus | Extended Thinking | 36.7% | $15–75 | 20 сек — 4 мин |
| DeepSeek-R1 | Reasoning | 28.3% | $2–8 | 30 сек — 6 мин |
Deep Think лидирует по качеству научных и математических задач, но уступает GPT-5.4 в программировании и стоит дороже DeepSeek-R1 при сопоставимом подходе.
Ограничения и подводные камни
- Цена — Deep Think в 7–15 раз дороже обычного режима, что делает его нерентабельным для массовых запросов
- Скорость — ожидание в несколько минут неприемлемо для интерактивных приложений
- Не для всех задач — для простых вопросов (перевод, суммаризация, генерация текста) Deep Think избыточен и неэффективен
- Токены размышления — модель генерирует большой объём «внутренних» токенов, которые оплачиваются, но не всегда видны пользователю
- Галлюцинации не исчезли — уровень снижен на 43%, но не до нуля, верификация всё ещё необходима
Итог
Gemini 3 Deep Think — это шаг к AI, который не просто генерирует текст, а действительно думает. Результат 48.4% на Humanity's Last Exam показывает, что модель приближается к уровню экспертов в сложных задачах. Для учёных, инженеров и аналитиков это инструмент, который может существенно ускорить исследования и повысить качество решений.
Но Deep Think — не волшебная палочка. Он дорог, медлителен и не заменяет экспертизу. Это мощный усилитель человеческого интеллекта, а не его замена. Используйте его для задач, где качество важнее скорости, и всегда верифицируйте результаты.
💫 Попробуйте: Gemini → | Gemini API →
📈 Сравните: ChatGPT | Claude | Gemini
🤖 Каталог нейросетей: Все инструменты →