Item: Gemini 3 Deep Think
Rating: 4
Author: Максим Барыбин

Google выпустила новый режим для своей флагманской модели — Gemini 3 Deep Think. Это не просто ещё одна итерация генеративного AI: Deep Think принципиально меняет подход к решению сложных задач, заставляя модель «думать» перед ответом — примерно так, как это делает учёный, разбирающий сложную проблему.

Что такое Deep Think: режим глубокого размышления

Deep Think — это специальный режим работы Gemini 3, при котором модель не генерирует ответ мгновенно, а проходит через несколько этапов внутреннего рассуждения:

Декомпозиция задачи — модель разбивает сложный вопрос на подзадачи
Генерация гипотез — формулирует несколько возможных подходов к решению
Верификация — проверяет каждую гипотезу на внутреннюю непротиворечивость
Синтез — объединяет проверенные результаты в финальный ответ
Самокритика — оценивает уверенность в ответе и указывает на слабые места

Процесс занимает от 30 секунд до нескольких минут — значительно дольше, чем обычный ответ. Но результат качественно иной: модель решает задачи, которые ранее были недоступны любому AI.

Аналогия

Обычный режим Gemini — это как спросить эксперта на ходу: быстро, но поверхностно. Deep Think — как дать эксперту сесть за стол, взять бумагу и ручку и спокойно разобрать проблему. Ответ приходит позже, но его качество несопоставимо выше.

Чем отличается от обычного Gemini

Параметр	Gemini 3 (обычный)	Gemini 3 Deep Think
Время ответа	2–5 секунд	30 секунд — 5 минут
Подход	Одна попытка генерации	Многоэтапное рассуждение
Сложные задачи	Часто ошибается	Решает олимпиадные задачи
Самокритика	Минимальная	Встроенная верификация
Цена (API)	$3.50 / 1M токенов	$25–50 / 1M токенов (вход + размышления)
Прозрачность	Только финальный ответ	Показывает цепочку рассуждений
Галлюцинации	Стандартный уровень	Значительно ниже (−43%)

Ключевое отличие — прозрачность мышления. Deep Think показывает пользователю свою «цепочку рассуждений» (chain of thought), что позволяет понять, как модель пришла к ответу, и обнаружить ошибки в логике.

Бенчмарки: цифры, которые впечатляют

Главный бенчмарк, на котором Deep Think показал себя — Humanity's Last Exam (HLE). Это тест, составленный ведущими учёными мира, с задачами, которые требуют глубоких знаний и многоступенчатого рассуждения. На момент создания теста ни одна AI-модель не набирала более 10%.

Результаты Gemini 3 Deep Think

Бенчмарк	Gemini 3 Deep Think	GPT-5.4	Claude Opus 4.8	Gemini 3 (обычный)
Humanity's Last Exam	48.4%	39.2%	36.7%	18.1%
MATH-500 (математика)	97.8%	96.1%	94.3%	87.2%
GPQA Diamond (наука)	82.1%	78.5%	76.9%	62.4%
SWE-bench (код)	56.3%	58.7%	55.1%	41.8%
ARC-AGI (абстрактное мышление)	71.2%	64.8%	61.3%	43.7%
PhD-level Physics	89.6%	83.2%	81.7%	64.5%
Анализ данных (DSTC)	91.4%	87.9%	85.2%	72.1%

48.4% на Humanity's Last Exam — это прорыв. Для контекста: средний доктор наук набирает около 55–65% в своей области. Deep Think приближается к уровню эксперта в широком спектре дисциплин.

Где Deep Think особенно силён

Математика — решает олимпиадные задачи уровня IMO, включая нестандартные доказательства
Физика — многоступенчатые задачи, требующие комбинации нескольких принципов
Анализ данных — находит неочевидные паттерны, строит сложные статистические модели
Абстрактное мышление — задачи на аналогии, обобщения, поиск паттернов

Где пока уступает

Программирование — GPT-5.4 остаётся лидером на SWE-bench, хотя разрыв минимален
Творческие задачи — Deep Think оптимизирован на точность, не на креативность
Скорость — для быстрых простых задач обычный режим значительно эффективнее

Для кого Gemini 3 Deep Think

Учёные и исследователи

Deep Think — инструмент для тех, кто работает на переднем крае науки. Он может помочь в формулировке гипотез, проверке математических доказательств, анализе экспериментальных данных. Модель не заменяет учёного, но выступает «умным ассистентом», который видит связи между областями, которые человек может упустить.

Инженеры и разработчики

Для сложных архитектурных задач, оптимизации алгоритмов, отладки нетривиальных багов. Deep Think особенно полезен, когда нужно разобраться в многокомпонентной системе — он может проследить цепочку зависимостей и найти корень проблемы.

Аналитики данных

Анализ больших датасетов, выявление скрытых корреляций, построение предиктивных моделей. Deep Think показывает не только результат, но и методологию, что критически важно для воспроизводимости анализа.

Студенты и преподаватели

Для подготовки к олимпиадам, разбора сложных тем, создания учебных материалов. Прозрачность рассуждений делает Deep Think отличным «репетитором», который показывает ход решения, а не просто ответ.

Как получить доступ

Google AI Ultra

Deep Think доступен в рамках подписки Google AI Ultra ($49.99/мес). Подписка включает доступ ко всем моделям Gemini 3, расширенный контекст (до 2M токенов), приоритетную обработку запросов и Deep Think без ограничений по количеству запросов.

API

Для разработчиков Deep Think доступен через Google AI API. Стоимость: $25 за 1M входных токенов + $50 за 1M выходных токенов (включая токены размышления). Лимиты: до 100 запросов Deep Think в час на Tier 2 и выше.

Google AI Studio

Бесплатный доступ с ограничениями: до 10 запросов Deep Think в день, максимальная длина контекста 128K токенов. Достаточно для тестирования и нерегулярного использования.

Доступность из России

Ситуация с доступом из России неоднозначная:

Способ доступа	Доступность из РФ	Примечания
Google AI Studio	❌ Заблокирован	Требуется VPN + аккаунт в поддерживаемом регионе
Google AI Ultra подписка	❌ Заблокирован	Оплата российскими картами невозможна
API (Vertex AI)	⚠ Ограничен	Доступ через VPN, оплата иностранной картой или криптовалютой
Через сторонние сервисы	✔ Доступен	OpenRouter, ProxyAPI и другие прокси-сервисы предоставляют доступ к Deep Think

Наиболее надёжный способ для российских пользователей — сторонние прокси-сервисы (OpenRouter, ProxyAPI), которые принимают оплату российскими картами и предоставляют доступ к API Gemini 3 Deep Think.

Практические примеры использования

Пример 1: Математическое доказательство

Задача: Доказать, что для всех простых p > 3, число p² − 1 делится на 24.

Deep Think: Модель разложила p² − 1 = (p−1)(p+1), показала, что для p > 3 оба множителя чётны и один из них делится на 4 (итого делится на 8), а среди трёх последовательных чисел p−1, p, p+1 ровно одно делится на 3 — и это не p (так как p простое и больше 3). Доказательство заняло 45 секунд и было корректным.

Пример 2: Анализ научной статьи

Задача: Найти методологические ошибки в исследовании о влиянии социальных сетей на подростков.

Deep Think: За 2 минуты модель выявила 4 проблемы: смещение выборки (только городские подростки), отсутствие контроля за временем экранного времени (самоотчёт vs. фактическое), путаницу корреляции с каузацией в выводах и недостаточный размер выборки для подгрупповых анализов.

Пример 3: Оптимизация алгоритма

Задача: Оптимизировать алгоритм маршрутизации для логистической компании с 500 точками доставки.

Deep Think: Предложил комбинацию кластеризации (K-means для географического разбиения на зоны) + модифицированного алгоритма Кларка-Райта для оптимизации внутри кластера + мета-эвристику (Simulated Annealing) для межкластерной балансировки. Включил оценку сложности O(n log n) и сравнение с наивным подходом O(n!).

Сравнение с конкурентами

Deep Think — не единственная модель с «режимом размышления». Аналогичные подходы есть у конкурентов:

Модель	Режим	HLE Score	Цена (API, 1M)	Скорость
Gemini 3 Deep Think	Deep Think	48.4%	$25–50	30 сек — 5 мин
GPT-5.4	Reasoning (o3)	39.2%	$15–60	15 сек — 3 мин
Claude Opus 4.8	Extended Thinking	36.7%	$15–75	20 сек — 4 мин
DeepSeek-R1	Reasoning	28.3%	$2–8	30 сек — 6 мин

Deep Think лидирует по качеству научных и математических задач, но уступает GPT-5.4 в программировании и стоит дороже DeepSeek-R1 при сопоставимом подходе.

Ограничения и подводные камни

Цена — Deep Think в 7–15 раз дороже обычного режима, что делает его нерентабельным для массовых запросов
Скорость — ожидание в несколько минут неприемлемо для интерактивных приложений
Не для всех задач — для простых вопросов (перевод, суммаризация, генерация текста) Deep Think избыточен и неэффективен
Токены размышления — модель генерирует большой объём «внутренних» токенов, которые оплачиваются, но не всегда видны пользователю
Галлюцинации не исчезли — уровень снижен на 43%, но не до нуля, верификация всё ещё необходима

Итог

Gemini 3 Deep Think — это шаг к AI, который не просто генерирует текст, а действительно думает. Результат 48.4% на Humanity's Last Exam показывает, что модель приближается к уровню экспертов в сложных задачах. Для учёных, инженеров и аналитиков это инструмент, который может существенно ускорить исследования и повысить качество решений.

Но Deep Think — не волшебная палочка. Он дорог, медлителен и не заменяет экспертизу. Это мощный усилитель человеческого интеллекта, а не его замена. Используйте его для задач, где качество важнее скорости, и всегда верифицируйте результаты.

💫 Попробуйте: Gemini → | Gemini API →

📈 Сравните: ChatGPT | Claude | Gemini

🤖 Каталог нейросетей: Все инструменты →

Gemini 3 Deep Think: AI, который думает как учёный