🔍 Обзор

Gemini 3 Deep Think: AI, который думает как учёный

Google выпустила новый режим для своей флагманской модели — Gemini 3 Deep Think. Это не просто ещё одна итерация генеративного AI: Deep Think принципиально меняет подход к решению сложных задач, заставляя модель «думать» перед ответом — примерно так, как это делает учёный, разбирающий сложную проблему.

Что такое Deep Think: режим глубокого размышления

Deep Think — это специальный режим работы Gemini 3, при котором модель не генерирует ответ мгновенно, а проходит через несколько этапов внутреннего рассуждения:

  1. Декомпозиция задачи — модель разбивает сложный вопрос на подзадачи
  2. Генерация гипотез — формулирует несколько возможных подходов к решению
  3. Верификация — проверяет каждую гипотезу на внутреннюю непротиворечивость
  4. Синтез — объединяет проверенные результаты в финальный ответ
  5. Самокритика — оценивает уверенность в ответе и указывает на слабые места

Процесс занимает от 30 секунд до нескольких минут — значительно дольше, чем обычный ответ. Но результат качественно иной: модель решает задачи, которые ранее были недоступны любому AI.

Аналогия

Обычный режим Gemini — это как спросить эксперта на ходу: быстро, но поверхностно. Deep Think — как дать эксперту сесть за стол, взять бумагу и ручку и спокойно разобрать проблему. Ответ приходит позже, но его качество несопоставимо выше.

Чем отличается от обычного Gemini

ПараметрGemini 3 (обычный)Gemini 3 Deep Think
Время ответа2–5 секунд30 секунд — 5 минут
ПодходОдна попытка генерацииМногоэтапное рассуждение
Сложные задачиЧасто ошибаетсяРешает олимпиадные задачи
СамокритикаМинимальнаяВстроенная верификация
Цена (API)$3.50 / 1M токенов$25–50 / 1M токенов (вход + размышления)
ПрозрачностьТолько финальный ответПоказывает цепочку рассуждений
ГаллюцинацииСтандартный уровеньЗначительно ниже (−43%)

Ключевое отличие — прозрачность мышления. Deep Think показывает пользователю свою «цепочку рассуждений» (chain of thought), что позволяет понять, как модель пришла к ответу, и обнаружить ошибки в логике.

Бенчмарки: цифры, которые впечатляют

Главный бенчмарк, на котором Deep Think показал себя — Humanity's Last Exam (HLE). Это тест, составленный ведущими учёными мира, с задачами, которые требуют глубоких знаний и многоступенчатого рассуждения. На момент создания теста ни одна AI-модель не набирала более 10%.

Результаты Gemini 3 Deep Think

БенчмаркGemini 3 Deep ThinkGPT-5.4Claude 3.5 OpusGemini 3 (обычный)
Humanity's Last Exam48.4%39.2%36.7%18.1%
MATH-500 (математика)97.8%96.1%94.3%87.2%
GPQA Diamond (наука)82.1%78.5%76.9%62.4%
SWE-bench (код)56.3%58.7%55.1%41.8%
ARC-AGI (абстрактное мышление)71.2%64.8%61.3%43.7%
PhD-level Physics89.6%83.2%81.7%64.5%
Анализ данных (DSTC)91.4%87.9%85.2%72.1%

48.4% на Humanity's Last Exam — это прорыв. Для контекста: средний доктор наук набирает около 55–65% в своей области. Deep Think приближается к уровню эксперта в широком спектре дисциплин.

Где Deep Think особенно силён

  • Математика — решает олимпиадные задачи уровня IMO, включая нестандартные доказательства
  • Физика — многоступенчатые задачи, требующие комбинации нескольких принципов
  • Анализ данных — находит неочевидные паттерны, строит сложные статистические модели
  • Абстрактное мышление — задачи на аналогии, обобщения, поиск паттернов

Где пока уступает

  • Программирование — GPT-5.4 остаётся лидером на SWE-bench, хотя разрыв минимален
  • Творческие задачи — Deep Think оптимизирован на точность, не на креативность
  • Скорость — для быстрых простых задач обычный режим значительно эффективнее

Для кого Gemini 3 Deep Think

Учёные и исследователи

Deep Think — инструмент для тех, кто работает на переднем крае науки. Он может помочь в формулировке гипотез, проверке математических доказательств, анализе экспериментальных данных. Модель не заменяет учёного, но выступает «умным ассистентом», который видит связи между областями, которые человек может упустить.

Инженеры и разработчики

Для сложных архитектурных задач, оптимизации алгоритмов, отладки нетривиальных багов. Deep Think особенно полезен, когда нужно разобраться в многокомпонентной системе — он может проследить цепочку зависимостей и найти корень проблемы.

Аналитики данных

Анализ больших датасетов, выявление скрытых корреляций, построение предиктивных моделей. Deep Think показывает не только результат, но и методологию, что критически важно для воспроизводимости анализа.

Студенты и преподаватели

Для подготовки к олимпиадам, разбора сложных тем, создания учебных материалов. Прозрачность рассуждений делает Deep Think отличным «репетитором», который показывает ход решения, а не просто ответ.

Как получить доступ

Google AI Ultra

Deep Think доступен в рамках подписки Google AI Ultra ($49.99/мес). Подписка включает доступ ко всем моделям Gemini 3, расширенный контекст (до 2M токенов), приоритетную обработку запросов и Deep Think без ограничений по количеству запросов.

API

Для разработчиков Deep Think доступен через Google AI API. Стоимость: $25 за 1M входных токенов + $50 за 1M выходных токенов (включая токены размышления). Лимиты: до 100 запросов Deep Think в час на Tier 2 и выше.

Google AI Studio

Бесплатный доступ с ограничениями: до 10 запросов Deep Think в день, максимальная длина контекста 128K токенов. Достаточно для тестирования и нерегулярного использования.

Доступность из России

Ситуация с доступом из России неоднозначная:

Способ доступаДоступность из РФПримечания
Google AI Studio❌ ЗаблокированТребуется VPN + аккаунт в поддерживаемом регионе
Google AI Ultra подписка❌ ЗаблокированОплата российскими картами невозможна
API (Vertex AI)⚠ ОграниченДоступ через VPN, оплата иностранной картой или криптовалютой
Через сторонние сервисы✔ ДоступенOpenRouter, ProxyAPI и другие прокси-сервисы предоставляют доступ к Deep Think

Наиболее надёжный способ для российских пользователей — сторонние прокси-сервисы (OpenRouter, ProxyAPI), которые принимают оплату российскими картами и предоставляют доступ к API Gemini 3 Deep Think.

Практические примеры использования

Пример 1: Математическое доказательство

Задача: Доказать, что для всех простых p > 3, число p² − 1 делится на 24.

Deep Think: Модель разложила p² − 1 = (p−1)(p+1), показала, что для p > 3 оба множителя чётны и один из них делится на 4 (итого делится на 8), а среди трёх последовательных чисел p−1, p, p+1 ровно одно делится на 3 — и это не p (так как p простое и больше 3). Доказательство заняло 45 секунд и было корректным.

Пример 2: Анализ научной статьи

Задача: Найти методологические ошибки в исследовании о влиянии социальных сетей на подростков.

Deep Think: За 2 минуты модель выявила 4 проблемы: смещение выборки (только городские подростки), отсутствие контроля за временем экранного времени (самоотчёт vs. фактическое), путаницу корреляции с каузацией в выводах и недостаточный размер выборки для подгрупповых анализов.

Пример 3: Оптимизация алгоритма

Задача: Оптимизировать алгоритм маршрутизации для логистической компании с 500 точками доставки.

Deep Think: Предложил комбинацию кластеризации (K-means для географического разбиения на зоны) + модифицированного алгоритма Кларка-Райта для оптимизации внутри кластера + мета-эвристику (Simulated Annealing) для межкластерной балансировки. Включил оценку сложности O(n log n) и сравнение с наивным подходом O(n!).

Сравнение с конкурентами

Deep Think — не единственная модель с «режимом размышления». Аналогичные подходы есть у конкурентов:

МодельРежимHLE ScoreЦена (API, 1M)Скорость
Gemini 3 Deep ThinkDeep Think48.4%$25–5030 сек — 5 мин
GPT-5.4Reasoning (o3)39.2%$15–6015 сек — 3 мин
Claude 3.5 OpusExtended Thinking36.7%$15–7520 сек — 4 мин
DeepSeek-R1Reasoning28.3%$2–830 сек — 6 мин

Deep Think лидирует по качеству научных и математических задач, но уступает GPT-5.4 в программировании и стоит дороже DeepSeek-R1 при сопоставимом подходе.

Ограничения и подводные камни

  • Цена — Deep Think в 7–15 раз дороже обычного режима, что делает его нерентабельным для массовых запросов
  • Скорость — ожидание в несколько минут неприемлемо для интерактивных приложений
  • Не для всех задач — для простых вопросов (перевод, суммаризация, генерация текста) Deep Think избыточен и неэффективен
  • Токены размышления — модель генерирует большой объём «внутренних» токенов, которые оплачиваются, но не всегда видны пользователю
  • Галлюцинации не исчезли — уровень снижен на 43%, но не до нуля, верификация всё ещё необходима

Итог

Gemini 3 Deep Think — это шаг к AI, который не просто генерирует текст, а действительно думает. Результат 48.4% на Humanity's Last Exam показывает, что модель приближается к уровню экспертов в сложных задачах. Для учёных, инженеров и аналитиков это инструмент, который может существенно ускорить исследования и повысить качество решений.

Но Deep Think — не волшебная палочка. Он дорог, медлителен и не заменяет экспертизу. Это мощный усилитель человеческого интеллекта, а не его замена. Используйте его для задач, где качество важнее скорости, и всегда верифицируйте результаты.

💫 Попробуйте: Gemini → | Gemini API →

📈 Сравните: ChatGPT | Claude | Gemini

🤖 Каталог нейросетей: Все инструменты →

НС

Редакция НейроСкоп

Команда IT-специалистов, которая тестирует AI-инструменты каждый день. Пишем честные обзоры и практические гиды на русском языке.

Понравилась статья?

Поделитесь с коллегами и друзьями

Читайте также

Хотите больше таких статей?

Подпишитесь на еженедельный дайджест — новые инструменты, промпты и гиды каждую неделю

Подписаться бесплатно