Google 26 марта выпустил обновлённый Gemini 3 Deep Think — специализированный режим для научных и инженерных задач. Модель показала 48.4% на Humanity's Last Exam без использования внешних инструментов, что является впечатляющим результатом для задач, созданных экспертами-людьми.
Для кого создан Deep Think
Режим Deep Think разработан совместно с учёными и инженерами для решения задач, у которых нет чётких или однозначных решений. Это принципиально отличает его от обычных чат-ботов, оптимизированных для бытовых запросов.
- Научные исследования — анализ данных экспериментов, поиск закономерностей, генерация гипотез
- Инженерные расчёты — сложные многоэтапные вычисления с проверкой промежуточных результатов
- Математика — доказательства, оптимизация, моделирование
Результаты бенчмарков
Humanity's Last Exam — набор из сложнейших вопросов, составленных экспертами разных областей. Результат 48.4% без внешних инструментов показывает, что модель способна решать задачи, которые ставят в тупик большинство людей.
Доступность
Gemini 3 Deep Think доступен для подписчиков Google AI Ultra и через API для разработчиков. Подробнее о возможностях Gemini — в нашем каталоге.