
Google представила Gemini 3.1 Pro: ставка на «ядро интеллекта» и заметный рост в логических задачах
Что случилось
Google выпустила Gemini 3.1 Pro — обновление в линейке Gemini 3, которое компания позиционирует как усиление «базового интеллекта» модели: логики, рассуждений и способности решать задачи. Релиз доступен в формате preview и сопровождается обещанием дальнейших донастроек перед полноценным запуском.
Главное из анонса
Резкий скачок на ARC‑AGI‑2
Центральная цифра в презентации — результат на бенчмарке ARC‑AGI‑2 (абстрактные задачи на перенос правил и закономерностей): по данным Google, Gemini 3.1 Pro набирает 77,1% против 31,1% у Gemini 3 Pro. В сравнении, которое приводит Google, показатель также выше, чем у Anthropic Opus 4.6 (68,8%) и OpenAI GPT‑5.2 (52,9%).
«Глубокие» улучшения — в более массовом формате
В материале отмечается, что часть улучшений, ассоциируемых с Gemini 3 Deep Think, теперь подается как более прикладная версия — не только для исследовательских сценариев, а для повседневной разработки и работы с продуктами Google.
Демонстрации: от орбиты МКС до кода и графики
Google показывает «продвинутое рассуждение» на задачах, где нужно не просто сгенерировать текст, а связать шаги в единую цепочку действий. Среди примеров:
- настройка телеметрического потока с визуализацией орбиты Международной космической станции на отраслевом дашборде;
- генерация анимированных SVG по текстовому запросу;
- создание полноценных веб-страниц “с нуля” с упором на код.
Где можно попробовать
Доступ заявлен сразу в нескольких каналах:
- для разработчиков — через Gemini API и Google AI Studio;
- для корпоративных клиентов — через Vertex AI;
- для пользователей — в приложении Gemini и в NotebookLM (для последнего упоминаются ограничения по подписке).
Важная оговорка: бенчмарки — не приговор
Материал отдельно подчеркивает: даже впечатляющие цифры — это всего лишь тесты, и они не гарантируют такого же превосходства в реальных задачах. Смысловой вывод простой: итоговое качество лучше проверять на собственных промптах и сценариях, особенно если важны устойчивость, инструменты, контекст и надежность.
Источник: The Decoder


