Course
OpenAI только что выпустила первый переобученный базовый модельный релиз со времён GPT-4.5. Это может звучать парадоксально, но GPT-5 и все его последующие версии были инкрементальными обновлениями.
Здесь всё иначе: модель создана с нуля для агентных рабочих процессов и показывает высокие результаты по двум ключевым бенчмаркам, которые важнее всего для разработчиков.
В этой статье я сравню новейшую GPT-5.5 с Gemini 3.1 Pro, чтобы помочь вам решить, что подойдёт лучше. Мы рассмотрим бенчмарки, стоимость и варианты применения.
Что такое GPT-5.5?
GPT-5.5 — это новейшая флагманская омнимодальная модель OpenAI с кодовым названием «Spud». Это не дообучение предыдущей модели, а система, полностью перестроенная для автономного выполнения многозадачности практически без ручного сопровождения.
GPT-5.5 поставляется в трёх вариантах:
- Стандартная версия для большинства сценариев
- GPT-5.5 Thinking — для более сложных задач с расширенным «размышлением»
- GPT-5.5 Pro — для повышенной точности в областях вроде юридических исследований и финансового моделирования
Узнайте больше о модели в нашей статье OpenAI GPT-5.5 и в сравнении Claude Opus 4.7 vs GPT-5.5.
Ключевые возможности GPT-5.5
Основные функции и способности GPT-5.5:
- Изначально омнимодальная архитектура с поддержкой обработки текста, изображений, аудио и видео во внутри единой системы.
- 84,9% на GDPval и 78,7% на OSWorld — лучший результат среди всех передовых моделей на этих двух ключевых агентных бенчмарках.
- 82,7% на Terminal-Bench 2.0, а также уровень state-of-the-art на Artificial Analysis Coding Index примерно за половину стоимости конкурирующих флагманских кодовых моделей.
- В области кодирования GPT-5.5 набирает 58,6% на SWE-bench Pro.
- Улучшенная эффективность по токенам по сравнению с GPT-5.4 — требуется меньше токенов для сопоставимых задач Codex.
- Контекстное окно 1M токенов с улучшенной работой на очень больших длинах контекста.
Одним из важнейших улучшений стала работа с длинным контекстом в диапазоне 512K–1M: производительность более чем удвоилась — с 36,6% у GPT-5.4 до 74,0% у GPT-5.5.
Модель также сейчас сильнейшая в математике. На FrontierMath Tier 4 GPT-5.5 показывает 35,4%, а GPT-5.5 Pro — 39,6%. Для сравнения: GPT-5.4 — 27,1%, Claude Opus 4.7 — 22,9%, Gemini 3.1 Pro — 16,7%.

Плюсы и минусы GPT-5.5
Результат GPT-5.5 на OSWorld-Verified делает её лучшей моделью для работы с компьютером среди тех, кто публиковал результаты на этом бенчмарке. Она также превосходит другие модели в продвинутой математике. Эффективность по токенам — ещё одно преимущество для длительных агентных задач.
С другой стороны, GPT-5.5 дороже предыдущей модели: $5 за миллион входных токенов и $30 за миллион выходных. Компания утверждает, что она может обходиться дешевле благодаря большей эффективности по токенам, но это зависит от ваших рабочих процессов.
Что такое Gemini 3.1 Pro?
Gemini 3.1 Pro — это нынешняя флагманская модель Google с передовыми возможностями, построенная на архитектуре Mixture-of-Experts (MoE). Google разработала её для сильной мультимодальной работы и рассуждений по конкурентной цене.
Для сравнения с новейшей передовой моделью Anthropic прочитайте наш блог Claude Opus 4.7 vs Gemini 3.1 Pro.
Ключевые возможности Gemini 3.1 Pro
Основные функции и возможности Gemini 3.1 Pro:
-
Изначально мультимодальная поддержка текста и изображений. Аудио, видео и PDF.
-
Трёхуровневая система «мышления» с уровнями
low,mediumиhigh. -
Контекстное окно 1M токенов, до 65K выходных токенов и приём в одном запросе 8,4 часа аудио или полного часа видео.
-
77,1% на ARC-AGI-2 — сильное абстрактно-визуальное рассуждение, более чем вдвое превосходящее 31,1% у Gemini 3 Pro.
-
33,5% на APEX-Agents, измеряющем долгосрочные профессиональные задачи, — почти вдвое выше 18,4% у Gemini 3 Pro.
В нашем руководстве Создание на Gemini 3.1 Pro мы разбираем, как построить продакшен-приложение с Gemini 3.1 Pro и Gemini CLI.
Плюсы и минусы Gemini 3.1 Pro
Gemini 3.1 Pro блестяще справляется со сложными задачами визуального рассуждения и выигрывает у конкурентов благодаря изначально мультимодальному подходу, позволяющему обрабатывать текст, изображения, видео и аудио в одном запросе. В паре с огромным контекстным окном в 1M токенов вы сможете анализировать целые кодовые базы, длинные PDF или часы видео за один раз. Gemini 3.1 Pro также лежит в основе Nano Banana 2 и Veo 3.1 для генерации изображений и видео.
Минус в том, что у Gemini 3.1 Pro максимум 65K выходных токенов — этого может не хватить для длительных агентных задач. Это значит, что модель может не подойти для генерации очень длинных документов и агентных циклов с большими объёмами вывода.
Узнайте, как создать финансовую панель на Gemini 3 и настроить тестирование браузера на ИИ из нашего туториала Google Antigravity.
Сравнение GPT-5.5 и Gemini 3.1 Pro
Согласно Artificial Analysis Intelligence Index, GPT-5.5 — лучшая модель в целом на текущий момент, а также лидер их индексов по кодированию и агентности.

Сравнительная таблица GPT-5.5 и Gemini 3.1 Pro
|
GPT-5.5 |
Gemini 3.1 Pro |
|
|---|---|---|
|
Дата релиза |
23 апреля 2026 |
19 февраля 2026 |
|
Архитектура |
Омнимодальная (унифицированная) |
MoE (Transformer) |
|
Контекстное окно |
1M токенов |
1M токенов |
|
Макс. вывод |
128K токенов |
65K токенов |
|
OSWorld |
78,7% |
|
|
BrowseComp |
84,4% |
85,9% |
|
ARC-AGI-2 |
85,0% |
77,1% |
|
GPQA Diamond |
93,6% |
94,3% |
|
Terminal-Bench 2.0 |
82,7% |
68,5% |
|
FrontierMath Tier 4 |
35,4% (Pro 39,6%) |
16,7% |
|
SWE-Bench Pro |
58,6% |
54,2% |
|
Цена API (вход/выход за 1M) |
$5/$30 (Pro $30/$180) |
$2/$12 |
Давайте посмотрим на несколько вариантов использования.
Агентные процессы и работа за компьютером
GPT-5.5 набирает 78,7% на бенчмарке OSWorld-Verified для компьютерного использования, хотя публичного результата Gemini для сравнения нет. На практике возможности GPT-5.5 по работе с компьютером встроены в приложение Codex, где модель может навигировать и тестировать сайты. У Google схожий функционал реализован в приложении Antigravity.
Что касается веб-агентных задач, картина интереснее. Gemini 3.1 Pro немного впереди с 85,9% на BrowseComp против 84,4% у GPT-5.5, а также лучше выступает на MCP Atlas (бенчмарк, тестирующий работу с инструментами на 36 серверах MCP) — 78,2% против 75,3% у GPT-5.5.
При этом GPT-5.5 отыгрывается на Toolathon, где модель сталкивается с более чем 600 реальными инструментами: 55,6% против 48,8% у Gemini. GPT-5.5 также лидирует в Artificial Analysis Agentic Index, где Gemini 3.1 Pro заметно отстаёт, что видно на графике ниже.

Код и разработка ПО
В кодировании GPT-5.5 опережает Gemini 3.1 Pro: 58,6% на SWE-Bench Pro и 82,7% на Terminal-Bench 2.0 против 54,2% и 68,5% у Gemini 3.1 Pro. Особенно велик отрыв на Terminal-Bench 2.0.
GPT-5.5 лидирует в Artificial Analysis Coding Index, а Gemini 3.1 Pro следует сразу за ним.
Рассуждения и научные задачи
На ARC-AGI-2, который измеряет способность модели учиться и решать задачи без предварительного обучения, GPT-5.5 обходит Gemini 3.1 Pro почти на 8 пунктов (85,0% против 77,1%).
GPT-5.5 также лидирует в продвинутой математике с разницей в 18 пунктов по сравнению с Gemini 3.1 Pro по бенчмарку FrontierMath, который оценивает способность к рассуждению на экспертном уровне.
Стоимость и эффективность по токенам
Gemini 3.1 Pro стоит $2 за 1M входных токенов и $12 за 1M выходных. GPT-5.5 заметно дороже: $5 за 1M входных токенов и $30 за 1M выходных (и в шесть раз больше для версии Pro). Это делает GPT-5.5 более чем вдвое дороже Gemini 3.1 Pro.
Контекстное окно и объём вывода
У GPT-5.5 и Gemini 3.1 Pro одинаковое контекстное окно — 1M. Однако GPT-5.5 поддерживает 128K выходных токенов против 65K у Gemini.

GPT-5.5 vs Gemini 3.1 Pro: что выбрать?
Итак, какой из двух моделей отдать предпочтение?
Выберите GPT-5.5, если…
- Вы строите агентные конвейеры, которым нужно работать в реальных программных средах — браузерах, терминалах и десктопных приложениях — без пошаговых инструкций, или для вас приоритетна производительность в кодировании.
- Ваши процессы уже работают в экосистеме OpenAI Codex или ChatGPT, и стоимость переключения перевешивает разницу в цене.
- Вам нужна самая сильная на сегодня модель для продвинутой математики и задач уровня FrontierMath.
- Вы решаете задачи высокого уровня ответственности, где точность GPT-5.5 Pro в юридических, финансовых или научных задачах оправдывает высокую стоимость.
Выберите Gemini 3.1 Pro, если…
- У вас высокие объёмы, и цена $2/$12 за миллион токенов даёт заметную экономию при масштабировании.
- Вам нужно нативно обрабатывать видео, длинные аудиофайлы или большие наборы документов в одной модели без препроцессинга.
- Вы строите на стеке Google через Vertex AI и хотите модель, органично вписывающуюся в эту инфраструктуру без дополнительной конфигурации.

Итоги
На бумаге GPT-5.5 сильнее, и для большинства разработчиков, вероятно, так и будет на практике — особенно если вы работаете в терминальных средах или с комплексной математикой. Полная перестройка себя оправдала: это не «заплатанная» модель, и разрыв в бенчмарках Terminal-Bench 2.0 и FrontierMath это подтверждает.
Но «сильнее» не всегда означает «лучше для вас». При цене в 2,5 раза выше Gemini 3.1 Pro GPT-5.5 — это серьёзное бюджетное решение, и аргумент про эффективность по токенам работает только в том случае, если ваши процессы достаточно длинные, чтобы получить от этого выгоду.
Gemini 3.1 Pro — вовсе не «второй номер». Это конкурентоспособная модель, лидирующая на BrowseComp, MCP Atlas и GPQA Diamond, а её нативная работа с видео и аудио всё ещё опережает то, что GPT-5.5 предлагает из коробки.
Для большинства команд разумнее избегать бинарного выбора: используйте Gemini 3.1 Pro как рабочую лошадку для задач с большими объёмами или мультимедиа, а GPT-5.5 подключайте там, где важен выигрыш по качеству. Такой гибридный подход позволяет получить лучшее от обоих миров без «фронтирных» цен везде подряд.
Если вы хотите научиться создавать ИИ‑приложения с использованием LLM, промптов, цепочек и агентов в LangChain, настоятельно рекомендую наш курс Developing LLM Applications with LangChain.
GPT-5.5 vs Gemini 3.1 Pro: вопросы и ответы
Сколько стоит GPT-5.5 по сравнению с Gemini 3.1 Pro?
GPT-5.5 стоит $5 за миллион входных токенов и $30 за миллион выходных. Gemini 3.1 Pro — $2 за миллион входных токенов и $12 за миллион выходных. В продакшене это даёт 2,5-кратную разницу в пользу Gemini 3.1 Pro как по входу, так и по выходу.
Что такое GPT-5.5 Pro и чем он отличается от GPT-5.5?
GPT-5.5 Pro — это отдельный, более точный вариант GPT-5.5, обученный для критичных к корректности задач, таких как юридические исследования или финансовое моделирование. На FrontierMath Tier 4 GPT-5.5 Pro набирает 39,6% против 35,4% у GPT-5.5.
Стоит ли GPT-5.5 Pro своих денег?
Для большинства разработчиков — нет. При $30/$180 за миллион токенов это в шесть раз дороже стандартной GPT-5.5 ради умеренного роста по FrontierMath (35,4% → 39,6%). Это оправдано только в юридических, финансовых или научных задачах высокого риска, где разница в точности напрямую влияет на результат.
Какая модель лучше для кодирования?
GPT-5.5 лидирует на стандартных бенчмарках по кодированию: 58,6% против 54,2% на SWE-Bench Pro и 82,7% против 68,5% на Terminal-Bench 2.0.
Есть ли у Gemini 3.1 Pro преимущество в работе с инструментами?
Да, в структурированных средах. Gemini 3.1 Pro лидирует на MCP Atlas (78,2% против 75,3%) и BrowseComp (85,9% против 84,4%). GPT-5.5 отвечает на Toolathon (55,6% против 48,8%), где разнообразие инструментов шире. Преимущество Gemini реально, но точечно: он особенно силён в многосерверных конфигурациях на базе MCP, но не лучше по всем направлениям.