Claude Fable 5 и Gemini 3.5 Flash: бенчмарки, цены и не только

Claude Fable 5 доминирует по «сырой» мощности, а Gemini 3.5 Flash даёт близкий к флагманам уровень за меньшие деньги и в разы быстрее. Подробнее — ниже.

Обновлено 11 июн. 2026 г. · 9 мин читать

Изучить с помощью AI

Открыть в ChatGPT Открыть в Claude Открыть в Perplexity

Если вы выбираете между Claude Fable 5 (который, предупреждаем, вышел всего два дня назад) и Gemini 3.5 Flash, на самом деле вы выбираете между двумя разными философиями того, каким должен быть пограничный модельный класс.

Claude Fable 5 — это потолок возможностей Anthropic: самая сильная общедоступная модель по большинству бенчмарков, с соответствующей ценой $10/$50 за миллион токенов, дополненная системой классификаторов, которая может перенаправлять чувствительные запросы на другую модель прямо в ходе сессии.

Gemini 3.5 Flash — ставка Google на оптимум скорости, стоимости и интеллекта: модель уровня «Flash», которая опережает более крупную Google Gemini 3.1 Pro на задачах кодинга и агентных бенчмарках. Она работает примерно в 4 раза быстрее сопоставимых флагманов и стоит $1.50/$9 за миллион токенов — то есть значительно дешевле.

В этой статье я сравню модели по пяти аспектам:

производительность в кодинге и агентных задачах
скорость и задержка
работа с длинным контекстом
ценообразование

Если вы сопоставляете Fable 5 с флагманом OpenAI, у нас есть отдельная статья: Claude Fable 5 vs GPT-5.5.

Мы держим читателей в курсе главного в ИИ в The Median — нашей бесплатной пятничной рассылке, где мы разбираем ключевые события недели. Нажмите на ссылку выше, подпишитесь и будьте в теме, тратя всего несколько минут в неделю.

Что такое Claude Fable 5?

Claude Fable 5 — первая доступная для широкой аудитории модель класса Mythos от Anthropic. Fable 5 использует ту же базовую модель, что и Claude Mythos 5, но поставляется с активными классификаторами безопасности: зонд отслеживает внутренние активации по всему трафику, а помеченные запросы передаются обученному LLM-классификатору. Заблокированные запросы перенаправляются в Claude Opus 4.8.

Fable 5 — это state-of-the-art почти по всем протестированным бенчмаркам, и она действительно очень сильна в разработке ПО, интеллектуальном труде, компьютерном зрении и долгосрочных агентных задачах. Более того, чем длиннее и сложнее задача, тем больше её отрыв от предыдущих моделей Claude.

Что такое Gemini 3.5 Flash?

Gemini 3.5 Flash — майский релиз Google DeepMind, объявленный на Google I/O 2026 как первая модель в новой линейке Gemini 3.5. Несмотря на приставку «Flash», это не «бюджетная» модель в привычном смысле: она обходит более крупную Gemini 3.1 Pro от Google в задачах кодинга и агентной серии, работая примерно в 4 раза быстрее сопоставимых флагманов.

Gemini 3.5 Flash — модель рассуждения с настраиваемыми параметрами «усилия мышления» (minimal, low, medium, high). (По умолчанию — medium, если вы интересовались.) Модель поддерживает контекстное окно в 1 млн токенов, мультимодальный ввод (текст, изображение, аудио, видео, PDF) и выдаёт примерно 280+ токенов в секунду. В день запуска Google сделала её моделью по умолчанию в приложении Gemini и режиме AI Mode в поиске. Мы ожидаем, что Gemini 3.5 Pro последует со дня на день.

Есть важный нюанс: 3.5 Flash примерно в 3 раза дороже по цене за токен, чем её предшественница Gemini 3 Flash ($0.50/$3.00). То есть она дёшева относительно флагманов, но не относительно своей же линейки. И поскольку «токены размышления» тарифицируются по ставке вывода, нагрузки с интенсивными рассуждениями на высоком уровне усилия могут стоить дороже, чем предполагает прайс. Это стоит учитывать.

Claude Fable 5 vs. Gemini 3.5 Flash: сравнение лицом к лицу

Краткое резюме перед деталями. Я подготовил две таблицы: одну с результатами бенчмарков и другую — с практическими аспектами вроде цены, скорости и доступности.

Результаты бенчмарков

Бенчмарк	Claude Fable 5	Gemini 3.5 Flash
SWE-Bench Pro	80.3%	55.1% (Public)
Terminal-Bench 2.1	88.0%*	76.2%
Humanity's Last Exam (с инструментами)	64.5%	Отстаёт от Gemini 3.1 Pro (не напрямую сопоставимо)
OSWorld-Verified	85.0%	Не опубликовано
MCP Atlas (координация множества инструментов)	Не опубликовано	83.6%

Как видно, Claude Fable 5 выигрывает во всех прямых сравнениях бенчмарков, где есть удобные для сопоставления данные.

Цена, скорость и доступ

Как я уже упоминал: цены у Gemini 3.5 Flash определённо лучше (и заметно лучше).

Характеристика	Claude Fable 5	Gemini 3.5 Flash
Цена API за вход (за 1 млн токенов)	$10	$1.50
Цена API за выход (за 1 млн токенов)	$50	$9.00
Кэшированный вход	—	$0.15 за 1 млн (скидка 90%)
Скорость вывода	Обычная задержка для флагманов пограничного уровня	~280+ токенов/с, ~в 4 раза быстрее аналогов
Окно контекста	Заявляются долгие агентные задачи с многомиллионным контекстом; нет опубликованного MRCR при 512K+	1 млн токенов (ограничение на вход 1,048,576)
Общая доступность	Ограниченная (после 22 июня требуются кредиты на использование)	Да (приложение Gemini, AI Studio, Antigravity, API, AI Mode в поиске)

Производительность в кодинге и агентных задачах

Производительность в кодинге и агентной работе стоит обсудить отдельно — именно здесь разрыв по возможностям максимален.

На SWE-Bench Pro, как видно в первой таблице, Fable 5 набирает 80.3% против 55.1% у Gemini 3.5 Flash на публичном сете. Это разрыв в 25 пунктов. Для инженерии на уровне репозитория в сложных кодовых базах это ощутимая разница. Скорее всего, Fable 5 способна автономно закрывать реальные задачи GitHub в большинстве случаев, и не факт, что то же можно сказать о Gemini 3.5 Flash.

Где Gemini 3.5 Flash берёт своё — это агентная пропускная способность, а не глубина рассуждений. Flash явно оптимизирована для параллельных циклов исполнения, запуска субагентов и быстрой итерации. Её 83.6% на MCP Atlas — бенчмарке координации множества инструментов, где она обходит 75.3% у GPT-5.5 — указывает на модель, заточенную под оркестровку множества быстрых вызовов инструментов, а не под одну длинную и глубокую цепочку рассуждений. Google также сообщает о существенном росте эффективности использования токенов в реальных агентных сценариях по сравнению с прежними версиями Flash.

Корректнее всего думать так: если вашему агенту нужно вдумчиво разобраться с небольшим числом сложных шагов (сложные рефакторинги, архитектурные изменения, трудная отладка), выигрывает Fable 5. Если агенту нужно выполнять множество быстрых, умеренно сложных шагов параллельно (конвейеры «сбор-сводка», оркестрация множества инструментов, массовый триаж), профиль скорости и стоимости Flash имеет большой смысл.

Скорость и задержка

Gemini 3.5 Flash выдаёт примерно 280+ токенов в секунду — в несколько раз быстрее типичных флагманов пограничного уровня.

Fable 5, напротив, не позиционируется как быстрая модель. Это модель для задач, ради ответа на которые вы готовы подождать.

Производительность на длинном контексте

Gemini 3.5 Flash поддерживает примерно 1 млн токенов на входе, и линейка Gemini традиционно сильна в извлечении из длинного контекста. Однако, по сообщениям, Flash уступает собственной Gemini 3.1 Pro на MRCR v2.

Anthropic утверждает, что Fable 5 сохраняет фокус на протяжении миллионов токенов в долгих задачах и улучшает ответы за счёт собственных заметок. Но Anthropic не публиковала результаты в стиле MRCR в диапазоне 512K–1M, поэтому прямое сравнение «яблоки с яблоками» невозможно.

Для обзора документов на миллион токенов ни у одной модели нет явного опубликованного преимущества. Если надёжность на длинном контексте — ваш ключевой параметр, опубликованные 74.0% MRCR v2 у GPT-5.5 при 512K–1M привлекают внимание.

Цены и доступность

Есть разрыв в цене. Fable 5 стоит $10 за миллион входных токенов и $50 за миллион выходных. Gemini 3.5 Flash стоит соответственно $1.50 и $9.00, плюс кэшированный вход за $0.15 за миллион (скидка 90%). Примерно в шесть–семь раз дешевле по входу и в пять–шесть раз дешевле по выходу.

Однако история с ценами не так проста: во-первых, Flash — модель рассуждения, у которой «токены размышления» тарифицируются по ставке выхода, поэтому нагрузки с высоким усилием рассуждений могут потреблять заметно больше выходных токенов, чем предполагает промпт. Протестируйте свой кейс, прежде чем считать Flash дешёвой именно для вас. Также, когда классификаторы Fable 5 перенаправляют запрос, выставление счёта идёт по тарифам Opus 4.8 ($5/$25), а не Fable 5. Хотя это, вероятно, лишь небольшое смягчение затрат.

Доступность — ещё одно отличие. Gemini 3.5 Flash стала общедоступной в первый день в приложении Gemini, Google AI Studio, Antigravity, через API Gemini и в AI Mode поиска. Подписочный доступ к Fable 5 имеет «обрыв»: у подписчиков Pro, Max, Team и Enterprise бесплатный доступ только до 22 июня 2026 года, после чего помимо подписки потребуются кредиты на использование.

Когда выбирать Claude Fable 5, а когда Gemini 3.5 Flash

Решение сводится к двум переменным:

насколько ваши задачи сложны и требуют «потолка» Fable 5
доминируют ли в вашей экономике скорость и стоимость одного вызова

Сценарий	Рекомендация	Почему
Инженерия ПО на уровне репозитория в сложных кодовых базах	Claude Fable 5	80.3% против 55.1% на SWE-Bench Pro — разрыв в 25 пунктов, отражающий реальную разницу в возможностях
Высоконагруженные, чувствительные к задержке агентные конвейеры	Gemini 3.5 Flash	~280+ ток/с, параллельное выполнение субагентов и в 5–7 раз меньшие затраты на токены даются в сумме на тысячах вызовов
Интерактивные потребительские продукты и чат-UX	Gemini 3.5 Flash	Преимущество в 4 раза по скорости — это фича продукта; задержка и цена Fable 5 не подходят для частого потребительского использования
Сложные финансы и интеллектуальная работа	Claude Fable 5	Лидирует в Hebbia's Finance Benchmark и Humanity's Last Exam с инструментами (64.5%)
Оркестрация множества инструментов в разных сервисах	Gemini 3.5 Flash	83.6% на MCP Atlas — самый сильный опубликованный результат координации инструментов среди пограничных моделей
Мультимодальные конвейеры (видео, аудио, PDF-ввод)	Gemini 3.5 Flash	Нативный мультимодальный ввод: текст, изображение, аудио, видео и PDF
Регулируемые отрасли, требующие нулевого хранения данных	Gemini 3.5 Flash	Обязательное хранение данных 30 дней у Fable 5 — жёсткое ограничение для ряда предприятий

Выберите Claude Fable 5, если…

Ваш главный кейс — разработка на уровне репозитория
Вам нужен максимально высокий потолок в сложной аналитике — финансы, междисциплинарные рассуждения, долгосрочные агентные задачи — а задержка вторична.
Ваша работа не граничит с кибербезопасностью, биологией или химией, поэтому перенаправления классификатором вряд ли повлияют на сессии.

Выберите Gemini 3.5 Flash, если…

Экономика определяется объёмом: тысячи вызовов в день, где ценовая разница складывается в порядки затрат.
Скорость — требование продукта: интерактивный UX, агенты в реальном времени или конвейеры, где важнее суммарное «настенное» время множества вызовов инструментов, а не глубина каждого шага.
Вам нужен широкий мультимодальный ввод (видео, аудио, PDF) в одной модели.
Политика данных в вашей компании не допускает обязательное 30-дневное хранение в Fable 5 или вам нужна модель, которая не будет тихо заменяться в середине пайплайна.

Итоги

Это не совсем корректное сравнение «один к одному». Fable 5 и Gemini 3.5 Flash занимают разные ниши: первая — это потолок возможностей с определёнными трениями, вторая — это граница эффективности с более низким потолком.

Если для вас важна лишь «сырая» способность решать трудные задачи, Fable 5 побеждает уверенно. Но ценностное предложение Flash — не «почти так же хорошо за меньшие деньги». Не хочу приуменьшать её: это интеллект уровня, близкого к флагманам, который поставляется достаточно быстро и дёшево, чтобы применять его там, где Fable 5 экономически никогда не окупалась.

Темы

Искусственный интеллект