Claude Fable 5 vs. Gemini 3.5 Flash: 벤치마크, 가격, 그 외

Claude Fable 5는 순수 역량에서 압도적이지만, Gemini 3.5 Flash는 비용의 일부와 몇 배 빠른 속도로 최전선에 가까운 성능을 제공합니다. 자세히 알아보세요.

업데이트됨 2026년 6월 11일 · 9분 읽다

AI로 탐색하기

ChatGPT에서 열기 Claude에서 열기 Perplexity에서 열기

이틀 전 출시된 따끈따끈한 Claude Fable 5와 Gemini 3.5 Flash 중에서 선택해야 한다면, 사실상 최전선 모델이 지향해야 할 철학 두 가지 중 하나를 고르는 셈입니다.

Claude Fable 5는 Anthropic의 역량 상한선을 보여줍니다. 대부분의 벤치마크에서 공개 모델 중 가장 강력하며, 가격은 백만 토큰당 $10/$50이고, 세션 중 민감한 질의를 다른 모델로 우회시키는 분류기 시스템을 탑재했습니다.

Gemini 3.5 Flash는 구글이 속도-비용-지능의 균형점에 건 승부수입니다. "Flash" 등급이지만 전통적 의미의 저가형은 아니며, 코딩과 에이전틱 벤치마크에서 구글의 더 큰 모델인 Gemini 3.1 Pro를 능가합니다. 동급 최전선 모델 대비 대략 4배 빠르게 작동하며, 백만 토큰당 $1.50/$9로 비용도 훨씬 낮습니다.

이 글에서는 두 모델을 다음 다섯 가지 관점에서 비교합니다.

코딩 및 에이전틱 성능
속도와 지연 시간
롱 컨텍스트 작업
가격

만약 Fable 5를 OpenAI의 플래그십과 비교 중이시라면, 별도의 글을 참고하세요: Claude Fable 5 vs GPT-5.5.

저희는 독자 여러분께 매주 금요일 무료 뉴스레터 The Median을 보내 최신 AI 이슈를 정리해 드립니다. 위 링크를 클릭해 구독하시고, 일주일에 몇 분만 투자해도 흐름을 놓치지 마세요.

Claude Fable 5란?

Claude Fable 5는 Anthropic의 최초 Mythos-클래스 모델로, 일반에 공개된 버전입니다. Fable 5는 Claude Mythos 5와 기반 모델을 공유하지만, 안전 분류기가 활성화된 상태로 제공됩니다. 프로브가 모든 트래픽의 내부 활성화를 모니터링하며, 플래그된 요청은 학습된 LLM 분류기로 에스컬레이션됩니다. 차단된 요청은 Claude Opus 4.8로 우회됩니다.

Fable 5는 거의 모든 벤치마크에서 최신 성능을 보이며, 소프트웨어 엔지니어링, 지식 작업, 비전, 장기 에이전틱 작업에서 매우 강력합니다. 더 나아가 작업이 길고 복잡해질수록 이전 Claude 모델 대비 격차가 더 커집니다.

Gemini 3.5 Flash란?

Gemini 3.5 Flash는 Google DeepMind가 Google I/O 2026에서 발표한 5월 릴리스로, 새로운 Gemini 3.5 라인의 첫 모델입니다. "Flash"라는 이름이지만 전통적 의미의 예산형은 아니며, 코딩과 에이전틱 스위트에서 구글의 더 큰 Gemini 3.1 Pro보다 우수하면서도 동급 최전선 모델 대비 약 4배 빠르게 작동합니다.

Gemini 3.5 Flash는 추론 모델로, 설정 가능한 사고 노력 파라미터(minimal, low, medium, high)를 지원합니다. (기본값은 medium입니다.) 모델은 100만 토큰 컨텍스트 윈도우, 멀티모달 입력(텍스트, 이미지, 오디오, 비디오, PDF)을 지원하며, 초당 약 280+ 토큰 속도로 출력합니다. 출시 당일 Gemini 앱과 검색의 AI 모드에서 기본 모델로 지정되었습니다. Gemini 3.5 Pro의 출시는 머지않아 이루어질 것으로 보고 있습니다.

한 가지 짚고 넘어갈 점이 있습니다. 3.5 Flash의 토큰당 가격은 전작인 Gemini 3 Flash($0.50/$3.00) 대비 약 3배입니다. 즉, 플래그십과 비교하면 저렴하지만, 자체 계보와 비교하면 그렇지 않습니다. 또한 사고 토큰은 출력 요율로 과금되므로, 높은 노력의 추론 작업은 표면 가격보다 비용이 더 들 수 있습니다. 이 부분은 유의하시기 바랍니다.

Claude Fable 5 vs. Gemini 3.5 Flash: 정면 비교

세부 내용으로 들어가기 전에 간단히 요약합니다. 첫 번째 표는 벤치마크 결과, 두 번째 표는 가격, 속도, 접근성 같은 실무적 요소를 담았습니다.

벤치마크 결과

벤치마크	Claude Fable 5	Gemini 3.5 Flash
SWE-Bench Pro	80.3%	55.1% (Public)
Terminal-Bench 2.1	88.0%*	76.2%
Humanity's Last Exam (도구 사용)	64.5%	Gemini 3.1 Pro에 뒤처짐(직접 비교 불가)
OSWorld-Verified	85.0%	미공개
MCP Atlas (다중 도구 조정)	미공개	83.6%

보시다시피, 직접 비교 가능한 공개 데이터가 있는 항목에서는 모두 Claude Fable 5가 우세합니다.

가격, 속도, 접근성

앞서 언급했듯이, 가격만 놓고 보면 Gemini 3.5 Flash가 확실히(그리고 크게) 유리합니다.

항목	Claude Fable 5	Gemini 3.5 Flash
API 입력 가격(백만 토큰당)	$10	$1.50
API 출력 가격(백만 토큰당)	$50	$9.00
캐시된 입력 가격	—	백만당 $0.15(90% 할인)
출력 속도	표준 최전선 모델 지연	초당 약 280+ 토큰, 동급 최전선 대비 약 4배 빠름
컨텍스트 윈도우	수백만 토큰 장기 에이전틱 작업 가능 주장; 512K+ 구간 MRCR 미공개	100만 토큰(입력 한도 1,048,576)
일반 제공 여부	제한적(6월 22일 이후 사용 크레딧 필요)	예(Genmi 앱, AI Studio, Antigravity, API, 검색의 AI 모드)

코딩 및 에이전틱 성능

코딩과 에이전틱 작업 성능은 격차가 가장 큰 영역이므로 별도로 다룰 가치가 있습니다.

첫 번째 표에서 보듯 SWE-Bench Pro에서 Fable 5는 80.3%, Gemini 3.5 Flash(공개 세트)는 55.1%입니다. 25포인트 차이입니다. 복잡한 코드베이스에서 저장소 단위의 엔지니어링을 수행할 때 체감 차이가 큽니다. 아마 Fable 5는 대부분의 실제 GitHub 이슈를 자율적으로 해결할 수 있을 가능성이 높고, Gemini 3.5 Flash에 대해 같은 말을 하기는 어렵습니다.

Gemini 3.5 Flash가 반격하는 지점은 에이전틱 심도라기보다 에이전틱 처리량입니다. Flash는 병렬 실행 루프, 서브 에이전트 배치, 빠른 반복에 최적화되어 있습니다. 다중 도구 조정 벤치마크인 MCP Atlas에서 83.6%를 기록하며 — GPT-5.5의 75.3%를 상회 — 빠른 도구 호출을 다수 오케스트레이션하는 데 적합하도록 설계된 모델임을 시사합니다. 구글은 실제 에이전틱 시나리오에서 이전 Flash 대비 의미 있는 토큰 효율성 향상도 보고했습니다.

올바른 판단 기준은 다음과 같습니다. 에이전트가 소수의 어려운 단계를 깊이 있게 고민해야 한다면(복잡한 리팩터링, 아키텍처 변경, 까다로운 디버깅) Fable 5가 우위입니다. 반대로 다수의 중간 난이도 단계를 병렬로 빠르게 실행해야 한다면(스크래핑-요약 파이프라인, 다중 도구 오케스트레이션, 대량 트리아지), Flash의 속도와 비용 프로파일이 합리적입니다.

속도와 지연

Gemini 3.5 Flash는 초당 약 280+ 토큰을 출력합니다. 일반적인 최전선 플래그십들보다 몇 배 빠릅니다.

반면 Fable 5는 빠른 모델로 포지셔닝되지 않았습니다. 어려운 작업에서 답을 얻기 위해 기다릴 가치가 있을 때 쓰는 모델입니다.

롱 컨텍스트 성능

Gemini 3.5 Flash는 약 100만 토큰 입력 컨텍스트를 지원하고, Gemini 라인은 역사적으로 롱 컨텍스트 검색에서 강했습니다. 다만 Flash는 MRCR v2에서 구글의 Gemini 3.1 Pro에 다소 뒤처지는 것으로 보고됩니다.

Anthropic은 Fable 5가 수백만 토큰에 달하는 장기 작업에서도 집중력을 유지하고 자체 노트를 활용해 출력을 향상한다고 주장합니다. 그러나 512K–100만 구간의 MRCR 스타일 점수는 공개하지 않아, 동등 조건의 비교는 어렵습니다.

백만 토큰 문서 검토의 관점에서, 현재 공개된 정보만으로 두 모델 중 어느 쪽도 결정적 우위를 점한다고 보기 어렵습니다. 롱 컨텍스트 안정성이 최우선 변수라면, GPT-5.5가 512K–100만에서 공개한 MRCR v2 74.0%가 눈에 띕니다.

가격과 제공 여부

가격 차이는 분명합니다. Fable 5는 입력 백만 토큰당 $10, 출력 백만 토큰당 $50입니다. Gemini 3.5 Flash는 각각 $1.50, $9.00이며, 캐시된 입력은 백만당 $0.15로 90% 할인됩니다. 대략 입력은 6~7배, 출력은 5~6배 정도 Gemini 3.5 Flash가 저렴합니다.

다만 가격 이야기는 항상 겉보기와 다릅니다. 먼저 Flash는 추론 모델이며, 사고 토큰은 출력 요율로 과금됩니다. 따라서 높은 노력의 추론 작업은 프롬프트에서 예상한 것보다 출력 토큰을 훨씬 더 소모할 수 있습니다. 귀사의 워크로드에서 Flash가 실제로 저렴한지 사전에 벤치마크하세요. 또한 Fable 5의 분류기가 질의를 우회시킨 경우에는 Fable 5 요율이 아니라 Opus 4.8 요율($5/$25)로 청구됩니다. 비용에 약간의 완화 요인은 되겠지만 영향은 크지 않을 수 있습니다.

제공 여부도 비대칭입니다. Gemini 3.5 Flash는 출시 첫날부터 Gemini 앱, Google AI Studio, Antigravity, Gemini API, 검색의 AI 모드 전반에서 일반 제공되었습니다. Fable 5의 구독 액세스는 절벽이 있습니다. Pro, Max, Team, Enterprise 구독자는 2026년 6월 22일까지 무료 액세스였고, 그 이후에는 기존 구독료와 별개로 사용 크레딧이 필요합니다.

Claude Fable 5와 Gemini 3.5 Flash 중 무엇을 선택할까

결정 변수는 두 가지입니다.

작업 난도가 Fable 5의 상한선을 필요로 할 만큼 높은가
속도와 호출당 비용이 경제성에서 지배적인가

사용 사례	추천	이유
복잡한 코드베이스에서 저장소 단위 소프트웨어 엔지니어링	Claude Fable 5	SWE-Bench Pro에서 80.3% vs 55.1%로 25포인트 격차가 실제 역량 차이를 반영
대량 처리, 지연 민감형 에이전틱 파이프라인	Gemini 3.5 Flash	초당 약 280+ 토큰 출력, 병렬 서브 에이전트 실행, 5–7배 낮은 토큰 비용이 수천 건 호출에서 누적
인터랙티브 소비자 제품 및 채팅 UX	Gemini 3.5 Flash	4배 속도 우위는 그 자체로 제품 경쟁력; Fable 5의 지연과 가격은 고빈도 소비자용에 부적합
복잡한 금융 및 지식 작업	Claude Fable 5	Hebbia 금융 벤치마크 및 도구 기반 Humanity's Last Exam(64.5%) 선도
다수 서비스 간 다중 도구 오케스트레이션	Gemini 3.5 Flash	MCP Atlas 83.6%로 최전선 모델 중 가장 강력한 다중 도구 조정 점수
멀티모달 파이프라인(비디오, 오디오, PDF 입력)	Gemini 3.5 Flash	텍스트, 이미지, 오디오, 비디오, PDF 전반의 네이티브 멀티모달 입력
데이터 보존 금지가 요구되는 규제 산업	Gemini 3.5 Flash	Fable 5의 의무적 30일 보존은 일부 기업에 치명적 제약

다음에 해당하면 Claude Fable 5를 선택하세요

주요 사용 사례가 저장소 단위의 소프트웨어 엔지니어링입니다.
복잡한 분석 작업(금융, 다학제 추론, 장기 에이전틱 작업)에서 가능한 최고 상한이 필요하고, 지연은 부차적입니다.
작업이 사이버보안, 생물학, 화학과 인접하지 않아 분류기 우회가 세션에 영향을 줄 가능성이 낮습니다.

다음에 해당하면 Gemini 3.5 Flash를 선택하세요

경제성이 물량에 의해 좌우됩니다. 하루 수천 건 호출에서 비용 차이가 누적되어 지출 규모를 좌우합니다.
속도가 제품 요구사항입니다. 인터랙티브 UX, 실시간 에이전트, 또는 다중 도구 호출의 전체 소요 시간이 단계별 심도보다 중요한 파이프라인입니다.
단일 모델에서 폭넓은 멀티모달 입력(비디오, 오디오, PDF)이 필요합니다.
기업 데이터 정책상 Fable 5의 의무적 30일 보존을 수용할 수 없거나, 파이프라인 중 모델이 조용히 바뀌지 않는 것이 중요합니다.

마무리

이 비교는 사실 동급 간 대결이 아닙니다. Fable 5와 Gemini 3.5 Flash는 시장에서 서로 다른 위치를 점합니다. 하나는 어느 정도 마찰을 감수하는 대신 역량의 천장이고, 다른 하나는 천장이 낮은 효율의 최전선입니다.

어려운 작업에서 순수한 역량만 본다면 Fable 5가 확실히 우세합니다. 하지만 Flash의 가치 제안은 “거의 비슷한 성능을 더 싸게”가 아닙니다. 과소평가하고 싶지 않습니다. Fable 5로는 경제성이 맞지 않았던 곳에도 투입할 수 있을 만큼 충분히 빠르고 충분히 저렴한, 최전선에 가까운 지능을 제공합니다.

주제

인공지능