From cfe1e924c503ff3434ce1543a1a7f3f072cd4cee Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=EA=B9=80=EB=B3=B4=EA=B3=A4?= Date: Sat, 7 Mar 2026 18:15:18 +0900 Subject: [PATCH] =?UTF-8?q?feat:=20[claude-code]=20=EB=B0=9C=EC=A0=84?= =?UTF-8?q?=EA=B3=BC=EC=A0=95=20=ED=8E=98=EC=9D=B4=EC=A7=80=20=EB=8C=80?= =?UTF-8?q?=ED=8F=AD=20=EA=B0=95=ED=99=94=20-=20=EB=AA=A8=EB=8D=B8=20?= =?UTF-8?q?=EB=B9=84=EA=B5=90=20=ED=83=AD=20=EC=B6=94=EA=B0=80?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - 새 '모델 비교' 탭: 각 모델별 특징 카드, 벤치마크 바 차트, 핵심 스펙 - Opus 4.6/4.5, Sonnet 4.6/4.5, 4 Opus/Sonnet, 3.7/3.5, Haiku 4.5 상세 - SWE-bench, GPQA Diamond, ARC-AGI 2, OSWorld 벤치마크 수치 반영 - Opus 4.6 vs Sonnet 4.6 직접 비교표 추가 - 모델 진화 탭: 세대별 비교표 10개 모델로 확장, SWE-bench 성장 바 차트 - 타임라인 탭: Opus 4.5(2025.11) 노드 추가, 정확한 출시일 반영 - 히어로 수치 업데이트 (9세대 모델, SWE-bench 80.8%) --- .../views/claude-code/history/index.blade.php | 779 ++++++++++++++++-- 1 file changed, 692 insertions(+), 87 deletions(-) diff --git a/resources/views/claude-code/history/index.blade.php b/resources/views/claude-code/history/index.blade.php index 4c6c48a6..a46a1807 100644 --- a/resources/views/claude-code/history/index.blade.php +++ b/resources/views/claude-code/history/index.blade.php @@ -43,11 +43,48 @@ .evo-card { background: linear-gradient(135deg, rgba(255,255,255,0.95), rgba(248,250,252,1)); border-radius: 1rem; border: 1px solid #e2e8f0; overflow: hidden; } .evo-card-header { padding: 1rem 1.5rem; font-weight: 700; color: white; font-size: 0.85rem; } + /* 모델 카드 */ + .model-card { background: white; border-radius: 1rem; border: 1px solid #e2e8f0; overflow: hidden; transition: all 0.3s; } + .model-card:hover { transform: translateY(-4px); box-shadow: 0 16px 48px rgba(0,0,0,0.1); } + .model-card-head { padding: 1.25rem 1.5rem; color: white; position: relative; overflow: hidden; } + .model-card-head::after { content: ''; position: absolute; top: -20px; right: -20px; width: 80px; height: 80px; border-radius: 50%; background: rgba(255,255,255,0.1); } + .model-card-body { padding: 1.25rem 1.5rem; } + + /* 벤치마크 바 */ + .bench-bar-wrap { margin-bottom: 0.6rem; } + .bench-label { display: flex; justify-content: space-between; font-size: 0.7rem; margin-bottom: 3px; } + .bench-bar { height: 8px; background: #f1f5f9; border-radius: 4px; overflow: hidden; } + .bench-fill { height: 100%; border-radius: 4px; transition: width 0.8s ease-out; } + + /* 세대 비교 테이블 */ + .gen-table { width: 100%; border-collapse: separate; border-spacing: 0; } + .gen-table th, .gen-table td { padding: 0.75rem 1rem; text-align: center; font-size: 0.8rem; } + .gen-table thead th { background: #1e293b; color: white; font-weight: 700; } + .gen-table thead th:first-child { border-radius: 0.75rem 0 0 0; text-align: left; } + .gen-table thead th:last-child { border-radius: 0 0.75rem 0 0; } + .gen-table tbody tr { border-bottom: 1px solid #f1f5f9; } + .gen-table tbody tr:hover { background: #f8fafc; } + .gen-table tbody td:first-child { text-align: left; font-weight: 600; } + + /* 스코어 뱃지 */ + .score-badge { display: inline-block; padding: 2px 10px; border-radius: 12px; font-size: 0.7rem; font-weight: 700; } + + /* 강점 태그 */ + .strength-tag { display: inline-flex; align-items: center; gap: 3px; padding: 4px 10px; border-radius: 6px; font-size: 0.65rem; font-weight: 600; background: #f8fafc; border: 1px solid #e2e8f0; color: #475569; } + + /* 모델 티어 */ + .tier-flagship { border-left: 4px solid #7c3aed; } + .tier-balanced { border-left: 4px solid #2563eb; } + .tier-fast { border-left: 4px solid #059669; } + .tier-light { border-left: 4px solid #64748b; } + /* 애니메이션 */ @keyframes slideUp { from { opacity: 0; transform: translateY(30px); } to { opacity: 1; transform: translateY(0); } } .anim-up { animation: slideUp 0.6s ease-out forwards; } @keyframes pulse-glow { 0%, 100% { box-shadow: 0 0 20px rgba(99, 102, 241, 0.3); } 50% { box-shadow: 0 0 40px rgba(99, 102, 241, 0.6); } } .pulse-glow { animation: pulse-glow 3s ease-in-out infinite; } + @keyframes fillBar { from { width: 0; } } + .anim-bar { animation: fillBar 1s ease-out forwards; } @endpush @@ -74,19 +111,19 @@ {{-- 핵심 수치 --}}
- 18개월 + 13개월 개발 기간
- 50+ - 릴리스 + 9세대 + 모델 진화
- 100만+ - 개발자 + 80.8% + SWE-bench
- Opus 4 + Opus 4.6 최신 모델
@@ -95,8 +132,9 @@
- - + + +
@@ -140,7 +178,7 @@ 2025.04

정식 출시 — General Availability

-

Claude 3.5 Sonnet / Claude 3.7 Sonnet 기반으로 일반 공개. Max/Pro 구독 모델 도입. GitHub, GitLab 연동으로 실질적 개발 워크플로우 지원 시작.

+

Claude 3.5/3.7 Sonnet 기반으로 일반 공개. Max/Pro 구독 모델 도입. GitHub, GitLab 연동으로 실질적 개발 워크플로우 지원 시작.

Max/Pro 구독 Git 통합 @@ -155,13 +193,13 @@
v1.0.x - 2025.05 + 2025.05.14

Claude 4 Sonnet — 코딩 특화 모델

-

Claude 4 Sonnet (claude-sonnet-4-20250514) 출시. SWE-bench에서 역대 최고 성적. 코드 이해도·정확성이 급격히 향상되며 Claude Code의 실전 능력이 도약.

+

Claude 4 Sonnet 출시. SWE-bench 72.7%로 당시 최고 성적. 코드 이해도와 정확성이 급격히 향상되며 Claude Code의 실전 능력이 도약.

Claude 4 Sonnet - SWE-bench SOTA + SWE-bench 72.7% 확장 사고(Extended Thinking) 병렬 도구 호출
@@ -174,7 +212,7 @@ {{-- ===== 2025.06~08 ===== --}}
-
생태계
+
MCP
@@ -182,7 +220,7 @@ 2025.06~08

생태계 폭발 — MCP & Hooks & Skills

-

Model Context Protocol(MCP)로 외부 도구 연동 표준화. Hooks(pre/post 실행 스크립트), Custom Skills, Custom Agents 시스템으로 확장성 극대화. 커뮤니티 생태계 급성장.

+

Model Context Protocol(MCP)로 외부 도구 연동 표준화. Hooks, Custom Skills, Custom Agents 시스템으로 확장성 극대화. 커뮤니티 생태계 급성장.

MCP 프로토콜 Hooks 시스템 @@ -193,49 +231,70 @@
- {{-- ===== 2025.09~10 ===== --}} + {{-- ===== 2025.09 ===== --}}
v1.x - 2025.09~10 + 2025.09
-

Claude 4 Opus & Haiku 4.5

-

Claude 4 Opus(claude-opus-4-20250918) — Anthropic 최고 성능 모델. 복잡한 아키텍처 설계·리팩토링·대규모 코드베이스 이해에서 압도적 성능. Haiku 4.5는 초고속 경량 모델로 서브에이전트 최적화.

+

Claude 4 Opus & Sonnet 4.5

+

Claude 4 Opus — 최고 지능 모델. Sonnet 4.5 — SWE-bench 77.2%로 "세계 최고의 코딩 모델" 등극. 서브에이전트, Worktree 병렬 작업 도입.

Claude 4 Opus - Haiku 4.5 + Sonnet 4.5 (SWE 77.2%) 서브에이전트 - Worktree (병렬 작업) + Worktree 병렬 작업
-
4 Opus
+
4.5
- {{-- ===== 2025.12~2026 ===== --}} + {{-- ===== 2025.11 ===== --}}
-
NOW
+
4.5O
-
+
+
+ v1.x + 2025.11.24 +
+

Opus 4.5 — 최초 80% 돌파

+

SWE-bench 80.9%로 최초 80% 벽 돌파. Sonnet 4.5 대비 76% 적은 토큰으로 동일 성능 달성. Infinite Chats로 컨텍스트 제한 해소.

+
+ SWE-bench 80.9% + Infinite Chats + GPQA 87.0% + 토큰 효율 76%↑ +
+
+
+ + {{-- ===== 2026.01~현재 ===== --}} +
+
v1.x - 2025.12~2026 현재 + 2026.01~현재 CURRENT
-

Opus 4.6 & 엔터프라이즈 성숙

-

Opus 4.6 (claude-opus-4-6) — 빠른 출력 + 최고 성능 결합. GitHub Actions CI/CD 통합, 엔터프라이즈 보안 정책, Task 관리, 자동 메모리 시스템 안정화. 실무 프로젝트에서 시니어 개발자급 자율 코딩 가능.

+

Opus 4.6 & Sonnet 4.6 — 현재

+

Opus 4.6 (2/5) — GPQA 91.3%, Agent Teams, Adaptive Thinking. Sonnet 4.6 (2/17) — 1M 컨텍스트 베타, Opus에 근접한 코딩 성능. Cowork(비개발자 GUI), Claude Code Security 출시.

- Opus 4.6 (최신) + Opus 4.6 (GPQA 91.3%) Sonnet 4.6 - GitHub Actions 연동 - 자동 메모리 - Task 시스템 - Fast Mode + Agent Teams + 1M Context (beta) + Adaptive Thinking + Fast Mode 2.5x
+
+
NOW
+
@@ -291,7 +350,7 @@
서브에이전트 & 병렬 작업
-

복잡한 작업을 여러 서브에이전트에 위임하여 병렬 처리. Worktree를 활용한 독립 작업 공간에서 동시에 여러 기능을 개발. 시니어 개발자가 주니어들에게 업무를 분배하는 것과 유사.

+

복잡한 작업을 여러 서브에이전트에 위임하여 병렬 처리. Worktree를 활용한 독립 작업 공간에서 동시에 여러 기능을 개발.

실행 흐름:

메인 에이전트 → 분석 에이전트 (탐색)

@@ -305,7 +364,7 @@
자동 메모리 — 세션 간 학습
-

대화가 끝나도 중요한 패턴·선호·교훈을 MEMORY.md에 자동 저장. 다음 세션에서 동일한 실수를 반복하지 않음. 프로젝트와 함께 성장하는 AI.

+

대화가 끝나도 중요한 패턴과 교훈을 MEMORY.md에 자동 저장. 다음 세션에서 동일한 실수를 반복하지 않음. 프로젝트와 함께 성장하는 AI.

저장하는 것: 검증된 패턴, 아키텍처 결정, 사용자 선호

저장하지 않는 것: 임시 작업, 미검증 추측

@@ -316,7 +375,7 @@
Hooks — 안전한 자동화
-

도구 실행 전후에 자동으로 스크립트를 실행. Lint 자동 적용, 위험 명령 차단, 커밋 메시지 검증 등을 자동화. Co-Authored-By 서명 자동 제거 같은 팀 규칙도 Hook으로 강제.

+

도구 실행 전후에 자동으로 스크립트를 실행. Lint 자동 적용, 위험 명령 차단, 커밋 메시지 검증 등을 자동화. HTTP Hooks로 외부 서비스 연동도 가능.

PreCommit → lint + format
PostCommit → 자동 push (MNG)
@@ -327,85 +386,631 @@
- {{-- ===== 탭 2: 모델 진화 ===== --}} + {{-- ===== 탭 2: 모델 비교 (NEW) ===== --}}
-

Claude 모델 진화 계보

+

Claude 모델별 특징 비교

+

각 모델의 핵심 역량, 벤치마크 성능, 적합한 사용 시나리오를 한눈에 비교합니다.

+ {{-- === Flagship 모델 === --}} +

+ + Flagship — 최고 성능 +

+
+ + {{-- Opus 4.6 --}} +
+
+
+
+

Flagship

+

Claude Opus 4.6

+
+
+ 2026.02.05 +
+
+

claude-opus-4-6 — Anthropic 최고 지능 + 최고 속도

+
+
+ {{-- 핵심 스펙 --}} +
+
+

Context

+

200K

+

1M beta

+
+
+

Max Output

+

128K

+
+
+

Price

+

$5/$25

+

in/out MTok

+
+
+ {{-- 벤치마크 --}} +
+
+
SWE-bench Verified80.8%
+
+
+
+
GPQA Diamond91.3%
+
+
+
+
ARC-AGI 268.8%
+
+
+
+
OSWorld72.7%
+
+
+
+
MRCR 256K (Long Context)93.0%
+
+
+
+ {{-- 핵심 강점 --}} +
+

핵심 강점

+
+ Agent Teams + Adaptive Thinking + Fast Mode 2.5x + 최고 추론력 + 128K 출력 +
+
+
+

적합한 작업

+

대규모 아키텍처 설계, 복잡한 리팩토링, 멀티파일 코드 생성, 심층 분석 및 추론이 필요한 작업. SAM 프로젝트의 메인 모델.

+
+
+
+ + {{-- Opus 4.5 --}} +
+
+
+
+

Flagship

+

Claude Opus 4.5

+
+
+ 2025.11.24 +
+
+

최초 SWE-bench 80% 돌파, 토큰 효율성 혁신

+
+
+
+
+

Context

+

200K

+

1M beta

+
+
+

Max Output

+

128K

+
+
+

Price

+

$15/$75

+

in/out MTok

+
+
+
+
+
SWE-bench Verified80.9%
+
+
+
+
GPQA Diamond87.0%
+
+
+
+
ARC-AGI 237.6%
+
+
+
+
+

핵심 강점

+
+ Infinite Chats + 토큰 효율 76%↑ + 최초 80% 돌파 +
+
+
+

역사적 의의

+

SWE-bench에서 최초로 80%를 돌파한 모델. 같은 수준의 성능을 Sonnet 4.5 대비 76% 적은 출력 토큰으로 달성하는 효율성 혁신.

+
+
+
+
+ + {{-- === Balanced 모델 === --}} +

+ + Balanced — 성능과 비용의 균형 +

+
+ + {{-- Sonnet 4.6 --}} +
+
+
+
+

Balanced

+

Claude Sonnet 4.6

+
+
+ 2026.02.17 +
+
+

claude-sonnet-4-6 — Opus급 코딩 성능을 1/3 가격에

+
+
+
+
+

Context

+

200K

+

1M beta

+
+
+

Max Output

+

64K

+
+
+

Price

+

$3/$15

+

in/out MTok

+
+
+
+
+
SWE-bench Verified79.6%
+
+
+
+
GPQA Diamond74.1%
+
+
+
+
ARC-AGI 258.3%
+
+
+
+
OSWorld72.5%
+
+
+
+
+

핵심 강점

+
+ 1M Context (beta) + 가성비 최강 + Adaptive Thinking + 동적 웹 필터링 +
+
+
+

적합한 작업

+

일상적 코딩, 빠른 반복 작업, 비용 최적화. SWE-bench에서 Opus 4.6과 1.2%p 차이로 대부분의 코딩 작업에서 Opus급 성능 발휘.

+
+
+
+ + {{-- Sonnet 4.5 --}} +
+
+
+
+

Balanced

+

Claude Sonnet 4.5

+
+
+ 2025.09 +
+
+

"세계 최고의 코딩 모델"로 불린 당시 최고 성능 Sonnet

+
+
+
+
+

Context

+

200K

+
+
+

SWE-bench

+

77.2%

+
+
+

Price

+

$3/$15

+
+
+
+
+
SWE-bench Verified77.2%
+
+
+
+
GPQA Diamond83.4%
+
+
+
+
OSWorld61.4%
+
+
+
+
+

역사적 의의

+

출시 당시 SWE-bench 최고 점수 기록. 30시간 이상 집중 작업이 가능한 안정성으로 "세계 최고의 코딩 모델"이라는 평가를 받음.

+
+
+
+
+ + {{-- === 이전 세대 모델 === --}} +

+ + 이전 세대 & 경량 모델 +

+
+ + {{-- Claude 4 Opus --}} +
+
+

Claude 4 Opus

+

2025.09.18 | $15/$75

+
+
+
+
+
SWE-bench72.5%
+
+
+
+
GPQA Diamond79.6%
+
+
+
+

200K context | High-compute 모드에서 SWE-bench 79.4%, AIME 90.0% 달성. 복잡한 아키텍처 설계에 강점.

+
+
+ + {{-- Claude 4 Sonnet --}} +
+
+

Claude 4 Sonnet

+

2025.05.14 | $3/$15

+
+
+
+
+
SWE-bench72.7%
+
+
+
+

200K context | Extended Thinking 본격 도입. 당시 Opus 4보다 SWE-bench에서 높은 점수를 기록한 가성비 모델.

+
+
+ + {{-- Claude 3.7 Sonnet --}} +
+
+

Claude 3.7 Sonnet

+

2025.02 | $3/$15

+
+
+
+
+
SWE-bench70.3%
+
+
+
+
GPQA (Extended)84.8%
+
+
+
+

200K context | Extended Thinking 최초 도입. 확장 모드에서 MATH 500 96.2% 달성. Claude Code의 기반이 된 모델.

+
+
+ + {{-- Claude 3.5 Sonnet --}} +
+
+

Claude 3.5 Sonnet

+

2024.06 (Oct 업그레이드) | $3/$15

+
+
+
+
+
SWE-bench62.3%
+
+
+
+
GPQA Diamond59.4%
+
+
+
+

200K context | Claude Code 최초 탑재 모델. 당시 혁신적이었으나 현재 모델들과 비교하면 성능 차이가 뚜렷.

+
+
+ + {{-- Haiku 4.5 --}} +
+
+

Claude Haiku 4.5

+

2025.10 | $1/$5

+
+
+
+

200K context | 초고속 경량 모델

+
+ 서브에이전트 최적 + 파일 탐색 + 간단한 분석 + 최저 비용 +
+
+

Claude Code에서 서브에이전트(Explore, Test-runner 등)에 주로 사용. 빠른 응답 속도와 낮은 비용이 장점.

+
+
+
+ + {{-- Opus 4.6 vs Sonnet 4.6 직접 비교 --}} +
+

Opus 4.6 vs Sonnet 4.6 — 핵심 차이점

+
+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
항목Opus 4.6Sonnet 4.6차이
SWE-bench80.8%79.6%1.2%p
GPQA Diamond91.3%74.1%17.2%p
ARC-AGI 268.8%58.3%10.5%p
OSWorld72.7%72.5%0.2%p
Max Output128K tokens64K tokens2x
가격 (Input/Output)$5 / $25$3 / $1540~67% 절감
+
+
+

결론: 코딩(SWE-bench)과 컴퓨터 사용(OSWorld)에서는 거의 동등한 성능. 추론(GPQA)에서 Opus 4.6이 압도적 우위(17%p 차이). 비용 대비 코딩 성능만 보면 Sonnet 4.6이 최적, 심층 추론이 필요하면 Opus 4.6 선택.

+
+
+
+ + {{-- ===== 탭 3: 모델 진화 (기존 탭2 강화) ===== --}} +
+

Claude 모델 세대별 진화

+

Sonnet 3.5에서 Opus 4.6까지 — SWE-bench 49%에서 80.8%로, 1년 반 만에 65% 성능 향상.

+ + {{-- 세대별 비교 테이블 --}}
- +
- - - - - - + + + + + + + + + - - - - - - + + + + + + + + + - - - - - - + + + + + + + + + - - - - - - + + + + + + + + + - - - - - - + + + + + + + + + - - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + - - - - + + + + + + + + + + + + + + + + +
모델출시특징코딩 성능가격
모델출시일SWE-benchGPQAContextOutput가격 (In/Out)핵심 혁신
Sonnet 3.52024.10Claude Code 최초 탑재 모델
기본
$3/$15
Sonnet 3.52024.0649.0%59.4%200K8K$3 / $15Claude Code 최초 모델
Sonnet 3.72025.02확장 사고(Extended Thinking) 도입
향상
$3/$15
Sonnet 3.5 v22024.1062.3%-200K8K$3 / $15Computer Use 도입
Sonnet 42025.05SWE-bench SOTA, 코딩 특화 대폭 강화
최고 효율
$3/$15
Sonnet 3.72025.0270.3%84.8%200K64K$3 / $15Extended Thinking 최초 도입
Opus 42025.09최고 지능, 복잡한 아키텍처 설계
최고 성능
$15/$75
Sonnet 42025.0572.7%-200K64K$3 / $15코딩 특화 대폭 강화
- Opus 4.6 - LATEST +
Opus 42025.0972.5%79.6%200K64K$15 / $75High-compute: SWE 79.4%
Sonnet 4.52025.0977.2%83.4%200K64K$3 / $15"세계 최고 코딩 모델"
Haiku 4.52025.10--200K8K$1 / $5초고속 경량, 서브에이전트용
Opus 4.52025.1180.9%87.0%200K128K$15 / $75최초 SWE-bench 80% 돌파
+ Opus 4.6 + LATEST 2025.12빠른 출력 + 최고 성능 결합, Fast Mode
최고 성능 + 속도
$15/$752026.0280.8%91.3%200K
1M beta
128K$5 / $25Agent Teams, GPQA 91.3%
+ Sonnet 4.6 + LATEST + 2026.0279.6%74.1%200K
1M beta
64K$3 / $15동적 웹 필터링, 가성비
-
-

모델 선택 가이드

+ {{-- SWE-bench 성장 그래프 (CSS 바 차트) --}} +
+

SWE-bench Verified 성장 추이 (2024~2026)

+
+
+ 3.5 Sonnet +
49.0%
+
+
+ 3.5 v2 +
62.3%
+
+
+ 3.7 Sonnet +
70.3%
+
+
+ Sonnet 4 +
72.7%
+
+
+ Sonnet 4.5 +
77.2%
+
+
+ Sonnet 4.6 +
79.6%
+
+
+ Opus 4.6 +
80.8%
+
+
+

Sonnet 3.5(49%) → Opus 4.6(80.8%): 1년 8개월간 +31.8%p 성장 (65% 향상)

+
+ + {{-- 모델 선택 가이드 --}} +
+

Claude Code 모델 선택 가이드

-

Opus 4.6 (기본 권장)

-

복잡한 설계, 대규모 리팩토링, 아키텍처 결정이 필요한 작업

+

Opus 4.6 (메인 추천)

+

복잡한 설계, 대규모 리팩토링, 심층 추론. GPQA 91.3%의 압도적 추론력. Fast Mode로 2.5x 빠른 출력 가능.

Sonnet 4.6 (빠른 작업)

-

단순 수정, 반복 작업, 비용 최적화가 필요한 경우

+

일상 코딩, 반복 작업, 비용 최적화. SWE-bench 79.6%로 Opus급 코딩을 1/3 가격에.

Haiku 4.5 (서브에이전트)

-

탐색, 파일 검색, 간단한 분석 등 경량 작업

+

파일 탐색, 간단한 분석. $1/$5의 초저비용으로 서브에이전트에 최적화.

- {{-- ===== 탭 3: 생태계 ===== --}} -
+ {{-- ===== 탭 4: 생태계 ===== --}} +

Claude Code 생태계

@@ -413,7 +1018,7 @@
IDE 통합
- ⌨️ +

터미널 (네이티브)

zsh, bash, PowerShell에서 직접 실행

@@ -447,7 +1052,7 @@
- 🏗️ + 🏗

Headless Mode

비대화형 자동화 (스크립트, 파이프라인)

@@ -492,7 +1097,7 @@
{{-- SAM 팀 활용 현황 --}} -
+

SAM 프로젝트 팀의 Claude Code 활용 현황