diff --git a/resources/views/claude-code/history/index.blade.php b/resources/views/claude-code/history/index.blade.php index 4c6c48a6..a46a1807 100644 --- a/resources/views/claude-code/history/index.blade.php +++ b/resources/views/claude-code/history/index.blade.php @@ -43,11 +43,48 @@ .evo-card { background: linear-gradient(135deg, rgba(255,255,255,0.95), rgba(248,250,252,1)); border-radius: 1rem; border: 1px solid #e2e8f0; overflow: hidden; } .evo-card-header { padding: 1rem 1.5rem; font-weight: 700; color: white; font-size: 0.85rem; } + /* 모델 카드 */ + .model-card { background: white; border-radius: 1rem; border: 1px solid #e2e8f0; overflow: hidden; transition: all 0.3s; } + .model-card:hover { transform: translateY(-4px); box-shadow: 0 16px 48px rgba(0,0,0,0.1); } + .model-card-head { padding: 1.25rem 1.5rem; color: white; position: relative; overflow: hidden; } + .model-card-head::after { content: ''; position: absolute; top: -20px; right: -20px; width: 80px; height: 80px; border-radius: 50%; background: rgba(255,255,255,0.1); } + .model-card-body { padding: 1.25rem 1.5rem; } + + /* 벤치마크 바 */ + .bench-bar-wrap { margin-bottom: 0.6rem; } + .bench-label { display: flex; justify-content: space-between; font-size: 0.7rem; margin-bottom: 3px; } + .bench-bar { height: 8px; background: #f1f5f9; border-radius: 4px; overflow: hidden; } + .bench-fill { height: 100%; border-radius: 4px; transition: width 0.8s ease-out; } + + /* 세대 비교 테이블 */ + .gen-table { width: 100%; border-collapse: separate; border-spacing: 0; } + .gen-table th, .gen-table td { padding: 0.75rem 1rem; text-align: center; font-size: 0.8rem; } + .gen-table thead th { background: #1e293b; color: white; font-weight: 700; } + .gen-table thead th:first-child { border-radius: 0.75rem 0 0 0; text-align: left; } + .gen-table thead th:last-child { border-radius: 0 0.75rem 0 0; } + .gen-table tbody tr { border-bottom: 1px solid #f1f5f9; } + .gen-table tbody tr:hover { background: #f8fafc; } + .gen-table tbody td:first-child { text-align: left; font-weight: 600; } + + /* 스코어 뱃지 */ + .score-badge { display: inline-block; padding: 2px 10px; border-radius: 12px; font-size: 0.7rem; font-weight: 700; } + + /* 강점 태그 */ + .strength-tag { display: inline-flex; align-items: center; gap: 3px; padding: 4px 10px; border-radius: 6px; font-size: 0.65rem; font-weight: 600; background: #f8fafc; border: 1px solid #e2e8f0; color: #475569; } + + /* 모델 티어 */ + .tier-flagship { border-left: 4px solid #7c3aed; } + .tier-balanced { border-left: 4px solid #2563eb; } + .tier-fast { border-left: 4px solid #059669; } + .tier-light { border-left: 4px solid #64748b; } + /* 애니메이션 */ @keyframes slideUp { from { opacity: 0; transform: translateY(30px); } to { opacity: 1; transform: translateY(0); } } .anim-up { animation: slideUp 0.6s ease-out forwards; } @keyframes pulse-glow { 0%, 100% { box-shadow: 0 0 20px rgba(99, 102, 241, 0.3); } 50% { box-shadow: 0 0 40px rgba(99, 102, 241, 0.6); } } .pulse-glow { animation: pulse-glow 3s ease-in-out infinite; } + @keyframes fillBar { from { width: 0; } } + .anim-bar { animation: fillBar 1s ease-out forwards; } @endpush @@ -74,19 +111,19 @@ {{-- 핵심 수치 --}}
Claude 3.5 Sonnet / Claude 3.7 Sonnet 기반으로 일반 공개. Max/Pro 구독 모델 도입. GitHub, GitLab 연동으로 실질적 개발 워크플로우 지원 시작.
+Claude 3.5/3.7 Sonnet 기반으로 일반 공개. Max/Pro 구독 모델 도입. GitHub, GitLab 연동으로 실질적 개발 워크플로우 지원 시작.
Claude 4 Sonnet (claude-sonnet-4-20250514) 출시. SWE-bench에서 역대 최고 성적. 코드 이해도·정확성이 급격히 향상되며 Claude Code의 실전 능력이 도약.
+Claude 4 Sonnet 출시. SWE-bench 72.7%로 당시 최고 성적. 코드 이해도와 정확성이 급격히 향상되며 Claude Code의 실전 능력이 도약.
Model Context Protocol(MCP)로 외부 도구 연동 표준화. Hooks(pre/post 실행 스크립트), Custom Skills, Custom Agents 시스템으로 확장성 극대화. 커뮤니티 생태계 급성장.
+Model Context Protocol(MCP)로 외부 도구 연동 표준화. Hooks, Custom Skills, Custom Agents 시스템으로 확장성 극대화. 커뮤니티 생태계 급성장.
Claude 4 Opus(claude-opus-4-20250918) — Anthropic 최고 성능 모델. 복잡한 아키텍처 설계·리팩토링·대규모 코드베이스 이해에서 압도적 성능. Haiku 4.5는 초고속 경량 모델로 서브에이전트 최적화.
+Claude 4 Opus — 최고 지능 모델. Sonnet 4.5 — SWE-bench 77.2%로 "세계 최고의 코딩 모델" 등극. 서브에이전트, Worktree 병렬 작업 도입.
SWE-bench 80.9%로 최초 80% 벽 돌파. Sonnet 4.5 대비 76% 적은 토큰으로 동일 성능 달성. Infinite Chats로 컨텍스트 제한 해소.
+Opus 4.6 (claude-opus-4-6) — 빠른 출력 + 최고 성능 결합. GitHub Actions CI/CD 통합, 엔터프라이즈 보안 정책, Task 관리, 자동 메모리 시스템 안정화. 실무 프로젝트에서 시니어 개발자급 자율 코딩 가능.
+Opus 4.6 (2/5) — GPQA 91.3%, Agent Teams, Adaptive Thinking. Sonnet 4.6 (2/17) — 1M 컨텍스트 베타, Opus에 근접한 코딩 성능. Cowork(비개발자 GUI), Claude Code Security 출시.
복잡한 작업을 여러 서브에이전트에 위임하여 병렬 처리. Worktree를 활용한 독립 작업 공간에서 동시에 여러 기능을 개발. 시니어 개발자가 주니어들에게 업무를 분배하는 것과 유사.
+복잡한 작업을 여러 서브에이전트에 위임하여 병렬 처리. Worktree를 활용한 독립 작업 공간에서 동시에 여러 기능을 개발.
실행 흐름:
메인 에이전트 → 분석 에이전트 (탐색)
@@ -305,7 +364,7 @@대화가 끝나도 중요한 패턴·선호·교훈을 MEMORY.md에 자동 저장. 다음 세션에서 동일한 실수를 반복하지 않음. 프로젝트와 함께 성장하는 AI.
대화가 끝나도 중요한 패턴과 교훈을 MEMORY.md에 자동 저장. 다음 세션에서 동일한 실수를 반복하지 않음. 프로젝트와 함께 성장하는 AI.
저장하는 것: 검증된 패턴, 아키텍처 결정, 사용자 선호
저장하지 않는 것: 임시 작업, 미검증 추측
@@ -316,7 +375,7 @@도구 실행 전후에 자동으로 스크립트를 실행. Lint 자동 적용, 위험 명령 차단, 커밋 메시지 검증 등을 자동화. Co-Authored-By 서명 자동 제거 같은 팀 규칙도 Hook으로 강제.
+도구 실행 전후에 자동으로 스크립트를 실행. Lint 자동 적용, 위험 명령 차단, 커밋 메시지 검증 등을 자동화. HTTP Hooks로 외부 서비스 연동도 가능.
각 모델의 핵심 역량, 벤치마크 성능, 적합한 사용 시나리오를 한눈에 비교합니다.
+ {{-- === Flagship 모델 === --}} +Flagship
+claude-opus-4-6 — Anthropic 최고 지능 + 최고 속도
+Context
+200K
+1M beta
+Max Output
+128K
+Price
+$5/$25
+in/out MTok
+핵심 강점
+적합한 작업
+대규모 아키텍처 설계, 복잡한 리팩토링, 멀티파일 코드 생성, 심층 분석 및 추론이 필요한 작업. SAM 프로젝트의 메인 모델.
+Flagship
+최초 SWE-bench 80% 돌파, 토큰 효율성 혁신
+Context
+200K
+1M beta
+Max Output
+128K
+Price
+$15/$75
+in/out MTok
+핵심 강점
+역사적 의의
+SWE-bench에서 최초로 80%를 돌파한 모델. 같은 수준의 성능을 Sonnet 4.5 대비 76% 적은 출력 토큰으로 달성하는 효율성 혁신.
+Balanced
+claude-sonnet-4-6 — Opus급 코딩 성능을 1/3 가격에
+Context
+200K
+1M beta
+Max Output
+64K
+Price
+$3/$15
+in/out MTok
+핵심 강점
+적합한 작업
+일상적 코딩, 빠른 반복 작업, 비용 최적화. SWE-bench에서 Opus 4.6과 1.2%p 차이로 대부분의 코딩 작업에서 Opus급 성능 발휘.
+Balanced
+"세계 최고의 코딩 모델"로 불린 당시 최고 성능 Sonnet
+Context
+200K
+SWE-bench
+77.2%
+Price
+$3/$15
+역사적 의의
+출시 당시 SWE-bench 최고 점수 기록. 30시간 이상 집중 작업이 가능한 안정성으로 "세계 최고의 코딩 모델"이라는 평가를 받음.
+2025.09.18 | $15/$75
+200K context | High-compute 모드에서 SWE-bench 79.4%, AIME 90.0% 달성. 복잡한 아키텍처 설계에 강점.
+2025.05.14 | $3/$15
+200K context | Extended Thinking 본격 도입. 당시 Opus 4보다 SWE-bench에서 높은 점수를 기록한 가성비 모델.
+2025.02 | $3/$15
+200K context | Extended Thinking 최초 도입. 확장 모드에서 MATH 500 96.2% 달성. Claude Code의 기반이 된 모델.
+2024.06 (Oct 업그레이드) | $3/$15
+200K context | Claude Code 최초 탑재 모델. 당시 혁신적이었으나 현재 모델들과 비교하면 성능 차이가 뚜렷.
+2025.10 | $1/$5
+200K context | 초고속 경량 모델
+Claude Code에서 서브에이전트(Explore, Test-runner 등)에 주로 사용. 빠른 응답 속도와 낮은 비용이 장점.
+| 항목 | +Opus 4.6 | +Sonnet 4.6 | +차이 | +
|---|---|---|---|
| SWE-bench | +80.8% | +79.6% | +1.2%p | +
| GPQA Diamond | +91.3% | +74.1% | +17.2%p | +
| ARC-AGI 2 | +68.8% | +58.3% | +10.5%p | +
| OSWorld | +72.7% | +72.5% | +0.2%p | +
| Max Output | +128K tokens | +64K tokens | +2x | +
| 가격 (Input/Output) | +$5 / $25 | +$3 / $15 | +40~67% 절감 | +
결론: 코딩(SWE-bench)과 컴퓨터 사용(OSWorld)에서는 거의 동등한 성능. 추론(GPQA)에서 Opus 4.6이 압도적 우위(17%p 차이). 비용 대비 코딩 성능만 보면 Sonnet 4.6이 최적, 심층 추론이 필요하면 Opus 4.6 선택.
+Sonnet 3.5에서 Opus 4.6까지 — SWE-bench 49%에서 80.8%로, 1년 반 만에 65% 성능 향상.
+ + {{-- 세대별 비교 테이블 --}}| 모델 | -출시 | -특징 | -코딩 성능 | -가격 | +|||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 모델 | +출시일 | +SWE-bench | +GPQA | +Context | +Output | +가격 (In/Out) | +핵심 혁신 | ||||
| Sonnet 3.5 | -2024.10 | -Claude Code 최초 탑재 모델 | -기본 |
- $3/$15 | +|||||||
| Sonnet 3.5 | +2024.06 | +49.0% | +59.4% | +200K | +8K | +$3 / $15 | +Claude Code 최초 모델 | ||||
| Sonnet 3.7 | -2025.02 | -확장 사고(Extended Thinking) 도입 | -향상 |
- $3/$15 | +|||||||
| Sonnet 3.5 v2 | +2024.10 | +62.3% | +- | +200K | +8K | +$3 / $15 | +Computer Use 도입 | ||||
| Sonnet 4 | -2025.05 | -SWE-bench SOTA, 코딩 특화 대폭 강화 | -최고 효율 |
- $3/$15 | +|||||||
| Sonnet 3.7 | +2025.02 | +70.3% | +84.8% | +200K | +64K | +$3 / $15 | +Extended Thinking 최초 도입 | ||||
| Opus 4 | -2025.09 | -최고 지능, 복잡한 아키텍처 설계 | -최고 성능 |
- $15/$75 | +|||||||
| Sonnet 4 | +2025.05 | +72.7% | +- | +200K | +64K | +$3 / $15 | +코딩 특화 대폭 강화 | ||||
| - Opus 4.6 - LATEST + | |||||||||||
| Opus 4 | +2025.09 | +72.5% | +79.6% | +200K | +64K | +$15 / $75 | +High-compute: SWE 79.4% | +||||
| Sonnet 4.5 | +2025.09 | +77.2% | +83.4% | +200K | +64K | +$3 / $15 | +"세계 최고 코딩 모델" | +||||
| Haiku 4.5 | +2025.10 | +- | +- | +200K | +8K | +$1 / $5 | +초고속 경량, 서브에이전트용 | +||||
| Opus 4.5 | +2025.11 | +80.9% | +87.0% | +200K | +128K | +$15 / $75 | +최초 SWE-bench 80% 돌파 | +||||
| + Opus 4.6 + LATEST | -2025.12 | -빠른 출력 + 최고 성능 결합, Fast Mode | -최고 성능 + 속도 |
- $15/$75 | +2026.02 | +80.8% | +91.3% | +200K 1M beta |
+ 128K | +$5 / $25 | +Agent Teams, GPQA 91.3% | +
| + Sonnet 4.6 + LATEST + | +2026.02 | +79.6% | +74.1% | +200K 1M beta |
+ 64K | +$3 / $15 | +동적 웹 필터링, 가성비 |
Sonnet 3.5(49%) → Opus 4.6(80.8%): 1년 8개월간 +31.8%p 성장 (65% 향상)
+Opus 4.6 (기본 권장)
-복잡한 설계, 대규모 리팩토링, 아키텍처 결정이 필요한 작업
+Opus 4.6 (메인 추천)
+복잡한 설계, 대규모 리팩토링, 심층 추론. GPQA 91.3%의 압도적 추론력. Fast Mode로 2.5x 빠른 출력 가능.
Sonnet 4.6 (빠른 작업)
-단순 수정, 반복 작업, 비용 최적화가 필요한 경우
+일상 코딩, 반복 작업, 비용 최적화. SWE-bench 79.6%로 Opus급 코딩을 1/3 가격에.
Haiku 4.5 (서브에이전트)
-탐색, 파일 검색, 간단한 분석 등 경량 작업
+파일 탐색, 간단한 분석. $1/$5의 초저비용으로 서브에이전트에 최적화.
터미널 (네이티브)
zsh, bash, PowerShell에서 직접 실행
@@ -447,7 +1052,7 @@Headless Mode
비대화형 자동화 (스크립트, 파이프라인)
@@ -492,7 +1097,7 @@