SAM 사용법 영상 자동 생성 시스템
SAM 사용법 영상 생성 파이프라인
Phase 1
AI 분석
→
Phase 2
슬라이드
→
Phase 3
나레이션
→
Phase 4
영상 합성
Gemini
스크린샷 분석
PHP GD
주석 오버레이
Cloud TTS
한국어 음성
FFmpeg
MP4 생성
출력: 최종 MP4 영상 (30초~3분) + PPTX 설명서
비용: ~$0.07/영상 | 생성시간: 1~2분
Veo3 대비 100배 저렴, 10배 빠름
1
2
3
4
Description
1
Phase 1: 입력 & AI 분석
스크린샷 업로드 또는 메뉴 선택 후 Gemini API가 UI 요소를 자동 인식하고 사용법 대본을 생성합니다.
2
Phase 2: 주석 슬라이드
각 Step별 스크린샷에 빨간 테두리, 번호 배지, 화살표, 딤 처리 등 시각적 주석을 오버레이합니다.
3
Phase 3: 나레이션 생성
Google Cloud TTS(ko-KR-Neural2-A, 여성)로 Step별 나레이션 음성 파일을 생성합니다.
4
Phase 4: 영상 합성
FFmpeg로 슬라이드 이미지 + 나레이션 + 전환효과(crossfade/zoom) + BGM을 합성하여 최종 MP4를 생성합니다.