SAM 사용법 영상 자동 생성 시스템

SAM 사용법 영상 생성 파이프라인

Phase 1
AI 분석

Phase 2
슬라이드

Phase 3
나레이션

Phase 4
영상 합성

Gemini
스크린샷 분석

PHP GD
주석 오버레이

Cloud TTS
한국어 음성

FFmpeg
MP4 생성

출력: 최종 MP4 영상 (30초~3분) + PPTX 설명서

비용: ~$0.07/영상 | 생성시간: 1~2분

Veo3 대비 100배 저렴, 10배 빠름

1

2

3

4

Description

1

Phase 1: 입력 & AI 분석

스크린샷 업로드 또는 메뉴 선택 후 Gemini API가 UI 요소를 자동 인식하고 사용법 대본을 생성합니다.

2

Phase 2: 주석 슬라이드

각 Step별 스크린샷에 빨간 테두리, 번호 배지, 화살표, 딤 처리 등 시각적 주석을 오버레이합니다.

3

Phase 3: 나레이션 생성

Google Cloud TTS(ko-KR-Neural2-A, 여성)로 Step별 나레이션 음성 파일을 생성합니다.

4

Phase 4: 영상 합성

FFmpeg로 슬라이드 이미지 + 나레이션 + 전환효과(crossfade/zoom) + BGM을 합성하여 최종 MP4를 생성합니다.