제조 현장의 목소리를 데이터화하고 이를 자동으로 문서화하는 프로세스는 업무 효율을 극대화할 수 있는 아주 훌륭한 시도입니다. **Gemini의 강력한 멀티모달(음성/텍스트) 분석 능력**과 **Claude의 정교한 코드 생성 및 구조화 능력**을 결합한 최적의 워크플로우를 제안해 드립니다. --- ## 🤖 제조 견적서 자동 생성 AI 워크플로우 이 워크플로우는 음성 대화라는 **비정형 데이터**를 **정형 데이터(JSON)**로 변환한 뒤, 이를 바탕으로 **PPTX 결과물**을 생성하는 데 초점을 맞춥니다. ### 1단계: 음성 데이터 분석 및 데이터 구조화 (Gemini 1.5 Pro 활용) 매니저와 직원의 대화 녹음본을 Gemini에 입력하여 핵심 정보를 추출합니다. - **Input:** 음성 파일 (MP3, WAV 등) + 기존 견적서 양식 샘플(이미지 또는 PDF). - **Process:** \* Gemini가 대화 내용을 텍스트로 변환(STT)하고 맥락을 파악합니다. - 설명된 견적서 작성 규칙(할인율, 단가 산정 방식, 필수 포함 항목 등)을 논리적으로 정리합니다. - **Output:** **Structured Data (JSON)** - 예: `{ "customer": "A사", "items": [...], "total_price": "...", "delivery_date": "..." }` ### 2단계: 웹 기반 중간 검토 및 데이터 보정 (Claude Web Page Skill) 추출된 데이터가 정확한지 사용자가 확인하고 수정할 수 있는 단계입니다. - **Process:** \* Claude의 웹 구성 기술을 활용해 추출된 데이터를 테이블 형태로 보여주는 임시 웹 페이지 인터페이스를 생성합니다. - 사용자가 오인식된 숫자나 항목을 수정하면 즉시 JSON 데이터에 반영합니다. - **Key Feature:** "데이터 확정" 버튼을 누르면 다음 단계인 PPTX 생성 스크립트로 데이터가 전달됩니다. ### 3단계: PPTX 생성 로직 실행 (Claude Code Skill) 확정된 데이터를 바탕으로 실제 PPTX 파일을 생성하는 코드를 실행합니다. - **Process:** \* Claude가 `python-pptx` 라이브러리 등을 활용하여 미리 정의된 템플릿 슬라이드에 데이터를 매핑하는 코드를 작성하고 실행합니다. - **레이아웃 자동 배치:** 품목이 많을 경우 슬라이드를 자동으로 복제하거나 표의 크기를 조절하는 로직을 포함합니다. - **Output:** 최종 견적서 파일 (`.pptx`) ### 4단계: 최종 산출물 피드백 및 저장 - 생성된 PPTX 파일을 사용자에게 제공합니다. - 만약 디자인이나 내용에 수정이 필요하다면 Claude에게 "표의 색상을 변경해줘" 또는 "마지막에 안내 문구를 추가해줘"라고 요청하여 코드를 즉시 재수정합니다. --- ## 🛠 주요 기술 스택 및 역할 분담 | 단계 | 담당 AI | 기술 및 도구 | 비고 | | -------------------- | --------------- | ------------------------------ | ------------------------------------- | | **음성 인식 & 추론** | Gemini | Multimodal Audio Input | 긴 대화의 맥락 파악에 최적 | | **데이터 구조화** | Gemini / Claude | JSON Schema 추출 | 비정형 → 정형 데이터 변환 | | **UI/UX 구성** | Claude | React 또는 HTML/JS (Artifacts) | 사용자가 데이터를 확인하는 인터페이스 | | **문서 생성** | Claude | Python (`python-pptx`) | 실제 파일 바이너리 생성 | --- ## 💡 성공적인 자동화를 위한 팁 1. **프롬프트 엔지니어링 (Few-shot):** Gemini에게 음성을 넘길 때, "이전 견적서 사례" 2~3개를 함께 예시로 주면 추출 정확도가 대폭 향상됩니다. 2. **템플릿 고정:** PPTX의 배경 디자인이나 로고 등은 미리 만들어진 `template.pptx` 파일을 활용하고, AI는 **텍스트 박스와 표 내부의 값만 채우도록** 설정하는 것이 디자인 품질 유지에 유리합니다. 3. **예외 처리:** 대화 중에 "이건 나중에 확인해봐야 해" 같은 불확실한 내용은 `Unconfirmed` 플래그를 달아 웹 페이지에서 강조 표시되도록 설계하세요.