# caption-to-image > Gemini API를 활용하여 연구제안서 캡션을 4K 인포그래픽 이미지로 변환. 사용자가 캡션 이미지 생성, 그림 생성, 인포그래픽 만들기, 마크다운 캡션을 이미지로 변환해달라고 요청할 때 사용. - Author: orientpine - Repository: orientpine/image_gen_cc_seminar - Version: 20251222155335 - Stars: 0 - Forks: 0 - Last Updated: 2026-02-07 - Source: https://github.com/orientpine/image_gen_cc_seminar - Web: https://mule.run/skillshub/@@orientpine/image_gen_cc_seminar~caption-to-image:20251222155335 --- --- name: caption-to-image description: Gemini API를 활용하여 연구제안서 캡션을 4K 인포그래픽 이미지로 변환. 사용자가 캡션 이미지 생성, 그림 생성, 인포그래픽 만들기, 마크다운 캡션을 이미지로 변환해달라고 요청할 때 사용. --- # Caption to Image Generator Gemini API를 활용하여 연구제안서의 캡션을 전문적인 4K 인포그래픽 이미지로 변환하는 스킬입니다. ## Instructions ### 중요: 한글 텍스트 생성 원칙 이 스킬은 **한국 정부 발표 자료용**으로 설계되었습니다. 이미지 생성 시 반드시 다음 원칙을 준수하세요: 1. **모든 텍스트는 한글로 작성**: 제목, 레이블, 설명 등 이미지 내 모든 텍스트를 한국어로 생성 2. **공식 문서 톤 유지**: 정부 보고서에 적합한 격식체 사용 3. **전문 용어 한글화**: 가능한 한 영어 약어보다 한글 표현 우선 사용 4. **가독성 우선**: 폰트 크기와 배치를 한글 가독성에 최적화 ### 1. 캡션 목록 확인 먼저 마크다운 파일에서 캡션 목록을 확인합니다: ```bash python ${CLAUDE_PLUGIN_ROOT}/skills/caption-to-image/scripts/gemini_image_gen.py <파일경로> --list ``` ### 2. 이미지 생성 **전체 생성:** ```bash python ${CLAUDE_PLUGIN_ROOT}/skills/caption-to-image/scripts/gemini_image_gen.py <파일경로> --all --output output ``` **선택 생성:** ```bash python ${CLAUDE_PLUGIN_ROOT}/skills/caption-to-image/scripts/gemini_image_gen.py <파일경로> --select 0,1,2 --output output ``` ### 3. 결과 확인 생성된 이미지는 `output/` 폴더에 저장됩니다. ## 이미지 생성 사양 | 항목 | 값 | |------|-----| | 해상도 | 4K | | 비율 | 16:9 | | 모델 | gemini-2.0-flash-preview-image-generation | | 텍스트 | 한국어 지원, 고급 텍스트 렌더링 | | 스타일 | 전문적인 연구제안서 인포그래픽 | ## 캡션 형식 마크다운 파일에서 다음 형식의 캡션을 인식합니다: ``` <연구개발 목표 및 비전> <기술개발 로드맵> <연차별 연구목표 및 내용> <사업 추진 체계> ``` ## 파일명 규칙 - 기본: `{캡션명}.png` - 공백은 언더스코어로 변환: `연구개발_목표_및_비전.png` - 중복 시 버전 추가: `연구개발_목표_및_비전_2.png` ## 환경 설정 ```bash # Gemini API 키 설정 필수 export GEMINI_API_KEY="your-api-key" ``` ## Examples 1. 사용자: "chapter3_bio.md 파일의 캡션들을 이미지로 만들어줘" 2. 캡션 목록 확인: ```bash python ${CLAUDE_PLUGIN_ROOT}/skills/caption-to-image/scripts/gemini_image_gen.py resource/chapter3_bio.md --list ``` 3. 전체 이미지 생성: ```bash python ${CLAUDE_PLUGIN_ROOT}/skills/caption-to-image/scripts/gemini_image_gen.py resource/chapter3_bio.md --all ``` 4. 결과: ``` output/ ├── 연구개발_목표_및_비전.png ├── 기술개발_로드맵.png ├── 연차별_연구목표_및_내용.png └── ... ``` ## 주의사항 - Gemini API 키가 필요합니다 - 이미지 생성에는 API 호출 비용이 발생할 수 있습니다 - 네트워크 연결이 필요합니다 - 많은 캡션을 한번에 생성하면 시간이 오래 걸릴 수 있습니다