# fal-media-generator

> Generiert Bilder mit Nano Banana Pro, Videos mit Kling 2.6, oder Voice/Audio mit ElevenLabs 2.5 Turbo auf fal.ai. Nutze dies wenn der Nutzer Bilder, Videos oder Voiceovers erstellen möchte.

- Author: tillmannvey-spec
- Repository: tillmannvey-spec/Strain_Index
- Version: 20260203195154
- Stars: 0
- Forks: 0
- Last Updated: 2026-02-06
- Source: https://github.com/tillmannvey-spec/Strain_Index
- Web: https://mule.run/skillshub/@@tillmannvey-spec/Strain_Index~fal-media-generator:20260203195154

---

---
name: fal-media-generator
description: Generiert Bilder mit Nano Banana Pro, Videos mit Kling 2.6, oder Voice/Audio mit ElevenLabs 2.5 Turbo auf fal.ai. Nutze dies wenn der Nutzer Bilder, Videos oder Voiceovers erstellen möchte.
allowed-tools: Bash(python *)
---

# fal.ai Media Generator

Erstellt Bilder, Videos und Voice/Audio mit fal.ai APIs:
- **Bilder**: Nano Banana Pro (hochqualitative AI-Bildgenerierung)
- **Videos**: Kling 2.6 Pro (Text-to-Video mit nativer Audio-Generierung)
- **Voice/Audio**: ElevenLabs 2.5 Turbo (Text-to-Speech für Narrator und Voiceovers)

## Verwendung

### Bilder generieren

```bash
python ~/.claude/skills/fal-media-generator/scripts/generate.py image "$ARGUMENTS"
```

**Parameter für Bilder** (als JSON oder als Argumente):
- `prompt` (erforderlich): Text-Beschreibung des gewünschten Bildes
- `aspect_ratio`: 1:1, 16:9, 9:16, 4:3, 3:2, 21:9 (Standard: 1:1)
- `resolution`: 1K, 2K, 4K (Standard: 2K)
- `num_images`: Anzahl der Bilder (1-4, Standard: 1)
- `output_format`: jpeg, png, webp (Standard: png)

**Beispiele**:
```bash
# Einfach
python ~/.claude/skills/fal-media-generator/scripts/generate.py image "A sunset over mountains"

# Mit Parametern
python ~/.claude/skills/fal-media-generator/scripts/generate.py image "A sunset over mountains" --aspect_ratio 16:9 --resolution 2K

# Mehrere Bilder
python ~/.claude/skills/fal-media-generator/scripts/generate.py image "Modern architecture" --num_images 4
```

### Videos generieren

```bash
python ~/.claude/skills/fal-media-generator/scripts/generate.py video "$ARGUMENTS"
```

**Parameter für Videos** (als JSON oder als Argumente):
- `prompt` (erforderlich): Text-Beschreibung des gewünschten Videos
- `duration`: "5" oder "10" Sekunden (Standard: "5")
- `aspect_ratio`: 16:9, 9:16, 1:1 (Standard: 16:9)
- `generate_audio`: true/false - Native Audio-Generierung (Standard: true)
- `cfg_scale`: Guidance Scale 0.0-1.0 (Standard: 0.5)

**Beispiele**:
```bash
# Einfach (5s, 16:9, mit Audio)
python ~/.claude/skills/fal-media-generator/scripts/generate.py video "A cat playing with a ball of yarn"

# Lange Version mit Audio
python ~/.claude/skills/fal-media-generator/scripts/generate.py video "Cinematic sunset over ocean waves" --duration 10 --generate_audio true

# Quadratisch, ohne Audio
python ~/.claude/skills/fal-media-generator/scripts/generate.py video "Abstract colorful shapes morphing" --aspect_ratio 1:1 --generate_audio false
```

### Voice/Audio generieren

```bash
python ~/.claude/skills/fal-media-generator/scripts/generate.py voice "$TEXT"
```

**Parameter für Voice** (als JSON oder als Argumente):
- `prompt` (erforderlich): Text der gesprochen werden soll
- `voice`: Voice Name oder ID (Standard: "Rachel" - weiblich, amerikanisch)
  - Verfügbare Stimmen: Rachel, Adam, Bella, Antoni, Elli, Josh, Arnold, Domi, u.v.m.
- `model_id`: ElevenLabs Model (Standard: "eleven_turbo_v2_5")
- `stability`: Stimm-Stabilität 0.0-1.0 (Standard: 0.5) - Höher = konsistenter, Niedriger = expressiver
- `similarity_boost`: Stimm-Ähnlichkeit 0.0-1.0 (Standard: 0.75)
- `style`: Expressivität/Stil 0.0-1.0 (Standard: 0.0)
- `use_speaker_boost`: Speaker Boost aktivieren true/false (Standard: true)

**Beispiele**:
```bash
# Einfach (Standard-Stimme Rachel)
python ~/.claude/skills/fal-media-generator/scripts/generate.py voice "Welcome to our amazing product showcase"

# Mit spezifischer Stimme und Einstellungen
python ~/.claude/skills/fal-media-generator/scripts/generate.py voice "This is an exciting announcement" --voice Adam --stability 0.6 --style 0.3

# Narrator für Video (expressiv)
python ~/.claude/skills/fal-media-generator/scripts/generate.py voice "In a world where technology meets creativity, one tool stands above the rest" --voice Bella --stability 0.4 --style 0.5

# Professioneller Sprecher (sehr stabil)
python ~/.claude/skills/fal-media-generator/scripts/generate.py voice "For more information, visit our website" --voice Josh --stability 0.8 --similarity_boost 0.9
```

## Workflow

Wenn der Nutzer ein Bild, Video oder Voice erstellen möchte:

1. **Identifiziere den Medientyp**: Bild, Video oder Voice
2. **Sammle die Parameter**:
   - Für Bilder: Prüfe ob Quality (2K empfohlen), Aspect Ratio oder andere Einstellungen gewünscht sind
   - Für Videos: Prüfe ob Länge (5s oder 10s), Audio (Standard: an) oder Aspect Ratio spezifiziert wurden
   - Für Voice: Prüfe welche Stimme (Rachel Standard), Text-Inhalt und Style-Einstellungen gewünscht sind
3. **Führe das Script aus** mit den entsprechenden Parametern
4. **Zeige den Download-Link** und eine Vorschau (falls möglich)

## Ausgabe

Das Script gibt zurück:
- **Bilder**: URLs zu den generierten Bildern
- **Videos**: URL zum generierten Video
- **Voice/Audio**: URL zur generierten Audiodatei
- **Metadaten**: Dateigröße, Format, etc.

Die generierten Dateien werden automatisch heruntergeladen in:
- Bilder: `./fal-outputs/images/`
- Videos: `./fal-outputs/videos/`
- Audio: `./fal-outputs/audio/`

## Kosten (Information)

- **Bilder**: $0.15 pro Bild (4K: doppelter Preis)
- **Videos**: $0.07/Sekunde (ohne Audio) oder $0.14/Sekunde (mit Audio)
- **Voice**: ~$0.15-0.30 je nach Textlänge (ca. $0.15 pro 1000 Zeichen mit Turbo v2.5)

## API Key

Die fal.ai API Key ist im Script hinterlegt. Falls erforderlich, kann sie als Umgebungsvariable `FAL_KEY` gesetzt werden.