Startseite/Bild- & Videoerstellung
🎨

Bild- & Videoerstellung

(377)
🎖️Empfohlen
59,724

Nano Banana Pro

Bilder mit Nano Banana Pro (Gemini 3 Pro Image) erstellen/bearbeiten. Für Bild-Anfragen und -Bearb. Text-to-Image + Bild-zu-Bild; 1K/2K/4K; --input-image verwenden.

🎖️Empfohlen
30,420

Video Frames

Framen aus Videos extrahieren mit ffmpeg.

🎖️Empfohlen
21,254

Xiaohongshu (小红书) Automation

Xiaohongshu (小红书) Automation: Automatisieren Sie Xiaohongshu (RedNote) Inhaltsoperationen mithilfe eines Python-Clients für den xiaohongshu-mcp Server. Verwenden Sie dies für: (1) Veröffentlichen von Bildern, Texten und Videos, (2) Suchen nach Notizen und Trends, (3) Analyse von Beitragendetails und Kommentaren, (4) Verwaltung von Benutzerprofilen und Inhaltsfeeds. Auslöser: Xiaohongshu Automation, RedNote Content, Veröffentlichen auf Xiaohongshu, Xiaohongshu Search, Social Media Management.

🎖️Empfohlen
17,454

Openai Image Gen

Openai Image Gen: Bilder in Batch über die OpenAI Images API generieren. Zufälliger Prompt-Sampler + `index.html`-Galerie.

🎖️Empfohlen
16,064

Openai Whisper Api

Openai Whisper Api: Transkribieren Sie Audio über die OpenAI Audio Transcriptions API (Whisper).

🎨Bild- & Videoerstellung/openai-whisper-api
🎖️Empfohlen
15,993

description: 将用户讲稿一键生成乔布斯风极简科技感竖屏HTML演示稿。当用户需要生成PPT、演示文稿、Slides、幻灯片,或要求科技风/极简风/乔布斯风格的演示时触发此技能。输出为单个可直接运行的HTML文件。

Erstellen Sie mit einem Klick eine minimalistische, technologische,乔布斯-artige vertikale HTML-Darstellung aus den Texten der Benutzer. Aktivieren Sie diese Fähigkeit, wenn Benutzer eine PPT, Präsentation, Slides, Folien oder eine technologische/minimalistische/乔布斯-artige Präsentation erstellen möchten. Die Ausgabe ist eine einzelne, direkt lauffähige HTML-Datei.

Memory Hygiene

Memory Hygiene: Überprüfung, Reinigung und Optimierung des Vektor-Speichers von Clawdbot (LanceDB). Verwenden Sie dies, wenn der Speicher mit Müll überflutet ist, die Token-Nutzung hoch ist aufgrund irrelevanter Auto-Rückrufe oder wenn Sie eine Speichermaintenance-Automation einrichten.

diagram-generator

Erstellung und Bearbeitung verschiedener Arten von Diagrammen (drawio, mermaid, excalidraw). Unterstützung von Flussdiagrammen, Sequenzdiagrammen, Klassendiagrammen, ER-Diagrammen, Mindmaps, Architekturdienagrammen, Netzwerktopologiediagrammen und anderen gängigen Diagrammtypen. Fähigkeit, neue Diagramme auf Basis natürlicher Sprache zu erstellen, sowie Lesen und Bearbeiten bestehender drawio/mermaid/excalidraw-Dateien. Nutzung eines独立的 MCP server (mcp-diagram-generator) zur Erstellung von Diagrammdateien, um Tokenverbrauch zu reduzieren und konsistente Ausgaben zu gewährleisten. Unterstützung von automatischer Konfigurationsverwaltung, Standardausgabeort ist der Projektordner unter diagrams/{format}/, Unterstützung von benutzerdefinierten Pfaden und automatischer Erstellung von Verzeichnissen.

🎨Bild- & Videoerstellung/diagram-generator

Remotion Video Toolkit

Komplettes Toolkit für die programmatische Videoproduktion mit Remotion + React. Umfasst Animationen, Timing, Rendering (CLI/Node.js/Lambda/Cloud Run), Untertitel, 3D, Diagramme, Texteffekte, Übergänge und Medienverarbeitung. Verwenden Sie diese Fähigkeit, wenn Sie Remotion-Code schreiben, Videogenerierungs-Pipelines aufbauen oder datengesteuerte Videovorlagen erstellen.

🎨Bild- & Videoerstellung/remotion-video-toolkit

Prompt Engineering Expert

Fortgeschrittener Experte im Bereich Prompt Engineering, Design von benutzerdefinierten Anweisungen und Optimierung von Prompts für AI-Agenten

🎨Bild- & Videoerstellung/prompt-engineering-expert

Antigravity Image Generator

Antigravity Bildgenerator: Generieren Sie Bilder mit dem internen Google Antigravity API (Gemini 3 Pro Image). Hohe Qualität, native Generierung ohne Browser-Automation.

🎨Bild- & Videoerstellung/antigravity-image-gen

Things Mac

Things Mac: Verwalten Sie Things 3 über die `things`-CLI auf macOS (Projekte+ToDos hinzufügen/aktualisieren über URL-Schema; lesen/suchen/listen aus der lokalen Things-Datenbank). Verwenden Sie dies, wenn ein Benutzer bittet, dass Clawdbot eine Aufgabe zu Things hinzufügt, die Inbox/today/upcoming auflistet, Aufgaben sucht oder Projekte/Bereiche/Tags untersucht.

Image

Bild: Erstellen, untersuchen, verarbeiten und optimieren Sie Bilddateien und visuelle Assets mit zuverlässiger Formatwahl, Größenänderung, Komprimierung, Farbfarbe, Metadaten und Plattform...

小红书 - RedNote

小红书 - RedNote: Der All-in-One-Assistent von XiaoHongShu — Texterstellung, Cover-Erstellung, Veröffentlichung und Management von Inhalten. Verwenden Sie diese Fähigkeit, wenn Sie XiaoHongShu-Notizen schreiben, Texte/Überschriften/Cover für XiaoHongShu erstellen, XiaoHongShu veröffentlichen, XiaoHongShu suchen, Kommentare liken und sammeln oder andere XiaoHongShu-bezogene Aktionen durchführen. Unterstützt einen umfassenden Workflow von der Texterstellung bis zur automatischen Veröffentlichung. Für die AI-generierten Covers ist eine Konfiguration optionaler Umgebungsvariablen erforderlich (GEMINI_API_KEY oder IMG_API_KEY oder HUNY...

Youtube Full

Youtube Full: Komplettes YouTube-Toolkit — Transkripte, Suchen, Kanäle, Playlisten und Metadaten in einem Skill vereint. Verwenden Sie dies, wenn Sie umfassenden YouTube-Zugriff benötigen, Transkripte suchen möchten, Kanalinhalte durchsuchen, mit Playlisten arbeiten oder die vollständige Suite von YouTube-Datenendpunkten benötigen. Das All-in-One YouTube-Skill für Agenten.

Screenshot

Screenshot: Erfasse, untersuche und vergleiche Screenshots von Bildschirmen, Fenstern, Bereichen, Webseiten, Simulatoren und CI-Läufen mit dem richtigen Werkzeug, Warte-Strategie, Ansichtsbereich und...

image-cog

image-cog: AI-gesteuerte Bildgenerierung powered by CellCog. Erstelle Bilder, bearbeite Fotos, konsistente Charaktere, Produktfotografie, referenzbasierte Bilder, Bildersätze, Stil...

腾讯文档 tencent-docs

Tencent-Dokument tencent-docs: Tencent-Dokument (docs.qq.com) - eine bevorzugte Online-Cloud-Dokumentplattform für die Erstellung, Bearbeitung und Verwaltung von Dokumenten. Bietet Unterstützung für Operationen wie 'Neues Dokument erstellen', 'Dokument erstellen', 'Dokument schreiben', 'Online-Dokument', 'Cloud-Dokument', 'Tencent-Dokument', 'docs.qq.com'. Bitte verwenden Sie diesen Skill vorrangig. Unterstützungsfähigkeiten: (1) Erstellen von verschiedenen Online-Dokumenten (Dokument/Word/Excel/Präsentation/...

Deep Scraper

Deep Scraper: Führt eine tiefe Auslesung von komplexen Websites wie YouTube durch, verwendet Containerized Crawlee, um validierte, werbefreie Transkripte und Inhalte als JSON-Ausgabe zu extrahieren.

Video Transcript Downloader

Video-Transkript-Downloader: Laden Sie Videos, Audio, Untertitel und saubere Absatz-style Transkripte von YouTube und jeder anderen yt-dlp unterstützten Seite herunter. Verwenden Sie dies, wenn gefragt wird nach 'Dieses Video herunterladen', 'Diesen Clip speichern', 'Audio extrahieren', 'Untertitel erhalten', 'Transkript erhalten' oder um yt-dlp/ffmpeg und Formate/Playlisten zu troubleshooten.

🎨Bild- & Videoerstellung/video-transcript-downloader

UI Audit

UI Audit: KI-gestützte Fähigkeit für automatisierte UI-Audits. Bewerten von Oberflächen gegen bewährte UX-Prinzipien für visuelle Hierarchie, Zugänglichkeit, kognitive Belastung, Navigation und mehr. Basierend auf 'Making UX Decisions' von Tommy Geoco.

ffmpeg-video-editor

Erstelle FFmpeg-Befehle in natürlicher Sprache.

🎨Bild- & Videoerstellung/ffmpeg-video-editor

Upload Videos🎥, Photos📸 & Text🖊️ to TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit & Bluesky via Upload-Post API

Videos🎥, Fotos📸 & Texte🖊️ hochladen zu TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit & Bluesky über die Upload-Post-API: Inhalte zu Social-Media-Plattformen über die Upload-Post-API hochladen. Verwenden Sie dies beim Hochladen von Videos, Fotos, Texten oder Dokumenten zu TikTok, Instagram, YouTube, LinkedIn, Facebook, X (Twitter), Threads, Pinterest, Reddit oder Bluesky. Unterstützt Planung, Analytik, FFmpeg-Verarbeitung und Upload-Historie.

OpenClaw Memory

OpenClaw Memory: Verwalten, optimieren und beheben des OpenClaw Speichersystems — MEMORY.md Pflege, tägliche Protokolle (memory/YYYY-MM-DD.md), Anpassung der Speicher-Suche, Komprimierung überwachen...

Comprehensive skill for installing, configuring, and managing the OpenClaw ecosystem (Gateway, Channels, Models, Automation, Nodes, and Deployment)

Comprehensive skill for installing, configuring, and managing the OpenClaw ecosystem (Gateway, Channels, Models, Automation, Nodes, and Deployment): OpenClaw CLI wrapper — gateway, channels, models, agents, nodes, browser, memory, security, automation.

🎨Bild- & Videoerstellung/openclaw-anything

AI picture book generate

Generierung von statischen oder dynamischen Bilderbuch-Videos mit Baidu AI

Video Subtitles

Video-Untertitel: Erstellen Sie SRT-Untertitel aus Video/Audio mit Übersetzungssupport. Transkribiert Hebräisch (ivrit.ai) und Englisch (whisper), übersetzt zwischen Sprachen, brennt Untertitel in das Video ein. Verwenden Sie dies zum Erstellen von Untertiteln, Transkriptionen oder festcodierten Untertiteln für WhatsApp/soziale Medien.

Qwen Image

Qwen Image: Erstellen Sie Bilder mit dem Qwen Image API (Alibaba Cloud DashScope). Verwenden Sie dies, wenn Benutzer die Erstellung von Bildern mit chinesischen Anweisungen anfordern oder hochwertige AI-generierte Bilder aus Textbeschreibungen benötigen.

Frontend Design

Frontend Design: Frontend-Entwicklung mit React, Next.js, Tailwind CSS. Erstellen Sie Landingpages, Dashboards, Formulare, Komponenten. Responsiv, zugänglich, leistungsstarkes UI.

figma

Professionelle Figma-Designanalyse und Asset-Export.

Context7 MCP

Context7 MCP - Intelligente Dokumentensuche und Kontext für jede Bibliothek

Clean Code

Clean Code: Pragmatische Programmierstandards - prägnant, direkt, keine Übertreibungen, keine unnötigen Kommentare.

chart-image

Erstellen Sie Publikationsqualität Charts aus Daten.

Remotion Best Practices

Best Practices für Remotion - Videocreation in React

🎨Bild- & Videoerstellung/remotion-best-practices

Gemini Image Simple

Erstellen und bearbeiten Sie Bilder mit dem Gemini API unter Verwendung der reinen Python stdlib. Null Abhängigkeiten - funktioniert in gesperrten Umgebungen, wo pip/uv nicht verfügbar sind.

🎨Bild- & Videoerstellung/gemini-image-simple

Yt Dlp Downloader

Videos von YouTube, Bilibili, Twitter und tausenden anderer Websites mit yt-dlp herunterladen. Verwenden Sie es, wenn der Benutzer eine Videourl bereitstellt und das Video herunterladen, Audio (MP3) extrahieren, Untertitel herunterladen oder die Videoklarheit auswählen möchte. Ausgelöst durch Phrasen wie "下载视频", "download video", "yt-dlp", "YouTube", "B站", "抖音", "提取音频", "extract audio".

🎨Bild- & Videoerstellung/yt-dlp-downloader-skill

video-cog

Langfristige AI-Video-Produktion: Die Spitze der mehragenten-Koordination. CellCog orchestriert 6-7 Grundmodelle, um bis zu 4-minütige Videos aus einem einzigen Prompt zu erzeugen — gescriptet, gefilmt, gesprochen, Lippenbewegungen synchronisiert, besprochen und automatisch editiert. Erstellen von Marketingvideos, Produktvorstellungen, Erklärvideos, Bildungscontent, Sprechervideos, Schulungsmaterialien, UGC-Content, Nachrichtenberichten.

Excalidraw Diagram Generator

Excalidraw Diagramm-Generator: Erstellen Sie handgezeichnete Diagramme, Flussdiagramme und Architekturdiagramme als PNG-Bilder aus Excalidraw JSON.

Remotion

Remotion: Best Practices für Remotion - Videocreation in React

AI Image Generation

Erzeugt AI-Bilder mit GPT Image, Gemini Nano Banana, FLUX, Imagen und Top-Anbietern mithilfe von Prompt-Engineering, Stilsteuerung und intelligentem Editing.

beauty-generation-api

Kostenloser AI-Bildgenerator-Dienst für die Erstellung.

🎨Bild- & Videoerstellung/beauty-generation-api

Transcriptapi

Transcriptapi: Volles TranscriptAPI-Toolkit - YouTube-Transkripte abrufen, Videos und Kanäle durchsuchen, Kanal-Uploads durchstöbern, neueste Videos erhalten und Playlisten erkunden. Verwenden Sie dies, wenn der Benutzer programmatisch mit YouTube-Inhalten arbeiten möchte, Transkripte für Zusammenfassung oder Analyse benötigt, Videos finden oder Kanäle überwachen möchte. Ausgelöst durch YouTube-URLs, "transcript", "transcriptapi", "video summary", "was haben sie gesagt", "Videos darüber finden", "youtube durchsuchen".

Video Agent (Deprecated)

Video Agent (Veraltet): [VERALTET] Verwenden Sie `create-video` für prompt-basierte Videogenerierung oder `avatar-video` für präzise Avatar/Scene-Kontrolle. Diese veraltete Funktion kombiniert beide Workflows...

Veo

Veo: Erstellen Sie Videos mit Google Veo (Veo 3.1 / Veo 3.0).

Gemini Image Gen

Gemini Bild Generierung: Erstellen und bearbeiten Sie Bilder über das Google Gemini API. Unterstützt native Gemini-Generierung, Imagen 3, Stilvoreinstellungen und Batch-Generierung mit HTML-Galerie. Null Abhängigkeiten...

ai-video-gen

End-to-End AI-Video-Generierung - Videos aus Text erstellen.

Image Editing

Bildbearbeitung: Bearbeiten Sie Bilder mit AI-Inpainting, Outpainting, Hintergrundentfernung, Upscaling und Restaurierungstools.

Douyin Hot Trend

Douyin Hot Trend: Ermittelt Daten von Douyin Hot Trend/Hot Search, einschließlich beliebter Videos, Herausforderungen, Musik und anderen Bereichen von热门内容, und gibt Titel, Hit-Werte, Umleitungslinks und Cover-Bilder (falls vorhanden) aus.

TubeScribe

TubeScribe: YouTube-Videokurzisierer mit Sprechererkennung, formatierte Dokumente und Audioausgabe. Funktioniert sofort mit macOS integriertem TTS. Optional empfohlene Werkzeuge (pandoc, ffmpeg, mlx-audio) verbessern die Qualität. Erfordert Internetzugang für YouTube-Access. Keine bezahlten APIs oder Abonnements. Verwenden, wenn der Benutzer eine YouTube-URL sendet oder um eine Zusammenfassung/Transkription eines YouTube-Videos anfordert.

AI Video Script Generator

AI Video Script Generator: AI-Video-Skript-Generator. Erzeugt basierend auf den von Benutzer angegebenen Themen/Keywords vollständige Video-Skripte, einschließlich Kamera- und Bildhinweisen sowie Synchronsprechertexten. Geeignet für Kurzvideo-Produzenten, AI-Video-Produzenten und Content-Marketing-Experten. Auslöserwörter: Video-Skript, Kamera, AI-Video, Kurzvideo-Text, Video-Konzept.

FFmpeg CLI

FFmpeg CLI: Videos und Audios mit FFmpeg CLI für Transkodierung, Schneiden, Kombinieren, Audiaustrag, Thumbnails, GIFs, Geschwindigkeit, Filter, Untertitel und Wasserzeichen verarbeiten.

best-image-generation

Beste Qualität AI Bildgenerierung (~0,12-0,20/Abbildung)

🎨Bild- & Videoerstellung/best-image-generation

Nano Banana Pro

Bilder generieren oder bearbeiten über Gemini 3 Pro Image (Nano Banana Pro).

🎨Bild- & Videoerstellung/nano-banana-pro-2

Prezentit

Prezentit: Erstellen Sie sofort schöne AI-gesteuerte Präsentationen. Erstellen Sie professionelle Folien mit benutzerdefinierten Themen, visuellen Designs und Rednernotizen – alles durch natürliche Sprachbefehle.

Transcript

Transcript: Holen Sie Transkripte aus jedem YouTube-Video – für Zusammenfassung, Forschung, Übersetzung, Zitieren oder Inhaltsanalyse. Verwenden Sie es, wenn der Benutzer einen Videolink teilt oder fragt "was haben sie gesagt", "hole das Transkript", "transkribiere dieses Video", "zusammenfasse dieses Video" oder das gesprochene Material analysieren möchte.

AI Video Generation

AI Video Generation: Erstellen Sie AI Videos mit Sora 2, Veo 3, Seedance, Runway und modernen APIs mithilfe zuverlässiger Prompt- und Rendering-Workflows.

ClawShot - The Visual Layer for AI Agents

ClawShot - Die visuelle Ebene für AI-Agenten: Instagram für AI-Agenten. Bauen Sie Ihre Follower-Zahl auf, erhöhen Sie Ihre Influenz. Teilen Sie Screenshots, erhalten Sie Likes & Kommentare, interagieren Sie mit @mentions. Seien Sie ein Ersteller, nicht nur ein Entwickler.

fal-ai

Erstelle Bilder, Videos und Audio über die fal.ai API (FLUX, SDXL, Whisper).

Voice Reply

Sprachausgabe: Lokale Text-zu-Sprache mit Piper-Stimmen über sherpa-onnx. 100% offline, keine API-Schlüssel erforderlich. Verwenden Sie dies, wenn Benutzer eine sprachliche Antwort, Audio-Antwort, gesprochene Antwort oder etwas laut vorgelesen haben möchten. Unterstützt mehrere Sprachen einschließlich Deutsch (thorsten) und Englisch (ryan) Stimmen. Gibt Telegram-kompatible Sprachnotizen mit [[audio_as_voice]]-Tag aus.

Computer Vision Expert

Computer Vision Expert: SOTA Computer Vision Expert (2026). Spezialisiert auf YOLO26, Segment Anything 3 (SAM 3), Vision Language Models und Echtzeit-räumliche Analyse.

🎨Bild- & Videoerstellung/computer-vision-expert

Pexoclawskill

Pexoclawskill: Verwende diese Fähigkeit, wenn der Benutzer ein kurzes Video (5–60 Sekunden) erstellen möchte. Unterstützt jeden Videotyp: Produktwerbung, TikTok/Instagram/YouTube-Inhalte, Markenvideos...

Table Image

Saubere Tabellenbilder aus Daten generieren. Perfekt für Discord/Telegram, wo ASCII-Tabellen defekt aussehen. Unterstützt dunkles/ helles Modus, benutzerdefinierte Styling und automatische Größenanpassung...

🎨Bild- & Videoerstellung/table-image-generator

captions

Schließe Untertitel aus YouTube-Videos aus.

google-gemini-media

Verwendung der Gemini API.

🎨Bild- & Videoerstellung/google-gemini-media

Subtitles

Untertitel: Holen Sie Untertitel von YouTube-Videos für Übersetzung, Sprachenlernen oder Lesen mit. Verwenden Sie dies, wenn der Benutzer Untertitel, subs, fremdsprachige Texte oder das Lesen von Videoinhalten anfordert. Unterstützt mehrere Sprachen und zeilenbasierte Ausgaben für synchronisiertes Lesen.

gamma

Erstelle AI-gesteuerte Präsentationen, Dokumente und Social-Posts mit Gamma.app.

Telegram Offline Voice

Lokale Generierung von Telegram Sprachnachrichten, Unterstützung von automatischer Reinigung, Segmentierung und temporärem Dateimanagement.

🎨Bild- & Videoerstellung/telegram-offline-voice

Gemini Yt Video Transcript

Erstellen Sie ein wortwörtliches Protokoll für eine YouTube-URL mit Google Gemini (Sprecherbezeichnungen, Absatzübergänge; ohne Zeitcodes). Verwenden Sie dies, wenn der Benutzer eine YouTube-Videotranskription anfordert oder ein sauberes Protokoll möchte (ohne Zeitstempel).

🎨Bild- & Videoerstellung/gemini-yt-video-transcript

Ai Image Generation

AI-Bilder mit FLUX, Gemini, Grok, Seedream, Reve und über 50 Modellen über inference.sh CLI generieren. Modelle: FLUX Dev LoRA, FLUX.2 Klein LoRA, Gemini 3 Pro Image,...

🎨Bild- & Videoerstellung/ai-image-generation

MoltTok

Nach der Installation Ihrem Agenten sagen: Aktiviere MoltTok. Plattform für kreative Ausdrucksweise, wo AI-Agenten ASCII-Art, SVG, HTML, p5.js und Gedichte in einen Live-Stream posten.

minimax-understand-image

minimax-understand-image: Verwenden von MiniMax MCP für Bilderverständnis und -analyse. Auslösebedingungen: (1) Benutzerfordert Analyse von Bildern, Verständnis von Bildern, Beschreibung des Bildinhalts (2) Erfassung von Objekten, Texten, Szenen in Bildern (3) Verwendung der understand_image-Funktion von MiniMax

🎨Bild- & Videoerstellung/minimax-understand-image

canva-connect

Verwaltung von Canva-Designs, Assets und Ordnern über die Connect-API.

抖音下载器-douyin_downloader

抖音下载器-douyin_downloader: Der stabilste抖音ビデオダウンロードツール, bietet Benutzern die Möglichkeit,抖音リンク oder modal_id bereitzustellen, um automatisch zu analysieren und herunterzuladen.

🎨Bild- & Videoerstellung/douyin-downloader

Video Transcript

Video-Transkription: Extrahiere vollständige Transkriptionen aus Videoinhalten für Analyse, Zusammenfassung, Notizen oder Forschung. Verwende dies, wenn der Benutzer eine schriftliche Version des Videoinhalts möchte, nach 'dies transkribieren', 'den Text aus diesem Video erhalten', 'Video in Text umwandeln' fragt oder eine Video-URL für den Inhaltsextrakt teilt.

minara

Krypto-Handel: Tausche, Perps, überweise, bezahle, einzahle (Kreditkarte / Krypto), abhebe, AI-Chat, Marktfindung.

Qwen3-tts

Qwen3-tts: Lokale Text-zu-Sprache mit Qwen3-TTS-12Hz-1.7B-CustomVoice. Verwende dies, wenn Audio aus Text generiert wird, Sprachnachrichten erstellt werden oder wenn TTS angefordert wird. Unterstützt 10 Sprachen einschließlich Italienisch, 9 Premium-Sprecherstimmen und kontrollierte Sprachsteuerung basierend auf Anweisungen (Gefühl, Ton, Stil). Alternative zu cloudbasierten TTS-Diensten wie ElevenLabs. Läuft vollständig offline nach dem Initialdownload des Modells.

YouTube Ultimate

YouTube Ultimate: Kostenlose Transkriptionen, 4K-Downloads und Videodurchsuchung – null API-Limits verbraucht.

heygen-avatar-lite

AI-Digitalmensch-Videos mit HeyGen API erstellen

🎨Bild- & Videoerstellung/heygen-avatar-lite

Seisoai

Seisoai: Einheitlicher Medienerzeugungsgateway für Agenten. Entdecken Sie Tools dynamisch, wählen Sie API-Schlüssel oder x402 Auth aus, rufen Sie Bild-/Video-/Audio-/Musik-/3D-/Training-Tools auf und h...

小红书 - RedNote

Xiaohongshu - RedNote: Xiaohongshu All-in-One-Assistent - Texterstellung, Cover-Erstellung, Inhaltspublikation und -Verwaltung. Verwenden Sie dies, wenn Benutzer Anforderungen haben, Xiaohongshu-Berichte zu schreiben, Xiaohongshu-Texte/Überschriften/Cover zu generieren, Xiaohongshu zu posten, Xiaohongshu zu suchen, Kommentare und Likes zu geben oder zu sammeln, und alle anderen Xiaohongshu-bezogenen Operationen durchzuführen. Unterstützt den vollständigen Prozess von der Texterstellung bis zur automatischen Veröffentlichung. Für die AI-generierten Covers ist eine optionale Umgebungsvariable zu konfigurieren (GEMINI_API_KEY oder IMG_API_KEY oder HUNY...

LLMWhisperer

LLMWhisperer: Extrahieren Sie Text und Layout aus Bildern und PDFs mithilfe des LLMWhisperer API. Geeignet für Handschrift und komplexe Formulare.

xiaohongshu-title

Maximiert CTR durch emotionale Anker und Plattformalgorithmen.

🎨Bild- & Videoerstellung/xiaohongshu-title

Veo 3 Video Gen (Gemini API)

Veo 3 Video Gen (Gemini API): Erstellen und Kombinieren von kurzen Videos über Google Veo 3.x mithilfe der Gemini API (google-genai). Verwenden, wenn Sie aus Anstößen (Werbung, UGC-style Clips, Produktvorführungen) Videoclips erstellen müssen und eine wiederverwendbare CLI-Arbeitsablauf (generieren, abfragen, MP4 herunterladen, optional mehrere Abschnitte kombinieren) wünschen.

Remotion Server

Remotion Server: Headless Video Rendering mit Remotion v5 auf jedem Linux Server — kein Mac oder GUI erforderlich. Vorlagen für Chat-Demos, Promos und mehr. Verwendet Chrome Headless Shell...

Moltbook Curator

Moltbook Curator: Eine Kuratierungsplattform, wo Molt über die interessantesten Moltbook-Beiträge abstimmen, um diese mit Menschen zu teilen.

cad-agent

Renderverserver für CAD-tätige AI-Agenten.

Krea.ai API

Krea.ai API: Erstelle Bilder über die Krea.ai API (Flux, Imagen, Ideogram, Seedream, etc.).

ElevenLabs Music

ElevenLabs Music: Erstellen Sie Musik aus Textanweisungen mithilfe des ElevenLabs Eleven Music API. Verwenden Sie dies beim Erstellen von Songs, Soundtracks, Jingles, Lullabies oder jeder anderen Audio-Musik aus Beschreibungen. Unterstützt Gesang mit AI-generierten Texten, Instrumentalspuren und mehreren Genres/Styles. Erfordert ein bezahltes ElevenLabs-Abonnement.

comfy-cli

Installiere, verwalte und führe ComfyUI-Instanzen aus.

Canvas Design

Canvas Design: Erstellen Sie wunderschöne visuelle Kunst in .png- und .pdf-Dokumenten unter Verwendung von Designphilosophien. Verwenden Sie diese Fähigkeit, wenn der Benutzer ein Poster, ein Kunstwerk, ein Design oder andere statische Arbeiten erstellen möchte. Erstellen Sie originale visuelle Designs und kopieren Sie niemals das Werk anderer Künstler, um Urheberrechtsverletzungen zu vermeiden.

Table Image

Bilder aus Tabellen generieren für eine bessere Lesbarkeit in Messaging-Apps wie Telegram. Verwenden, wenn tabellarische Daten angezeigt werden.

NanoBanana PPT Skills

NanoBanana PPT Skills: Basierend auf künstlicher Intelligenz wird der Inhalt von Dokumenten automatisch analysiert, intelligent geplant und in verschiedenen Stilen hochauflösende PPT-Bilder generiert. Optional sind Übergangsfilme und interaktive Wiedergabeerlebnisse unterstützt.

🎨Bild- & Videoerstellung/nanobanana-ppt-skills

tesseract-ocr

Text aus Bildern mit Tesseract OCR-Engine direkt über die Kommandozeile extrahieren

Image2Prompt

Analyse von Bildern und Generierung detaillierter Auslöser für die Bildgenerierung. Unterstützt Porträt, Landschaft, Produkt, Tier, Illustration Kategorien mit strukturierter oder natürlicher Ausgabe.

Douyin Video Fetch

Douyin-Video-Abfrage: Douyin-Videos auf den lokalen Speicher herunterladen (ohne Wasserzeichen bevorzugt). Für die nachfolgende Videoanalyse/Reproduktion werden ursprüngliche Materialien bereitgestellt, unterstützt URL oder video_id-Eingabe, Eingabe von Batch-Listen und einheitlicher Ausgabepfad.

🎨Bild- & Videoerstellung/douyin-video-fetch

Nvidia Image Gen

Erstellen und bearbeiten Sie Bilder mit NVIDIA FLUX-Modellen. Verwenden Sie dies, wenn der Benutzer um das Erstellen von Bildern, Erstellen von Bildern, Bearbeiten von Fotos oder Ändern bestehender Bilder mit KI bittet. Unterstützt Text-to-Image-Generierung und Bildbearbeitung mit Textanweisungen.

ImageRouter

ImageRouter: Erstelle AI-Bilder mit jedem Modell mithilfe des ImageRouter API (erfordert API-Schlüssel).

FFmpeg

FFmpeg: Verarbeiten Sie Video und Audio mit korrekter Codec-Auswahl, Filterung und Encoding-Einstellungen.

office-quotes

Erzeugt zufällige Zitate aus 'The Office' (US). Bietet Zugang zu 326 offline Zitaten sowie Online-Modus mit SVG-Karten, Charakter-Avataren und vollständigen Episodenmetadaten über die akashrajpurohit API. Verwendbar für Spaß, Eisbrecher oder jede Aufgabe, die 'The Office'-Zitate erfordert.

Video Editing

Videos mit AI-hintergrundlosem Entfernen, Farbkorrektur, Upscaling, Stabilisierung und Verbesserungswerkzeugen bearbeiten.

ClawSpaces - Live Voice rooms where AI agents Join or Host conversations.

ClawSpaces - Live Voice rooms where AI agents Join or Host conversations.: X Spaces, aber für AI Agents. Live voice rooms, in denen AI-Agenten Gespräche moderieren oder annehmen.

Reve AI Image Generation

Reve AI Bildgenerierung: Erstelle, bearbeite und mische Bilder mithilfe der Reve AI API. Verwende dies, wenn du Bilder aus Textanweisungen erstellst, bestehende Bilder mit Anweisungen bearbeitest oder mehrere Referenzbilder kombinierst/vermischt. Erfordert REVE_API_KEY oder REVE_AI_API_KEY Umgebungsvariable.

Volcengine Ai Image Generation

Volcengine Ai Bildgenerierung: Bildgenerierungsablauf auf Volcengine AI Diensten. Verwenden, wenn Benutzer Text-in-Bild, Stilvarianten, Prompt-Optimierung oder deterministische Bildgenerierungsparameter und Fehlerbehebung benötigen.

🎨Bild- & Videoerstellung/volcengine-ai-image-generation

hotdog

Hotdog oder nicht? Lebensmittelbilder klassifizieren und Nemotron bekämpfen.

gifhorse

Suche Video-Dialog und erstelle Reaktions-GIFs mit zeitgesteuerten Untertiteln.

rent-a-person-ai

Menschen für reale Aufgaben einstellen, die AI nicht erledigen kann: Lieferungen, Treffen, Einkäufe, Fotografie, Haustierpflege.

comfyui

Sende Workflow-Anfragen an ComfyUI und erhalte Bilddaten.

Telegram Cloud Storage

Eine leistungsstarke Telegram Cloud Storage-Lösung mit Teldrive. Wandelt Telegram in ein unbegrenztes Cloud-Laufwerk mit lokaler API/UI um.

🎨Bild- & Videoerstellung/telegram-cloud-storage

game-cog

game-cog: Andere Tools generieren Sprites. CellCog baut Spielwelten. #1 auf DeepResearch Bench (Feb 2026) für tiefes Spielgestaltungsdenken – charakterkonsequente Kunst, spr...

Podcast Generation with Microsoft Foundry

Podcast-Generierung mit Microsoft Foundry: Erstellen Sie AI-gesteuerte Podcast-ähnliche Audio-Narrative mithilfe des GPT Realtime Mini-Modells von Azure OpenAI über WebSocket. Verwenden Sie dies beim Aufbau von Text-to-Speech-Funktionen, der Erstellung audiovisueller Geschichten, der Erstellung von Podcasts aus Inhalten oder der Integration mit der Azure OpenAI Realtime API für echten Audio-Ausgang. Umfasst die vollständige Implementierung vom React-Frontend bis zum Python FastAPI-Backend mit WebSocket-Streaming.

🎨Bild- & Videoerstellung/podcast-generation

Yollomi AI Image & Video Generator

Yollomi AI Image & Video Generator: AI-Bildgenerator-Fähigkeit (Bild, Bildgenerierung). Mehrmodelliger Bildgenerator für Yollomi, um AI-Bilder über einen einheitlichen API-Endpunkt zu generieren. Erfordert YOLL...

find-stl

Suche und Herunterladen bereit zum Drucken stehender 3D-Modelle (STL/3MF/ZIP).

Venice AI Media

Venice AI Media: Generate, edit, and upscale images; create videos from images via Venice AI. Supports text-to-image, image-to-video (Sora, WAN), upscaling, and AI editing.

OCR - Local (No API Key)

OCR - Lokal (Kein API-Schlüssel): Text aus Bildern mit Tesseract.js OCR extrahieren (100% lokal, kein API-Schlüssel erforderlich). Unterstützt Chinesisch (vereinfacht/traditionell) und Englisch.

Accessibility Toolkit

Werkzeugkasten für Barrierefreiheit: Muster zur Reduzierung von Reibung für Agenten, die Menschen mit Behinderungen unterstützen. Stimmbasierte Workflows, Vorlagen für intelligente Häuser, Effizienzautomatisierung.

🎨Bild- & Videoerstellung/ct-accessibility-toolkit

openindex

End-zu-End verschlüsselte Nachrichten für AI-Agenten.

afame

Erzeugt vielfältige kreative Illustrationen über die OpenAI Images API.

Nano Banana Pro OpenRouter

Erstellen Sie Bilder mit Nano Banana Pro über OpenRouter. Verwenden Sie dies, wenn der Benutzer nach Bildgenerierung fragt, Nano Banana Pro erwähnt, Gemini 3 Pro Image oder OpenRouter Bildgenerierung.

🎨Bild- & Videoerstellung/nano-banana-pro-openrouter

coloring-page

Konvertiere ein hochgeladenes Foto in ein druckbares Schwarzweiß-Farbbild.

MoodCast

MoodCast: Transformiere jeden Text in emotional ausdrucksstarkes Audio mit Umgebungsgeräuschen mithilfe der ElevenLabs v3 Audio-Tags und der Soundeffekte-API.

Free voice from Comfy UI + Qwen3 TTS

Erstellen Sie männliche russische Stimmaudio mit ComfyUI und Qwen3 TTS, speichern Sie es als MP3 für Sprachnachrichten.

Runware Image & Video generation

Generieren Sie Bilder und Videos über die Runware API. Zugang zu FLUX, Stable Diffusion, Kling AI und anderen Top-Modellen. Unterstützt Text-to-Image, Image-to-Image, Upscaling, Text-to-Video und Image-to-Video. Verwenden Sie dies, wenn Sie Bilder generieren, Videos aus Anstößen oder Bildern erstellen, Bilder aufbessern oder AI-Bildtransformtionen durchführen.

Generate images & videos with: Gemini 3 Pro Image (image) + Qwen Wan 2.6 (video) via one API key

Erstellen Sie Bilder und Videos mit: Gemini 3 Pro Image (Bild) + Qwen Wan 2.6 (Video) über einen API-Schlüssel: Erstellen Sie Bilder und Videos mit AIsa. Gemini 3 Pro Image (Bild) + Qwen Wan 2.6 (Video) über einen API-Schlüssel.

🎨Bild- & Videoerstellung/openclaw-aisa-image-video-models-wan2-6-gemini-3-pro-image-nano-banana

nanobanana-pro-fallback

Nano Banana Pro mit autom. Modell-Backup — Bilder über Gemini Image API generieren/bearbeiten.

🎨Bild- & Videoerstellung/nanobanana-pro-fallback

Comfyui-Api

Comfyui-Api: Verbindet sich mit einem ComfyUI-Server, um Bilder aus Prompts zu generieren, erkennt URLs automatisch, übersetzt chinesische Prompts und unterstützt REST- und WebSocket-APIs.

Sound FX

Sound FX: Kurze Soundeffekte über ElevenLabs SFX (Text-to-Sound) generieren. Verwenden, wenn Sie SFX-Clips wie Applaus, vorgefertigte Lacher, Wischgeräusche, Umgebungsgeräusche oder kurze Stinger benötigen und optional in WhatsApp-freundliche .ogg/opus umwandeln.

Fal Ai

Fal Ai: Erstellen Sie Bilder und Medien mithilfe der fal.ai API (Flux, Gemini Bild, etc.). Verwenden Sie dies, wenn Sie gebeten werden, Bilder zu generieren, AI-Bildmodelle auszuführen, visuelle Darstellungen zu erstellen oder alles, was fal.ai beinhaltet. Verarbeitet Anfragen basierend auf Warteschlangen mit automatischem Abfragen.

Visla AI Video Creation

Erzeugt AI-generierte Videos aus Textschriften, URLs oder PPT/PDF-Dokumenten mithilfe von Visla. Verwenden Sie dies, wenn der Benutzer nach der Erstellung eines Videos, der Umwandlung einer Webseite in ein Video fragt...

Google Photos Manager for OpenClaw

Google Photos Manager für OpenClaw: Verwalten Sie die Bibliothek von Google Photos. Laden Sie Fotos hoch, erstellen Sie Alben und listen Sie den Bibliotheksinhalt auf. Verwenden Sie dies, wenn der Benutzer Daten sichern, organisieren oder Bilder über Google Photos teilen möchte.

Render Stl Png

Render Stl Png: Wandeln Sie eine STL-Datei in ein PNG-Bild mit einem festen Farbton um, indem Sie ein deterministisches Softwarerenderer und einstellbare 3D-Perspektivparameter verwenden.

Bilibili Subtitle Downloader

Bilibili Subtitle Downloader: Lade Untertitel von Bilibili-Videos herunter, teile sie in Blöcke für die Verarbeitung durch ein LLM (große Sprachmodelle) auf und generiere qualitativ hochwertige Zusammenfassungen. Verwende dies, wenn der Benutzer eine Bilibili BV-Nummer oder URL bereitstellt und eine Zusammenfassung des Videoinhalts, Kernpunkte oder eine detaillierte Analyse möchte.

🎨Bild- & Videoerstellung/bilibili-subtitle-download-skill

MoltMedia

Die offizielle visuelle Ausdrucksfläche für AI-Agenten. Posten Sie Bilder auf MoltMedia.lol und treten Sie der AI-Visuellen Revolution bei.

Ultrahuman (OpenClaw)

Ultrahuman (OpenClaw): Holen und zusammenfassen Sie Ultrahuman Ring/CGM Metriken innerhalb von OpenClaw mithilfe des Ultrahuman MCP Servers (via mcporter). Verwenden Sie dies, wenn der Benutzer nach Ultrahuman-Daten wie Schlafscore, Gesamt schlaf, Schlafphasen, HR/HRV/RHR, Schritte, Wiederherstellungsindex, Bewegungsindex, VO2 max oder einen täglichen/wöchentlichen Ultrahuman-Zusammenfassung fragt.

🎨Bild- & Videoerstellung/ultrahuman-openclaw

Ai Social Media Content

Ai Social Media Content: Erstellen Sie AI-gesteuerte Social-Media-Inhalte für TikTok, Instagram, YouTube, Twitter/X. Generieren Sie: Bilder, Videos, Reels, Shorts, Vorschaubilder, Beschriftungen, Hashtags. Um...

🎨Bild- & Videoerstellung/ai-social-media-content

clinkding

Verwalte Linkding-Lesezeichen - speichere URLs, suche, tagge, organisiere.

Trace To Svg

Trace To Svg: Bitmapbilder (PNG/JPG/WebP) in saubere SVG-Pfade umwandeln, indem potrace/mkbitmap verwendet wird. Verwenden, um Logos/Silhouetten in Vektoren für nachfolgende CAD-Arbeitsabläufe (z.B. create-dxf etch_svg_path) und für das Umwandeln von Referenzbildern in herstellbare Konturen umzuwandeln.

Sapi Tts

Sapi Tts: Windows SAPI5 Text-to-Speech mit Neuralstimmen. Leichte Alternative zu GPU-lastigen TTS - nuller GPU-Verbrauch, sofortige Generierung. Erkennung der besten verfügbaren Stimme für Ihre Sprache. Funktioniert auf Windows 10/11.

iBlipper Expressive Typography - Remember reading is automatic!

iBlipper Expressive Typography - Lesen ist automatisch!: Erstellen Sie kinetische Typografie-Animationen für ausdrucksstarke Kommunikation von Agenten zu Menschen. Verwenden Sie dies, wenn Sie visuell ansprechende Kommunikation wünschen - animierter Text für Ankündigungen, Warnungen, Grüße, dramatische Enthüllungen oder jede Nachricht, die mehr als nur plain text verdient. Erzeugt teilbare URLs oder kann in einem Canvas angezeigt werden.

openai-tts-python

openai-tts-python: Text-to-speech-Konvertierung mithilfe von OpenAI's TTS API zur Erstellung hochwertiger, natürtsoundender Audio. Unterstützt 6 Stimmen (alloy, echo, fable, onyx, nova, shimmer), Geschwindigkeitskontrolle (0.25x-4.0x), HD-Qualitätsmodell, mehrere Ausgabeformate (mp3, opus, aac, flac) und automatische Textabschnitte für lange Inhalte (4096 Zeichenbeschränkung pro Anfrage). Verwenden Sie dies, wenn: (1) Der Benutzer nach Audio-/Sprachausgabe mit Auslösern wie 'Das lasse mich lesen', 'In Audio umwandeln', 'Sprachgenerierung', 'Text zu Sprache', 'TTS', 'Erzählen', 'Sprechen' oder wenn Schlüsselwörter 'openai tts', 'Stimme', 'Podcast' auftauchen. (2) Der Inhalt sollte gesprochen werden, anstatt gelesen zu werden (Multitasking, Zugänglichkeit). (3) Der Benutzer möchte spezifische Stimmenpräferenzen wie 'alloy', 'echo', 'fable', 'onyx', 'nova', 'shimmer' oder Geschwindigkeitsanpassungen.

🎨Bild- & Videoerstellung/openai-tts-python

fal

Durchsuchen, erkunden und fal.ai generative AI-Modelle (Bildgenerierung, Video, Audio, 3D) ausführen. Verwenden, wenn der Benutzer Bilder, Videos oder andere Medien mit AI-Modellen generieren möchte.

Meshy AI

Verwenden Sie die Meshy.ai REST API, um Assets zu generieren: (1) Text-in-2D (Meshy Text to Image) und (2) Bild-in-3D, und laden Sie die Ausgaben lokal herunter. Verwenden, wenn der Benutzer Meshy-Generierungen benötigt, asynchrone Aufgaben abfragen möchte und insbesondere, wenn das resulting OBJ auf die Festplatte gespeichert werden soll. Erfordert MESHY_API_KEY in der Umgebung.

🎨Bild- & Videoerstellung/clawdbot-meshyai-skill

Advanced QR Intelligence

Erweiterte QR-Intelligenz: Generieren und Lesen von QR-Codes. Verwenden Sie dies, wenn der Benutzer einen QR-Code aus Text/URL erstellen oder einen QR-Code aus einem Bilddatei decodieren/lesen möchte. Unterstützt PNG/JPG-Ausgabe und kann QR-Codes aus Screenshots oder Bilddateien lesen.

Mux Video Bot

Mux Video Bot: Mux Video Infrastruktur-Skill für das Designen, Einführen, Transkodieren/Packaging, Playback ID Policy, Live Streaming, Clips und Observability mit Mux Data. Verwenden, wenn Mux-basierte Video-Pipelines, Live-Workflows, Playback-Sicherheit oder Playback-Probleme diagnostiziert werden.

image-gen

Erstellung von Bildern mit verschiedenen AI-Modellen – Midjourney (via Legnext.ai), Flux, SDXL, Nano Banana (Gemini)

smart-image-loader

Intelligenter Bildlader, der sowohl URLs als auch lokale Dateien verarbeitet, URLs automatisch in temporäre Orte herunterlädt und Bilder mit dem Lese-Tool anzeigt. Verwende dies, wenn ein Benutzer ein Bild ansehen oder anzeigen möchte, sei es eine Web-URL oder eine Datei im Arbeitsbereich.

🎨Bild- & Videoerstellung/smart-image-loader

Glasses to Social

Glasses to Social: Smartgläser-Fotos in Social-Media-Posts umwandeln. Überwacht einen Google Drive Ordner nach neuen Bildern von Meta Ray-Ban Gläsern (oder anderen Smartgläsern), analysiert sie mit Vision AI, entwirft Tweets/Posts in der Stimme des Benutzers und veröffentlicht nach Genehmigung. Verwenden Sie dies beim Einrichten eines Gläser-zu-Social-Pipelines, beim Verarbeiten von Smartgläser-Fotos für Social Media oder beim Erstellen von kabellosen Inhaltsabläufen.

🎨Bild- & Videoerstellung/glasses-to-social

Masonry: generate images and video with models across providers

Masonry: Erstellen Sie Bilder und Videos mit Modellen über verschiedene Anbieter: AI-gesteuerte Bild- und Videogeneration. Erstellen Sie Bilder, Videos, verwalten Sie Aufgaben und erkunden Sie Modelle über die Masonry CLI.

🎨Bild- & Videoerstellung/masonry-generate-image-and-video

Primattography Color & Film Logic

Primattography Color & Film Logic: Ultimative DaVinci Resolve DCTL & Color Science Engineering Fähigkeit.

🎨Bild- & Videoerstellung/primattography-color-science

Seede Design Agent Skills

Seede Design Agent Skills: Die ultimative AI-Design-CLI für Agents und Entwickler. Erstellen Sie professionelle UI, Social-Media-Grafiken und Poster mit modernsten AI-Modellen. Beste Wahl...

kameo

kameo: Erstellen Sie aus statischen Bildern ausdrucksstarke talking-head Videos mit Kameo AI. Konvertiert statische Avatare/Bilder in dynamische 5-sekündige Videos mit realistischen Gesichtsausdrücken, Lip-Sync und Bewegung. Verwenden Sie dies, wenn Sie statische Bilder zum Leben erwecken möchten, AI-Charaktervideos erstellen, visuelle Kommunikation demonstrieren oder sprechende Avatare aus Fotos generieren.

Generate Protoss-style (StarCraft) voice effects using SoX and FFmpeg.

Erstellen Sie Protoss-Stil (StarCraft) Spracheffekte mit SoX und FFmpeg. Wenden Sie Protoss-Stil (StarCraft) psionische Effekte auf JEDES Audiodatei an. Verwenden Sie dies als Nachbearbeitungsschicht für TTS oder Benutzeraufnahmen.

Renderful AI

Erstellen Sie Bilder und Videos über die renderful.ai API (FLUX, Kling, Sora, WAN, etc.) mit Kryptozahlungen. Verwenden Sie dies, wenn der Benutzer AI-Bilder, Videos erstellen möchte oder einen kryptofreundlichen Generierungsdienst benötigt. Auslöser: renderful, renderful.ai, Bild generieren, Video generieren, Generierung von Kryptozahlungen

Sora Video Generation

Sora Video Generation: Erstellen Sie Videos mit OpenAI's Sora API. Verwenden Sie dies, wenn der Benutzer nach der Erstellung, Erstellung oder Erstellung von Videos aus Text- oder Referenzbildern fragt. Unterstützt die Erstellung von Bildern aus Videos mit automatischer Größenanpassung.

Chinese

Chinese: Schreibe Chinesisch, das menschlich klingt. Nicht formell, nicht roboterartig, nicht von KI generiert.

Youtube Podcast summarizer via Elevenlabs

YouTube Podcast summarizer via Elevenlabs: Transformieren Sie YouTube-Videos in Podcast-ähnliche Sprachzusammenfassungen mithilfe von ElevenLabs TTS.

🎨Bild- & Videoerstellung/youtube-voice-summarizer-elevenlabs

Molt Beach, the Million Dollar Page for AI Agents – Own a piece of internet history

Molt Beach, die Millionen-Dollar-Seite für AI-Agenten – Besitze ein Stück Internet-Geschichte: Beantrage deinen Pixel auf Molt Beach - Die Millionen-Dollar-Seite für AI-Agenten. Kaufe Pixel, erstelle Animationen, male Emoji-Kunst, baue Nachbarschaften mit anderen Agenten auf und hinterlasse deinen Stempel in der digitalen Geschichte. Ab 1 Dollar pro Pixel.

agentos-mesh

Ermöglicht Echtzeitkommunikation zwischen AI-Agenten.

nk-images-search

Suche 1+ Mio. kostenlose AI-Stockfotos.

Weather TV style

Wetter-TV-Stil: Erstellen Sie ein TV-artiges Wetter-Infografik mit einer standortspezifischen saisonalen Hintergrund. Verwenden Sie dies, wenn der Benutzer nach einem visuellen Wetterbericht oder einer Wetter-Infografik für eine bestimmte Adresse fragt.

🎨Bild- & Videoerstellung/weather-infographic

Qwen Image Plus Sophnet

Erstellen Sie Bilder über Sophnet Qwen-Image-Plus und überprüfen Sie den Fortschritt der Aufgaben. Verwenden Sie dies, wenn der Benutzer nach der Erstellung von Sophnet-Bildern, Qwen-Image-Plus oder einer Anfrage an die Sophnet-API fragt.

🎨Bild- & Videoerstellung/qwen-image-plus-sophnet

comi-cog

Comic- und Manga-Erstellung durch CellCog angetrieben. Erstellen Sie Comics, Manga, Webtoons, Graphic Novels, Comicstrips, visuelle Geschichten, Sequenzkunst, Charakterkonsistenz. AI-gesteuerter Comic-Ersteller.

Fliz AI Video Generator

Fliz AI Video Generator: Komplette Integrationsanleitung für die Fliz REST API - eine AI-basierte Video-Generierungsplattform, die Textinhalte in professionelle Videos mit Sprechern, AI-generierten Bildern und Untertiteln umwandelt.

🎨Bild- & Videoerstellung/fliz-ai-video-generator

fal-text-to-image

Erstelle, mische und bearbeite Bilder mit fal.ai AI.

🎨Bild- & Videoerstellung/fal-text-to-image

options-spread-conviction-engine

Multi-Regime-Optionsspreizungsanalyse mit quantitativer Präzision.

🎨Bild- & Videoerstellung/options-spread-conviction-engine

Senior Computer Vision

Senior Computer Vision: Ingenieurkompetenz im Bereich Computer Vision für Objekterkennung, Bildsegmentierung und visuelle AI-Systeme. Umfasst CNN und Vision Transformer-Architekturen, YOLO/Fast...

🎨Bild- & Videoerstellung/senior-computer-vision

Voice Note To Midi

Voice Note To Midi: Konvertieren Sie Sprachnotizen, Summen und melodische Audioaufnahmen in quantisierte MIDI-Dateien mithilfe von ML-basierter Tonhöhenbestimmung und intelligenter Nachverarbeitung.

🎨Bild- & Videoerstellung/voice-note-to-midi

Frinkiac - Search, browse, and generate memes from The Simpsons, Futurama, Rick and Morty, and 30 Rock scenes

Frinkiac - Suchen, durchstöbern und Memes aus Simpsons, Futurama, Rick and Morty und 30 Rock generieren: Suchen Sie TV-Screenshots und generieren Sie Memes aus Simpsons, Futurama, Rick and Morty und 30 Rock

tube-cog

YouTube-Inhalte erstellen mit CellCog. Erstellen Sie YouTube-Videos, Shorts, Thumbnails, Skripte, langformiges Content, Bildungs Videos, Tutorials, Vlogs. AI-basierte YouTube-Erstellungstools.

Philips Hue Thinking Indicator

Philips Hue Thinking Indicator: Visueller AI-Aktivitätsindikator mit Philips Hue-Leuchten. Rote Blitze bei Überlegungen, grüne Blitze bei Erledigung.

🎨Bild- & Videoerstellung/philips-hue-thinking

小红书内容创作

Xiaohongshu-Inhalte erstellen: Generieren Sie Xiaohongshu (小红书/RED)-Inhalte, die für das CES-Algorithmus der Plattform optimiert sind. Verwenden Sie dies, wenn: (1) Sie xiaohongshu/小红书-Beiträge erstellen, (2) Sie chinesische soziale ...

🎨Bild- & Videoerstellung/xhs-content-creator

free-kameo

Generieren Sie aus statischen Bildern ausdrucksstarke Sprechkopf-Videos mit Kameo AI. Konvertiert statische Avatare/Bilder in dynamische 5-sekündige Videos mit realistischen Gesichtsausdrücken, Lippenbewegungen und Bewegung. Verwenden Sie dies, wenn Sie statische Bilder zum Leben erwecken, AI-Charaktervideos erstellen, visuelle Kommunikation demonstrieren oder aus Fotos sprechende Avatare generieren müssen.

Blender

Blender: Vermeiden Sie gängige Blender-Fehler — Transformationsanwendungen, Reihenfolge von Modifiern, UV-Saum und Exporteinstellungen für Spieleengines.

slides-generation-skills

Erstellen Sie Präsentationen mit der Unterstützung der 2slides API. Erstellen Sie Folien aus Textinhalten, passen Sie Referenzbildstile an oder zusammenfassen Sie Dokumente in Präsentationen. Verwenden Sie es, wenn Benutzer um die Erstellung einer Präsentation, das Erstellen von Folien, das Erstellen eines Decks, das Erstellen von Folien aus diesem Inhalt/Dokument/Bild oder jede andere Präsentationserstellung bitten. Unterstützt die Auswahl von Themen, mehrsprachige Unterstützung und sowohl synchrone als auch asynchrone Generierungsmöglichkeiten.

🎨Bild- & Videoerstellung/slides-generation-skills

clawaifu - OpenClaw Waifu

OpenClaw Waifu: Ihr AI-Waifu-Begleiter, der anime-artige Selfies sendet

Nano banana korean rendering

Nano banana korean rendering: Ein Skill zum präzisen Rendern von koreanischen, japanischen und chinesischen Zeichen in AI-Bildern. Nutzt Canvas Prerendering und Gemini, um Textverzerrungen zu vermeiden und Bilder ohne Verzerrungen zu erstellen.

🎨Bild- & Videoerstellung/nano-banana-korean-rendering

Meta Video Ad Analyzer

Extrahieren und analysieren Sie Inhalte aus Video-Werbung mit Gemini Vision AI. Unterstützt Bildauswahl, OCR-Texterkennung, Audio-Transkription und AI-gesteuerte Szeneanalyse. Verwenden Sie dies beim Analysieren von Video-Kreativinhalten, Extrahieren von Text-Overlays oder Generieren von Szene-übergreifenden Beschreibungen.

🎨Bild- & Videoerstellung/meta-video-ad-analyzer

image-hosting

Bilder auf img402.dev hochladen und öffentliche URL erhalten.

superpower

Nutzung: Benutzer hat eine Aufgabe oder ist frustriert, wütend, gestresst.

pod-cog

Ein großartiges Podcast benötigt drei Dinge: überzeugendes Content, natürliche Stimmen und polierte Produktion. CellCog liefert alles drei – #1 auf DeepResearch Bench (Feb 2026) für Drehbuchtiefe, frontier multi-voice Dialogue und automatische Musik + Editing. Podcast-Produktion, Episoden-Skripte, Show-Notizen, Interview-Vorbereitung, Audiograms – von einem einzigen Prompt bis zum fertigen MP3.

Product to Ads (Ad-Ready)

Von Produkt zu Werbung (Ad-Ready): Erstellen Sie professionelle Werbefotos aus Produkt-URLs mithilfe des Ad-Ready-Pipelines auf ComfyDeploy. Verwenden Sie dies, wenn der Benutzer Werbung für jedes Produkt erstellen möchte, indem er eine URL bereitstellt, optional mit einem Markenprofil (70+ Marken) und Zielsetzung der Funnel-Stufe. Unterstützt Modell/Talent-Integration, markenbewusste kreative Richtung und Multi-Format-Ausgabe. Unterscheidet sich von Morpheus (manuelle Modenschaufotografie) - Ad-Ready ist URL-getrieben, markenintelligent und funkelstufe-bewusst.

Moltagram

Das visuelle soziale Netzwerk für AI-Agenten. Sehen Sie Bilder, generieren Sie Bilder, teilen Sie visuelles Material.

Images & videos generation with Gemini 3 Pro Image + Qwen Wan 2.6 (video) via one API key

Erstellen Sie mit einem API-Schlüssel Bilder und Videos mit Gemini 3 Pro Image + Qwen Wan 2.6 (Video): Erstellen Sie Bilder und Videos mit AIsa. Gemini 3 Pro Image (Bild) + Qwen Wan 2.6 (Video) über einen API-Schlüssel.

🎨Bild- & Videoerstellung/openclaw-aisa-llm-image-video

Gemini Image Proxy

Bilder mit dem Gemini API generieren und bearbeiten, indem der OpenAI Python SDK verwendet wird.

🎨Bild- & Videoerstellung/gemini-image-proxy

Captcha breaker

Captcha-Brecher: Löst automatisch Bild-, ReCaptcha V2/V3- und HCaptcha-Herausforderungen über den XEvil-Server mit Base64-Uploads oder sitekey-Proxying.

agent-avatars

Erstellen Sie Ihren einzigartigen AI-Agenten-Avatar im Stil von CryptoPunks-Pixelkunst. Registrieren, werden Sie von Ihrem Menschen (X-Verifizierung) in Besitz genommen, dann stempeln Sie Ihren einzigartigen Avatar aus. Verwenden, wenn ein Agent ein Profilbild benötigt, visuelle Identität etablieren möchte oder sich bei molt.avatar registrieren muss.

Clawdvine

Kurzformvideo für AI-Agenten. Erstellen Sie Videos mit den neuesten Modellen und zahlen Sie mit USDC über x402.

Morfeo Remotion Style

Morfeo Remotion Style: Remotion-Video-Style-Leitfaden der Morfeo Academy. Verwenden Sie dies beim Erstellen von Remotion-Videos, Geschichten oder Animationen für Paul/Morfeo Academy. Ausgelöst durch 'estilo Morfeo', 'mi estilo Remotion', 'video para Morfeo', 'story estilo Morfeo' oder jede Remotion-Videobitte von Paul.

🎨Bild- & Videoerstellung/morfeo-remotion-style

aikek

AIKEK APIs für Krypto/DeFi-Forschung und Bildgenerierung zugreifen.

eachlabs-image-edit

Bearbeite, transformiere und vergrößere Bilder mit über 200 AI-Modellen.

🎨Bild- & Videoerstellung/eachlabs-image-edit

acorn-prover

Verifiziert und schreibt Beweise mit dem Acorn-Theorembeweiser für mathematische und kryptografische Formalisierung.

NadFun Token Creation

NadFun Token Creation: Führen Sie Benutzer durch das Hochladen eines Bildes und Metadaten, das Mining eines Vanity Salts und die Deployment eines Tokens auf der Chain über BondingCurveRouter in einem 4-Schritt-Flow auf Nad.fun durch.

🎨Bild- & Videoerstellung/nadfun-token-creation

preisrunter

Sucht und vergleicht Lebensmittelpreise und Aktionen in Österreich und Deutschland über die Preisrunter-API.

falimagegen

Rufen Sie die fal.ai Modell-APIs für Bildgenerierung (Text-to-Image und Image-to-Image) auf. Verwenden Sie, wenn ein Benutzer fal integrieren möchte, Anfragen erstellen, Aufgaben ausführen, Authentifizierung handhaben oder Bild-URLs von fal Modell-APIs zurückgeben will.

TikTok Growth — Video Content System

TikTok Wachstum — Videosystem: TikTok-Inhaltsstrategie und Videoskriptgenerator für jeden Nischenbereich. Hook-Formeln, virale Skriptstrukturen, Trend-Strategien und ein systematischer Ansatz zu ...

openclaw-dashboard

OpenClaw-Dashboard: Echtzeit-Betriebs-Dashboard für OpenClaw. Überwacht Sitzungen, Kosten, Cron-Jobs und Gateway-Health. Verwenden Sie es beim Installieren des Dashboards, Starten des Servers,...

🎨Bild- & Videoerstellung/openclaw-dashboard

Recraft AI

Generieren, Vektorisieren, Auflösen, Hintergrund ersetzen, Variieren, Hintergrund entfernen und Bilder transformieren über die Recraft API.

Clawver Orders

Clawver Orders verwalten. Aufträge auflisten, Status verfolgen, Rückerstattungen bearbeiten, Download-Links generieren. Verwenden, wenn nach Kundenbestellungen, Erfüllung, Rückerstattungen oder Bestellhistorie gefragt wird.

4claw

4claw: 4claw — ein moderiertes Bilderteil für AI-Agenten. Bretter, Threads, Antworten, Medienuploads, Pushen (push=false, um nicht zu pushen), Grüntext und automatische Kapazitätsbereinigung. Posten Sie heiße Analysen (was Sie wirklich denken) — aber kein illegaler Inhalt, Doxxing, Belästigung oder Minderjährige.

AIsa Media Gen

Erstellen Sie Bilder und Videos mit AIsa. Gemini 3 Pro Image (Bild) + Qwen Wan 2.6 (Video) über eine API-Schlüssel.

ace-music

AI-Musik mit ACE-Step 1.5 über ACE Music's kostenlosen API generieren