Речь и транскрипция
(71)Mcporter
Используйте mcporter CLI для списка, конфигурации, аутентификации и вызова MCP серверов/инструментов (HTTP или stdio), включая временные серверы, правки конфигурации и генерацию CLI/типов.
/mcporterOpenClaw YouTube Transcript
Транскрибация YouTube-видео в текст через URL с помощью yt-dlp без обработки аудио.
/openclaw-youtube-transcriptYouTube Transcript
Текстовый файл YouTube: Получите и суммируйте текстовые файлы видеороликов YouTube. Используйте при запросе на суммирование, транскрипцию или извлечение контента из видеороликов YouTube. Обрабатывает получение текстовых файлов через прокси IP для обхода блокировок IP в облаке YouTube.
/youtube-transcriptLocal Whisper
Локальный шепот: Локальная обработка речи в текст с использованием OpenAI Whisper. Работает полностью офлайн после загрузки модели. Высокое качество транскрипции с несколькими размерами моделей.
/local-whisperelevenlabs-voices
Высококачественная синтез речи с 18 персонажами, 32.
/elevenlabs-voicesfaster-whisper
локальная речь-в-текст с использованием faster-whisper
/faster-whisperelevenlabs-tts
TTS ElevenLabs - лучшая интеграция ElevenLabs для OpenClaw
/elevenlabs-ttsVoice Transcribe
Voice Transcribe: Транскрибация аудиофайлов с использованием модели gpt-4o-mini-transcribe от OpenAI с подсказками словаря и текстовыми заменами. Требует uv (https://docs.astral.sh/uv/).
/voice-transcribejarvis-voice
Металлический голосовой персонаж AI с ТТС и стилизацией визуального текста
/jarvis-voicekokoro-tts
Генерация голосового аудио из текста с использованием локального движка Kokoro TTS.
/kokoro-ttsElevenLabs Speech-to-Text
ElevenLabs Speech-to-Text: Транскрибируйте аудиофайлы с помощью ElevenLabs Speech-to-Text (Scribe v2).
/elevenlabs-sttMlx Whisper
Мlx Whisper: Локальная озвучка в текст с использованием MLX Whisper (оптимизирована для Apple Silicon, без ключа API).
/mlx-whisperTranscribe audio files via OpenRouter using audio-capable models
Транскрибация аудиофайлов через OpenRouter с использованием моделей с поддержкой аудио: Транскрибация аудиофайлов через OpenRouter с использованием моделей с поддержкой аудио (Gemini, GPT-4o-audio и т.д.).
/openrouter-transcribeGemini STT
Gemini STT: Transcribe audio files using Google's Gemini API or Vertex AI
/gemini-sttTts
Tts: Преобразуйте текст в речь с использованием API Hume AI (или OpenAI). Используйте при запросе пользователя на аудиосообщение, голосовой ответ или для прослушивания чего-то 'of vive voix'.
Local Whisper
Local Whisper: Бесплатное локальное говорение в текст с использованием MLX Whisper на Apple Silicon. Приватно, без затрат на API.
/whisper-mlx-localTranscribe
Транскрибация аудиофайлов в текст с использованием локального Whisper (Docker). Используйте при получении голосовых сообщений, аудиофайлов (.mp3, .m4a, .ogg, .wav, .webm) или когда вам нужно транскрибировать аудиоконтент.
/transcribeassemblyai-transcribe
assemblyai-transcribe: Транскрибировать аудио/видео с использованием AssemblyAI.
/assemblyai-transcribeelevenlabs-agents
Создание, управление и развертывание ElevenLabs
/elevenlabs-agentsLocal STT (Nvidia Parakeet + Whisper Support)
Локальная STT (Nvidia Parakeet + поддержка Whisper): Локальная STT с выбранными бекендами - Parakeet (наилучшая точность) или Whisper (быстрейший, многоязычный).
/local-sttaudio-gen
audio-gen: Создавать аудиокниги, подкасты или образовательное аудио содержимое.
/audio-gencritical-article-writer
Создание черновиков статей, планов
/critical-article-writerit will help you to send voice messages to your AI Assistant and also can make it talk
Это поможет вам отправлять голосовые сообщения вашему AI Асистенту и также может заставить его говорить: Text-to-Speech и Speech-to-Text с использованием AI ElevenLabs. Используйте, когда пользователь хочет преобразовать текст в речь, транскрибировать голосовые сообщения или работать с голосом на множестве языков. Поддерживает высококачественные AI голоса и точную транскрипцию.
/elevenlabs-voiceelevenlabs-transcribe
Транскрибация аудио в текст с использованием ElevenLabs
/elevenlabs-transcribeParakeet Stt
Parakeet Stt: Локальная обработка речи в текст с использованием NVIDIA Parakeet TDT 0.6B v3 (ONNX на CPU). В 30 раз быстрее, чем Whisper, 25 языков, автоматическое обнаружение, API совместимый с OpenAI. Используйте при транскрибации аудиофайлов, конвертации речи в текст или обработке голосовых записей локально без облачных API.
/parakeet-sttdeepgram
Deepgram: — командная строка интерфейса для Deepgram озвучка в текст.
/deepgramannouncer
Объявитель: Объявлять текст по всему дому через динамики AirPlay с использованием Airfoil +.
/announcerSpeech To Text
Транскрибация аудио в текст с использованием моделей Whisper через CLI inference.sh. Модели: Fast Whisper Large V3, Whisper V3 Large. Возможности: транскрипция, перевод...
/speech-to-textVoice
Преобразование текста в речь с использованием двигателя TTS Microsoft Edge с настраиваемыми голосами, прямым воспроизведением и автоматической очисткой временных файлов.
/voiceaddis-assistant-stt
Обеспечивает функции Обратной речи в текст (STT) и текст
/addis-assistant-sttPocket Tts
Pocket Tts: Генерируйте высококачественную английскую речь офлайн на CPU с использованием 8 встроенных голосов или пользовательского клонирования голоса с моделью Pocket TTS от Kyutai.
/pocket-ttsVoicenotes
Voicenotes: Синхронизация и доступ к голосовым заметкам с Voicenotes.com. Используйте, когда пользователь хочет восстановить свои голосовые записи, транскрипции и AI-обзоры с Voicenotes. Поддерживает загрузку заметок, синхронизацию в формат markdown и поиск транскрипций.
/voicenotesTranscribe Audio with Parakeet MLX
Транскрибация аудио с Parakeet MLX: Локальная речь в текст с Parakeet MLX (ASR) для Apple Silicon (без ключа API).
/parakeet-mlxclonev
Клонирование любого голоса и генерация речи с использованием Coqui XTTS v2
/clonevdeepdub-tts
Генерация аудиowiedер с использованием Deepdub и attaching it as a MEDIA
/deepdub-ttschichi-speech
Сервис высококачественного текста в речь с использованием Qwen3
/chichi-speechVoicenotes Official
Voicenotes Official: Этот официальный Skill от команды Voicenotes предоставляет OpenClaw доступ к новым API и возможность поиска семантически, извлечения полных транскрипций, фильтрации по т.д.
/voicenotes-officialtl;dw - YouTube Video Summarizer
tl;dw - YouTube Video Summarizer: Извлекает текстовые transcripts YouTube видео и предоставляет краткие резюме, подчеркивая основные моменты, аргументы и выводы без просмотра всего видео.
Openai Tts.Bak 2026 01 28T18:01:23+10:30
Openai Tts.Bak 2026 01 28T18:01:23+10:30: Текст в речь через API аудио речи OpenAI.
/openai-tts-bak-2026-01-28t18-01-23-10-30speech-recognition
Общий навык распознавания речи. Поддерживает различные аудиоформаты (ogg/mp3/wav/m4a), использует потоковую SenseVoice API для преобразования речи в текст. Активируется при отправке голосовых сообщений, аудиофайлов или необходимости транскрипции аудио.
/speech-recognitionfreshbooks-cli
CLI FreshBooks для управления счетами, клиентами и расчетами.
/freshbooks-cliText To Speech
Преобразование текста в естественную речь с помощью DIA TTS, Kokoro, Chatterbox и других через CLI inference.sh. Модели: DIA TTS (диалоговая), Kokoro TTS, Chatterbox, Hig...
/text-to-speechAssemblyAI Transcriber
AssemblyAI Transcriber: Переводить аудиофайлы с диаризацией говорящего (кто говорит когда). Поддерживает более 100 языков, автоматическое определение языка и временные метки. Используйте для встреч, интервью, подкастов или голосовых сообщений. Требуется ключ API AssemblyAI.
/assemblyai-transcriberWhisper Transcribe
Whisper Transcribe: Перевод аудиофайлов в текст с использованием OpenAI Whisper. Поддерживает преобразование речи в текст с автоматическим определением языка, несколько форматов вывода (txt, srt, vtt, ), параллельную обработку и выбор модели (маленькая до большой). Используйте для перевода аудиозаписей, подкастов, голосовых сообщений, лекций, встреч или любого аудио/видео файла в текст. Поддерживает форматы mp3, wav, m4a, ogg, flac, webm, opus, aac.
/whisper-transcribeeternal-haven-lore-pack
lore-пакет вечного рая: хронicles вечного рая + пакет мифических персонажей
/eternal-haven-lore-packakaunting
Интерактив с открытым исходным кодом программным обеспечением для бухгалтерского учета Akaunting через REST API
/akauntingauto-whisper-safe
Безопасная транскрипция голоса с автоматическим разбиванием на фрагменты — работает на машинах с 16 ГБ ОЗУ без сбоев.
/auto-whisper-safebrw-de-ai-ify
Удаление жаргона, созданного AI, и восстановление человеческого голоса в тексте.
/brw-de-ai-ifydellight-cro-revenue-ops
Dellight-cro-revenue-ops: DELLIGHT.AI — это AI-стартап в DIFC, Дубай.
/dellight-cro-revenue-opsdocuments-ai
Documents-ai: Реальное OCR и API для извлечения данных от Veryfi.
/documents-aidoubao-api-open-tts
Сервис текста в речь с использованием Doubao (Двигатель Вулканик)
/doubao-api-open-ttseachlabs-voice-audio
TTS, STT, преобразование голоса с использованием ElevenLabs, Whisper, RVC
/eachlabs-voice-audiofeishu-minutes
получение информации, данных, протокола и медиа из Feishu
/feishu-minutesgettr-transcribe-summarize
Загрузка аудио из публикации на GETTR.
/gettr-transcribe-summarizehebrew-nikud
Справочник по nikud (точкам гласных) на иврите для агентов ИИ.
/hebrew-nikudmiranda-sag
Текст в голос с ElevenLabs с интерфейсом UX в стиле macOS.
/miranda-sagnorman-categorize-transactions
Проверка и категоризация неопределенных банковских операций, совпадение с счетами-фактурами и проверка записей бухгалтерского учета.
/norman-categorize-transactionsnorman-monthly-reconciliation
Ведение полного ежемесячного финансового сверки - проверка всех операций, совпадение счетов-фактур, проверка задолженностей.
/norman-monthly-reconciliationressemble
Интеграция Text-to-Speech и Speech-to-Text с использованием HTTP API Resemble AI.
/ressemblesiliconflow-tts-gen
Текст в голос с использованием API SiliconFlow (CosyVoice2)
/siliconflow-tts-gen