语音与转录
(71)OpenClaw YouTube Transcript
从视频URL直接提取字幕并转录YouTube视频为文本,无需音频处理。
/openclaw-youtube-transcriptYouTube Transcript
YouTube字幕:获取并总结YouTube视频字幕。在需要总结、转录或从YouTube视频中提取内容时使用。通过住宅IP代理获取字幕以绕过YouTube的云IP封锁。
/youtube-transcriptVoice Transcribe
Voice Transcribe:使用OpenAI的gpt-4o-mini-transcribe模型和词汇提示以及文本替换来转录音频文件。需要uv(https://docs.astral.sh/uv/)。
/voice-transcribeTranscribe audio files via OpenRouter using audio-capable models
通过OpenRouter使用具有音频功能的模型(Gemini、GPT-4o-audio等)转录音频文件。
/openrouter-transcribeLocal Whisper
本地语音识别:使用MLX Whisper在Apple Silicon上为Telegram和WhatsApp提供免费的本地语音转文本。私密,无API费用。
/whisper-mlx-localTranscribe
使用本地 Whisper (Docker) 将音频文件转录成文本。在接收语音消息、音频文件(.mp3, .m4a, .ogg, .wav, .webm)或被要求转录音频内容时使用。
/transcribeLocal STT (Nvidia Parakeet + Whisper Support)
本地STT(Nvidia Parakeet + Whisper支持):具有可选后端的本地STT - Parakeet(最佳准确性)或Whisper(最快,多语言)。
/local-sttit will help you to send voice messages to your AI Assistant and also can make it talk
它可以帮助您向您的AI助手发送语音消息,并且可以使它说话:使用ElevenLabs AI的文本到语音和语音到文本。当用户想要将文本转换为语音、转录语音消息或使用多语言中的语音时使用。支持高质量的AI语音和准确的转录。
/elevenlabs-voiceParakeet Stt
Parakeet Stt:使用NVIDIA Parakeet TDT 0.6B v3(ONNX on CPU)进行本地语音转文本。比Whisper快30倍,支持25种语言,自动检测,与OpenAI兼容的API。当转录音频文件、将语音转换为文本或在没有云API的情况下本地处理语音录音时使用。
/parakeet-sttSpeech To Text
语音转文本:通过inference.sh CLI使用Whisper模型将音频转录为文本。模型:Fast Whisper Large V3,Whisper V3 Large。功能:转录、翻译...
/speech-to-textPocket Tts
Pocket Tts: Generate high-quality English speech offline on CPU using 8 built-in voices or custom voice cloning with Kyutai's Pocket TTS model.
/pocket-ttsVoicenotes
Voicenotes:同步并访问Voicenotes.com上的语音笔记。当用户想要从Voicenotes检索他们的语音录音、转录和AI摘要时使用。支持获取笔记、同步到Markdown格式和搜索转录内容。
/voicenotesTranscribe Audio with Parakeet MLX
使用Parakeet MLX转录音频:使用Parakeet MLX(ASR)在本地进行语音转文字,适用于Apple Silicon(无需API密钥)。
/parakeet-mlxVoicenotes Official
Voicenotes Official:来自Voicenotes团队的官方Skill,为OpenClaw提供访问新API的能力,以及进行语义搜索、检索完整转录、按条件过滤等。
/voicenotes-officialtl;dw - YouTube Video Summarizer
tl;dw - YouTube视频摘要器:提取YouTube视频脚本并提供简洁的摘要,突出主要观点、论点和结论,无需观看完整视频。
/tldwOpenai Tts.Bak 2026 01 28T18:01:23+10:30
Openai Tts.Bak 2026 01 28T18:01:23+10:30:通过 OpenAI 音频语音 API 进行文本到语音转换。
/openai-tts-bak-2026-01-28t18-01-23-10-30speech-recognition
通用语音识别技能。支持多种音频格式(ogg/mp3/wav/m4a),使用硅基流动 SenseVoice API 进行语音转文字。当用户发送语音消息、音频文件,或需要转录音频时触发。
/speech-recognitionText To Speech
使用DIA TTS、Kokoro、Chatterbox等通过inference.sh CLI将文本转换为自然语音。模型:DIA TTS(对话式)、Kokoro TTS、Chatterbox、Hig...
/text-to-speechAssemblyAI Transcriber
AssemblyAI Transcriber:使用语音分离功能转录音频文件(谁在何时说话)。支持100多种语言,自动语言检测和时间戳。适用于会议、访谈、播客或语音消息。需要AssemblyAI API密钥。
/assemblyai-transcriberWhisper Transcribe
Whisper 转写:使用 OpenAI Whisper 将音频文件转录成文本。支持自动语言检测的语音到文本,多种输出格式(txt、srt、vtt、),批量处理和模型选择(从小型到大型)。当转录音频录音、播客、语音消息、讲座、会议或任何音频/视频文件到文本时使用。处理 mp3、wav、m4a、ogg、flac、webm、opus、aac 格式。
/whisper-transcribenorman-categorize-transactions
对未分类的银行交易进行审查和分类,将其与发票进行匹配,并验证簿记条目。
/norman-categorize-transactions