音声と文字起こし
(71)Mcporter
Mcporter: mcporter CLIを使用して、MCPサーバー/ツールをリストアップ、設定、認証、コール(HTTPまたはstdio)、アドホックサーバー、設定編集、CLI/タイプ生成
/mcporterOpenClaw YouTube Transcript
OpenClaw YouTube Transcript: yt-dlpを使用して、ビデオURLからキャプションと字幕を直接抽出してYouTubeビデオをテキストに変換
/openclaw-youtube-transcriptYouTube Transcript
YouTube字幕: YouTubeビデオの字幕を取得し要約します。字幕の要約、書き起こし、またはYouTubeビデオからのコンテンツの抽出が必要な場合に使用します。YouTubeのクラウドIPブロックを迂回するために住宅IPプロキシを通じて字幕の取得を処理します。
/youtube-transcriptLocal Whisper
ローカルウィスパー:OpenAI Whisperを使用したローカルスピーチトテキスト。モデルのダウンロード後、完全にオフラインで動作します。複数のモデルサイズでの高品質なトランスクリプション。
/local-whisperVoice Transcribe
Voice Transcribe: オープンAIのgpt-4o-mini-transcribeモデルを使用して、語彙ヒントとテキスト置換を使用してオーディオファイルをトランスクリプト。uv(https://docs.astral.sh/uv/)が必要です。
/voice-transcribeElevenLabs Speech-to-Text
ElevenLabs Speech-to-Text: ElevenLabs Speech-to-Text(Scribe v2)を使用してオーディオファイルをトランスクライプします。
/elevenlabs-sttMlx Whisper
Mlx Whisper: MLX Whisperを使用したローカルスピーチトキスト(Apple Silicon最適化、APIキー不要)
/mlx-whisperTranscribe audio files via OpenRouter using audio-capable models
オープンルーターを使用してオーディオ機能を持つモデル(ジェミニ、GPT-4o-audioなど)を通じてオーディオファイルを変換します。
/openrouter-transcribeTts
Tts: Hume AI(またはOpenAI)APIを使用してテキストを音声に変換します。ユーザーが音声メッセージ、音声応答を求める際や、'vive voix'で何かを聞きたい場合に使用。
/ttsLocal Whisper
ローカルウィスパー:Apple Silicon上のMLX Whisperを使用して、TelegramとWhatsAppのために無料のローカルスピーチトテキストを提供します。プライベートで、APIコストはかかりません。
/whisper-mlx-localTranscribe
Transcribe: ローカルの Whisper (Docker) を使用してオーディオファイルをテキストに変換します。音声メッセージを受け取る際、オーディオファイル(.mp3、.m4a、.ogg、.wav、.webm)がある場合、またはオーディオコンテンツを変換するように依頼された場合に使用します。
/transcribeLocal STT (Nvidia Parakeet + Whisper Support)
Local STT(Nvidia Parakeet + Whisper Support):選択可能なバックエンドを備えたローカルSTT - Parakeet(最も高い精度)またはWhisper(最も速く、多言語)。
/local-sttit will help you to send voice messages to your AI Assistant and also can make it talk
AIアシスタントに音声メッセージを送信するのに役立ち、また話すこともできます:ElevenLabs AIを使用したテキストトースピーチとスピーチトテキスト。テキストを音声に変換する、音声メッセージを書き起こす、または複数の言語で音声を扱う際に使用します。高品質のAIボイスと正確な書き起こしをサポートします。
/elevenlabs-voiceParakeet Stt
Parakeet Stt:NVIDIA Parakeet TDT 0.6B v3(CPU上のONNX)を使用したローカルスピーチからテキスト変換。Whisperよりも30倍速く、25言語、自動検出、OpenAI互換API。オーディオファイルのトランスクライピング、スピーチをテキストに変換、クラウドAPIなしでローカルで音声記録を処理する場合に使用します。
/parakeet-sttSpeech To Text
Speech To Text: inference.sh CLIを通じてWhisperモデルを使用してオーディオをテキストに変換します。モデル: Fast Whisper Large V3、Whisper V3 Large。機能:変換、翻訳...
/speech-to-textVoice
Voice: Microsoft EdgeのTTSエンジンを使用してテキストを音声に変換。カスタマイズ可能なボイス、直接再生、自動一時ファイルクリーンアップ。
/voicePocket Tts
Pocket Tts: KyutaiのPocket TTSモデルを使用して、CPU上でオフラインで高品質な英語スピーチを生成します。8つの内蔵ボイスまたはカスタムボイスクローニングを使用できます。
/pocket-ttsVoicenotes
Voicenotes: Voicenotes.comからの音声メモを同期およびアクセス。ユーザーが音声録音、トランスクリプト、AI要約をVoicenotesから取得したい場合に使用。ノートの取得、マークダウンへの同期、トランスクリプトの検索をサポート。
/voicenotesTranscribe Audio with Parakeet MLX
Parakeet MLXでオーディオをトランスクリプト: Apple Silicon用のParakeet MLX(ASR)でローカルの音声対テキストを実行(APIキー不要)。
/parakeet-mlxVoicenotes Official
Voicenotes Official:Voicenotesチームからの公式スキルで、OpenClawに新しいAPIへのアクセスと意味的検索、完全なトランスクリプトの取得、フィルタリング機能を提供します...
/voicenotes-officialtl;dw - YouTube Video Summarizer
tl;dw - YouTube Video Summarizer: 全ての動画を視聴する前に、YouTube動画のトランスクラップトを抽出し、主なポイント、議論、結論を強調する簡潔な要約を提供します。
/tldwOpenai Tts.Bak 2026 01 28T18:01:23+10:30
Openai Tts.Bak 2026 01 28T18:01:23+10:30: OpenAI Audio Speech APIを通じてテキストトースプト。
/openai-tts-bak-2026-01-28t18-01-23-10-30speech-recognition
通用音声認識スキル。様々なオーディオフォーマット(ogg/mp3/wav/m4a)をサポートし、音声をテキストに変換するためにシリコンベースの動的 SenseVoice API を使用。ユーザーが音声メッセージ、オーディオファイルを送信したり、オーディオの転写が必要な場合にトリガーされます。
/speech-recognitionText To Speech
テキストトースプ:inference.sh CLIを通じて DIA TTS、Kokoro、Chatterbox、などでテキストを自然なスピーチに変換します。モデル:DIA TTS(会話型)、Kokoro TTS、Chatterbox、Hig...
/text-to-speechAssemblyAI Transcriber
AssemblyAI Transcriber: オーディオファイルをスピーカー分離(誰が話しているか)で変換します。100を超える言語をサポートし、自動言語検出とタイムスタンプを提供します。会議、インタビュー、ポッドキャスト、ボイスメッセージに使用してください。AssemblyAI APIキーが必要です。
/assemblyai-transcriberWhisper Transcribe
Whisper Transcribe: OpenAI Whisperを使用してオーディオファイルをテキストに変換します。音声からテキストへの変換、自動言語検出、複数の出力形式(txt、srt、vtt、)、バッチ処理、モデル選択(小さいから大きいまで)をサポートします。オーディオ記録、ポッドキャスト、音声メッセージ、講義、会議、またはオーディオ/ビデオファイルをテキストに変換する場合に使用します。mp3、wav、m4a、ogg、flac、webm、opus、aac形式を処理します。
/whisper-transcribe