音声と文字起こし Skills | OpenClaw スキルナビ

🎖️注目

41,621

Mcporter

Mcporter: mcporter CLIを使用して、MCPサーバー/ツールをリストアップ、設定、認証、コール（HTTPまたはstdio）、アドホックサーバー、設定編集、CLI/タイプ生成

🎙️音声と文字起こし/mcporter

🎖️注目

31,978

OpenClaw YouTube Transcript

OpenClaw YouTube Transcript: yt-dlpを使用して、ビデオURLからキャプションと字幕を直接抽出してYouTubeビデオをテキストに変換

🎙️音声と文字起こし/openclaw-youtube-transcript

🎖️注目

18,448

Sag

ElevenLabsテキストトースプーチとmacスタイルのUX。

🎙️音声と文字起こし/sag

🎖️注目

15,590

YouTube Transcript

YouTube字幕: YouTubeビデオの字幕を取得し要約します。字幕の要約、書き起こし、またはYouTubeビデオからのコンテンツの抽出が必要な場合に使用します。YouTubeのクラウドIPブロックを迂回するために住宅IPプロキシを通じて字幕の取得を処理します。

🎙️音声と文字起こし/youtube-transcript

Local Whisper

ローカルウィスパー：OpenAI Whisperを使用したローカルスピーチトテキスト。モデルのダウンロード後、完全にオフラインで動作します。複数のモデルサイズでの高品質なトランスクリプション。

🎙️音声と文字起こし/local-whisper

elevenlabs-voices

18のパーソナで高品質な音声合成、32

🎙️音声と文字起こし/elevenlabs-voices

faster-whisper

faster-whisperを使用したローカルスピーチからテキスト変換

🎙️音声と文字起こし/faster-whisper

elevenlabs-tts

ElevenLabs TTS - OpenClaw用の最高のElevenLabs統合

🎙️音声と文字起こし/elevenlabs-tts

Voice Transcribe

Voice Transcribe: オープンAIのgpt-4o-mini-transcribeモデルを使用して、語彙ヒントとテキスト置換を使用してオーディオファイルをトランスクリプト。uv（https://docs.astral.sh/uv/）が必要です。

🎙️音声と文字起こし/voice-transcribe

jarvis-voice

TTSと視覚的なトランスクリプトスタイルの金属的なAIボイス

🎙️音声と文字起こし/jarvis-voice

kokoro-tts

ローカルのKokoro TTSエンジンを使用してテキストから音声生成

🎙️音声と文字起こし/kokoro-tts

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text: ElevenLabs Speech-to-Text（Scribe v2）を使用してオーディオファイルをトランスクライプします。

🎙️音声と文字起こし/elevenlabs-stt

Mlx Whisper

Mlx Whisper: MLX Whisperを使用したローカルスピーチトキスト（Apple Silicon最適化、APIキー不要）

🎙️音声と文字起こし/mlx-whisper

Transcribe audio files via OpenRouter using audio-capable models

オープンルーターを使用してオーディオ機能を持つモデル（ジェミニ、GPT-4o-audioなど）を通じてオーディオファイルを変換します。

🎙️音声と文字起こし/openrouter-transcribe

Gemini STT

Gemini STT: GoogleのGemini APIまたはVertex AIを使用してオーディオファイルをトランスクリプトします。

🎙️音声と文字起こし/gemini-stt

Tts

Tts: Hume AI（またはOpenAI）APIを使用してテキストを音声に変換します。ユーザーが音声メッセージ、音声応答を求める際や、'vive voix'で何かを聞きたい場合に使用。

🎙️音声と文字起こし/tts

Local Whisper

ローカルウィスパー：Apple Silicon上のMLX Whisperを使用して、TelegramとWhatsAppのために無料のローカルスピーチトテキストを提供します。プライベートで、APIコストはかかりません。

🎙️音声と文字起こし/whisper-mlx-local

Transcribe

Transcribe: ローカルの Whisper (Docker) を使用してオーディオファイルをテキストに変換します。音声メッセージを受け取る際、オーディオファイル（.mp3、.m4a、.ogg、.wav、.webm）がある場合、またはオーディオコンテンツを変換するように依頼された場合に使用します。

🎙️音声と文字起こし/transcribe

assemblyai-transcribe

AssemblyAIで音/動画を変換

🎙️音声と文字起こし/assemblyai-transcribe

elevenlabs-agents

ElevenLabsの作成・管理・展開

🎙️音声と文字起こし/elevenlabs-agents

Local STT (Nvidia Parakeet + Whisper Support)

Local STT（Nvidia Parakeet + Whisper Support）：選択可能なバックエンドを備えたローカルSTT - Parakeet（最も高い精度）またはWhisper（最も速く、多言語）。

🎙️音声と文字起こし/local-stt

audio-gen

オーディオブックやPodcast生成

🎙️音声と文字起こし/audio-gen

critical-article-writer

草案記事、概要生成

🎙️音声と文字起こし/critical-article-writer

audio-reply

TTSを使った音声応答生成

🎙️音声と文字起こし/audio-reply-skill

it will help you to send voice messages to your AI Assistant and also can make it talk

AIアシスタントに音声メッセージを送信するのに役立ち、また話すこともできます：ElevenLabs AIを使用したテキストトースピーチとスピーチトテキスト。テキストを音声に変換する、音声メッセージを書き起こす、または複数の言語で音声を扱う際に使用します。高品質のAIボイスと正確な書き起こしをサポートします。

🎙️音声と文字起こし/elevenlabs-voice

elevenlabs-transcribe

音声をテキストに変換

🎙️音声と文字起こし/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt：NVIDIA Parakeet TDT 0.6B v3（CPU上のONNX）を使用したローカルスピーチからテキスト変換。Whisperよりも30倍速く、25言語、自動検出、OpenAI互換API。オーディオファイルのトランスクライピング、スピーチをテキストに変換、クラウドAPIなしでローカルで音声記録を処理する場合に使用します。

🎙️音声と文字起こし/parakeet-stt

deepgram

Deepgramのコマンドラインインターフェース

🎙️音声と文字起こし/deepgram

announcer

AirPlayスピーカーでAirfoil+を使って家全体にテキストを発表

🎙️音声と文字起こし/announcer

Speech To Text

Speech To Text: inference.sh CLIを通じてWhisperモデルを使用してオーディオをテキストに変換します。モデル: Fast Whisper Large V3、Whisper V3 Large。機能:変換、翻訳...

🎙️音声と文字起こし/speech-to-text

Voice

Voice: Microsoft EdgeのTTSエンジンを使用してテキストを音声に変換。カスタマイズ可能なボイス、直接再生、自動一時ファイルクリーンアップ。

🎙️音声と文字起こし/voice

addis-assistant-stt

音声認識と��キスト提供

🎙️音声と文字起こし/addis-assistant-stt

Pocket Tts

Pocket Tts: KyutaiのPocket TTSモデルを使用して、CPU上でオフラインで高品質な英語スピーチを生成します。8つの内蔵ボイスまたはカスタムボイスクローニングを使用できます。

🎙️音声と文字起こし/pocket-tts

inworld-tts

Inworld.ai APIを通じてのテキスト読み上げ

🎙️音声と文字起こし/inworld-tts

Voicenotes

Voicenotes: Voicenotes.comからの音声メモを同期およびアクセス。ユーザーが音声録音、トランスクリプト、AI要約をVoicenotesから取得したい場合に使用。ノートの取得、マークダウンへの同期、トランスクリプトの検索をサポート。

🎙️音声と文字起こし/voicenotes

claw-voice

生ユーザーセッションと音声接続

🎙️音声と文字起こし/claw-voice

Transcribe Audio with Parakeet MLX

Parakeet MLXでオーディオをトランスクリプト: Apple Silicon用のParakeet MLX（ASR）でローカルの音声対テキストを実行（APIキー不要）。

🎙️音声と文字起こし/parakeet-mlx

clonev

Coqui XTTS v2で音声をクローンし、話す

🎙️音声と文字起こし/clonev

cult-of-carcinization

エージェントに声と耳を与える

🎙️音声と文字起こし/cult-of-carcinization

deepdub-tts

Deepdubで音声生成し、MEDIAとして付属

🎙️音声と文字起こし/deepdub-tts

chichi-speech

Qwen3を使用した高品質なテキスト読み上げのRESTfulサービス

🎙️音声と文字起こし/chichi-speech

lnbits

LNbitsレジ袋管理（残高、支払い、請求）

🎙️音声と文字起こし/lnbits

Voicenotes Official

Voicenotes Official：Voicenotesチームからの公式スキルで、OpenClawに新しいAPIへのアクセスと意味的検索、完全なトランスクリプトの取得、フィルタリング機能を提供します...

🎙️音声と文字起こし/voicenotes-official

tl;dw - YouTube Video Summarizer

tl;dw - YouTube Video Summarizer: 全ての動画を視聴する前に、YouTube動画のトランスクラップトを抽出し、主なポイント、議論、結論を強調する簡潔な要約を提供します。

🎙️音声と文字起こし/tldw

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Openai Tts.Bak 2026 01 28T18:01:23+10:30: OpenAI Audio Speech APIを通じてテキストトースプト。

🎙️音声と文字起こし/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

通用音声認識スキル。様々なオーディオフォーマット（ogg/mp3/wav/m4a）をサポートし、音声をテキストに変換するためにシリコンベースの動的 SenseVoice API を使用。ユーザーが音声メッセージ、オーディオファイルを送信したり、オーディオの転写が必要な場合にトリガーされます。

🎙️音声と文字起こし/speech-recognition

freshbooks-cli

請求、顧客、課金を管理するFreshBooks CLI

🎙️音声と文字起こし/freshbooks-cli

Text To Speech

テキストトースプ：inference.sh CLIを通じて DIA TTS、Kokoro、Chatterbox、などでテキストを自然なスピーチに変換します。モデル：DIA TTS（会話型）、Kokoro TTS、Chatterbox、Hig...

🎙️音声と文字起こし/text-to-speech

AssemblyAI Transcriber

AssemblyAI Transcriber: オーディオファイルをスピーカー分離（誰が話しているか）で変換します。100を超える言語をサポートし、自動言語検出とタイムスタンプを提供します。会議、インタビュー、ポッドキャスト、ボイスメッセージに使用してください。AssemblyAI APIキーが必要です。

🎙️音声と文字起こし/assemblyai-transcriber

Whisper Transcribe

Whisper Transcribe: OpenAI Whisperを使用してオーディオファイルをテキストに変換します。音声からテキストへの変換、自動言語検出、複数の出力形式（txt、srt、vtt、）、バッチ処理、モデル選択（小さいから大きいまで）をサポートします。オーディオ記録、ポッドキャスト、音声メッセージ、講義、会議、またはオーディオ/ビデオファイルをテキストに変換する場合に使用します。mp3、wav、m4a、ogg、flac、webm、opus、aac形式を処理します。

🎙️音声と文字起こし/whisper-transcribe