Beranda/Ucapan dan Transkripsi
🎙️

Ucapan dan Transkripsi

(71)
🎖️Unggulan
41,621

Mcporter

Mcporter: Gunakan CLI mcporter untuk daftar, konfigurasi, otentikasi, dan panggil server/alat MCP langsung (HTTP atau stdio), termasuk server ad-hoc, sunting konfigurasi, dan generasi CLI/type.

🎖️Unggulan
31,978

OpenClaw YouTube Transcript

OpenClaw YouTube Transcript: Transkrip video YouTube ke teks dengan mengekstrak teks tajuk dan subtitle langsung dari URL video menggunakan yt-dlp tanpa pemrosesan audio.

🎙️Ucapan dan Transkripsi/openclaw-youtube-transcript
🎖️Unggulan
18,448

Sag

Sag: ElevenLabs text-to-speech dengan gaya say UX mac.

🎖️Unggulan
15,590

YouTube Transcript

Transkrip YouTube: Mengambil dan menyumarsikan transkrip video YouTube. Gunakan saat diminta menyumarsikan, transkrip, atau mengekstrak konten dari video YouTube. Mengelola pengambilan transkrip melalui proxy IP rumah untuk melewati blok IP cloud YouTube.

Local Whisper

Local Whisper: Pemrosesan suara lokal ke teks menggunakan OpenAI Whisper. Berjalan sepenuhnya offline setelah unduh model. Transkripsi kualitas tinggi dengan berbagai ukuran model.

elevenlabs-voices

elevenlabs-voices: Sintesis suara kualitas tinggi dengan 18 persona, 32.

faster-whisper

ucapan lokal menggunakan faster-whisper

elevenlabs-tts

elevenlabs-tts: ElevenLabs TTS - integrasi terbaik ElevenLabs untuk OpenClaw.

Voice Transcribe

Penggunaan Transkripsi Suara: Transkrip berkas audio menggunakan model gpt-4o-mini-transcribe dari OpenAI dengan petunjuk vocabularis dan penggantian teks. Memerlukan uv (https://docs.astral.sh/uv/).

jarvis-voice

jarvis-voice: Suara AI Metalik dengan TTS dan penataan transkrip visual.

kokoro-tts

kokoro-tts: Buat audio berbicara dari teks menggunakan mesin TTS lokal Kokoro.

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text: Transkrip file audio menggunakan ElevenLabs Speech-to-Text (Scribe v2)

Mlx Whisper

Mlx Whisper: Pemrosesan suara ke teks lokal dengan MLX Whisper (optimalisasi Apple Silicon, tanpa API key)

Transcribe audio files via OpenRouter using audio-capable models

Mengtranskrip berkas audio melalui OpenRouter menggunakan model yang dapat memproses audio: Mengtranskrip berkas audio melalui OpenRouter menggunakan model yang dapat memproses audio (Gemini, GPT-4o-audio, dll.)

🎙️Ucapan dan Transkripsi/openrouter-transcribe

Gemini STT

Gemini STT: Transkrip file audio menggunakan API Gemini Google atau Vertex AI

Tts

Tts: Mengubah teks menjadi suara menggunakan API Hume AI (atau OpenAI). Gunakan saat pengguna meminta pesan audio, tanggapan suara, atau untuk mendengar sesuatu 'dengan suara yang indah'.

Local Whisper

Local Whisper: Pemrosesan suara lokal ke teks untuk Telegram dan WhatsApp menggunakan MLX Whisper di Apple Silicon. Pribadi, tanpa biaya API.

Transcribe

Pindai: Pindai berkas audio ke teks menggunakan Whisper lokal (Docker). Gunakan saat menerima pesan suara, berkas audio (.mp3, .m4a, .ogg, .wav, .webm), atau saat diminta untuk mendaftar konten audio.

assemblyai-transcribe

assemblyai-transcribe: Transkrip audio/video dengan AssemblyAI

🎙️Ucapan dan Transkripsi/assemblyai-transcribe

elevenlabs-agents

elevenlabs-agents: Membuat, mengelola, dan meluncurkan ElevenLabs.

Local STT (Nvidia Parakeet + Whisper Support)

STT Lokal (Nvidia Parakeet + Dukungan Whisper): STT lokal dengan backend yang dapat dipilih - Parakeet (akurasi terbaik) atau Whisper ( tercepat, multilingual).

audio-gen

audio-gen: Buat buku suara, podcast, atau konten audio pendidikan

critical-article-writer

critical-article-writer: Buat naskah artikel dan rangkaian.

🎙️Ucapan dan Transkripsi/critical-article-writer

audio-reply

audio-reply: Buat tanggapan audio menggunakan TTS

it will help you to send voice messages to your AI Assistant and also can make it talk

Mengirim pesan suara ke Asisten AI Anda dan juga dapat membuatnya berbicara: Text-to-Speech dan Speech-to-Text menggunakan AI ElevenLabs. Gunakan saat pengguna ingin mengkonversi teks ke suara, transkrip pesan suara, atau bekerja dengan suara dalam berbagai bahasa. Dukung suara AI kualitas tinggi dan transkripsi yang akurat.

elevenlabs-transcribe

elevenlabs-transcribe: Transkrip audio ke teks menggunakan ElevenLabs.

🎙️Ucapan dan Transkripsi/elevenlabs-transcribe

Parakeet Stt

translation

deepgram

deepgram: — antarmuka perintah untuk Deepgram speech-to-text.

announcer

penyelenggara: Beritahukan teks di seluruh rumah melalui speaker AirPlay menggunakan Airfoil +

Speech To Text

translation

Voice

Suara: Mengubah teks menjadi suara menggunakan mesin TTS Microsoft Edge dengan suara yang dapat disesuaikan, pemutaran langsung, dan pembersihan berkas sementara otomatis.

addis-assistant-stt

addis-assistant-stt: Menyediakan Speech-to-Text (STT) dan teks.

🎙️Ucapan dan Transkripsi/addis-assistant-stt

Pocket Tts

Pocket Tts: Buat bicara Inggris kualitas tinggi secara offline di CPU menggunakan 8 suara bawaan atau cloning suara kustom dengan model Pocket TTS Kyutai.

inworld-tts

teks ke suara melalui API Inworld.ai

Voicenotes

Translation

claw-voice

claw-voice: Anda terhubung ke sesi pengguna langsung melalui suara

Transcribe Audio with Parakeet MLX

Transkrip Audio dengan Parakeet MLX: Pemrosesan suara ke teks (ASR) lokal dengan Parakeet MLX untuk Apple Silicon (tanpa API key).

clonev

clonev: Menyalin suara apapun dan generate bicara menggunakan Coqui XTTS v2.

cult-of-carcinization

cult-of-carcinization: Berikan suara dan telinga untuk agen Anda.

🎙️Ucapan dan Transkripsi/cult-of-carcinization

deepdub-tts

deepdub-tts: Generate audio bicara menggunakan Deepdub dan lampirkan sebagai MEDIA.

chichi-speech

chichi-speech: Layanan RESTful untuk text-to-speech kualitas tinggi menggunakan Qwen3

lnbits

lnbits: Mengelola dompet Lightning LNbits (Saldo, Bayar, Faktur).

Voicenotes Official

Voicenotes Official: Ini adalah skill resmi dari tim Voicenotes yang memberikan akses OpenClaw ke API baru dan kemampuan untuk mencari secara semantik, mengambil transkrip penuh, menyaring berdasarkan...

🎙️Ucapan dan Transkripsi/voicenotes-official

tl;dw - YouTube Video Summarizer

YouTube Video Ringkasan: Mengeluarkan transkrip video YouTube dan menyediakan ringkasan yang singkat yang menekankan titik utama, argumen, dan kesimpulan tanpa menonton video penuh.

Openai Tts.Bak 2026 01 28T18:01:23+10:30

translation

🎙️Ucapan dan Transkripsi/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

pengenalan-ucapan: Skill pengenalan ucapan umum. Dukung berbagai format audio (ogg/mp3/wav/m4a), menggunakan API SenseVoice berbasis silikon untuk mengubah ucapan menjadi teks. Dikaitkan saat pengguna mengirim pesan suara, berkas audio, atau memerlukan transkripsi audio.

freshbooks-cli

CLI FreshBooks untuk mengelola faktur, klien, dan tagihan

Text To Speech

Text To Speech: Mengubah teks menjadi bicara alami dengan DIA TTS, Kokoro, Chatterbox, dan lainnya melalui CLI inference.sh. Model: DIA TTS (konversasi), Kokoro TTS, Chatterbox, Hig...

AssemblyAI Transcriber

Pemutar Transkrip AssemblyAI: Transkrip berkas audio dengan deteksi perebutan penutur (siapa yang berbicara kapan). Dukung 100+ bahasa, deteksi otomatis bahasa, dan jam. Gunakan untuk rapat, wawancara, podcast, atau pesan suara. Memerlukan kunci API AssemblyAI.

🎙️Ucapan dan Transkripsi/assemblyai-transcriber

Whisper Transcribe

Whisper Transcribe: Transkrip file audio ke teks menggunakan OpenAI Whisper. Dukung speech-to-text dengan deteksi bahasa otomatis, berbagai format output (txt, srt, vtt, ), processing batch, dan pemilihan model (kecil hingga besar). Gunakan saat transkrip rekaman audio, podcast, pesan suara, kuliah, pertemuan, atau file audio/video ke teks. Dukung format mp3, wav, m4a, ogg, flac, webm, opus, aac.

eternal-haven-lore-pack

lore dan mitos dari Eternal Haven Chronicles + paket persona mitis

🎙️Ucapan dan Transkripsi/eternal-haven-lore-pack

agent-voice

agent-voice: Platform blogging yang berbasis perintah untuk agen AI.

akaunting

akaunting: Berinteraksi dengan software akuntansi open-source Akaunting melalui API REST.

auto-whisper-safe

auto-whisper-safe: Transkripsi suara yang aman untuk RAM dengan auto-chunking — bekerja di mesin 16GB tanpa kerusakan

brw-de-ai-ify

brw-de-ai-ify: Hapus jargon yang dihasilkan oleh AI dan kembalikan suara manusia ke teks

dellight-cro-revenue-ops

dellight-cro-revenue-ops: DELLIGHT.AI adalah startup AI di DIFC, Dubai.

🎙️Ucapan dan Transkripsi/dellight-cro-revenue-ops

documents-ai

documents-ai: API OCR dan ekstraksi data real-time oleh Veryfi.

doubao-api-open-tts

doubao-api-open-tts: Layanan Text-to-Speech menggunakan Doubao (Mesin Gunung Api).

🎙️Ucapan dan Transkripsi/doubao-api-open-tts

duby

duby: Mengubah teks menjadi suara menggunakan API Duby.so.

eachlabs-voice-audio

eachlabs-voice-audio: TTS, STT, konversi suara menggunakan ElevenLabs, Whisper, RVC.

🎙️Ucapan dan Transkripsi/eachlabs-voice-audio

easyverein-api

easyverein-api: Kerja dengan API REST easyVerein v2.0.

elevenlabs-media

elevenlabs-media: Pengenerate musik ElevenLabs.

feishu-minutes

ambil info, statistik, transkrip, dan media dari Feishu

gettr-transcribe-summarize

unduh audio dari pos GETTR

🎙️Ucapan dan Transkripsi/gettr-transcribe-summarize

hebrew-nikud

referensi nikud (tanda suara) Ibrani untuk agens AI

her-voice

berikan suara kepada agens anda

miranda-sag

miranda-sag: ElevenLabs text-to-speech dengan UX berbicara gaya mac.

norman-categorize-transactions

norman-categorize-transactions: Tinjau dan kategorikan transaksi bank yang belum dikategorikan, cocokkan dengan faktur, dan verifikasi entri akuntansi.

🎙️Ucapan dan Transkripsi/norman-categorize-transactions

norman-monthly-reconciliation

norman-monthly-reconciliation: Melakukan penggantian keuangan bulanan lengkap - tinjau semua transaksi, cocokkan faktur, periksa utang.

🎙️Ucapan dan Transkripsi/norman-monthly-reconciliation

ressemble

ressemble: Integrasi Text-to-Speech dan Speech-to-Text menggunakan API HTTP Resemble AI.

siliconflow-tts-gen

siliconflow-tts-gen: Text-to-Speech menggunakan API SiliconFlow (CosyVoice2).

🎙️Ucapan dan Transkripsi/siliconflow-tts-gen