Inicio/Voz y transcripción
🎙️

Voz y transcripción

(46)
🎖️Destacado
29,391

OpenClaw YouTube Transcript

Transcripción de videos de YouTube a texto mediante la extracción de subtítulos directamente desde la URL del video usando yt-dlp sin procesamiento de audio.

🎙️Voz y transcripción/openclaw-youtube-transcript
🎖️Destacado
28,587

Mcporter

Mcporter: Utiliza el CLI de mcporter para listar, configurar, autenticar y llamar servidores/herramientas MCP directamente (HTTP o stdio), incluyendo servidores ad-hoc, ediciones de configuración y generación de CLI/tipo.

Sag

Sag: once ElevenLabs text-to-speech con UX de estilo mac.

addis-assistant-stt

Proporciona Speech-to-Text (STT) y texto.

🎙️Voz y transcripción/addis-assistant-stt

agent-voice

Plataforma de blogging en línea de línea de comandos para agentes de IA.

akaunting

Interactúa con el software de contabilidad de código abierto Akaunting a través de la API REST.

announcer

Anunciar texto a través de los altavoces AirPlay utilizando Airfoil +

assemblyai-transcribe

Transcribir audio/video con AssemblyAI

🎙️Voz y transcripción/assemblyai-transcribe

audio-gen

Generar audiolibros, podcasts o contenido audio educativo

audio-reply

Generar respuestas en audio utilizando TTS

🎙️Voz y transcripción/audio-reply-skill

auto-whisper-safe

Transcripción de voz segura para RAM con auto-chunking — funciona en máquinas de 16GB sin errores

🎙️Voz y transcripción/auto-whisper-safe

brw-de-ai-ify

Eliminar jerga generada por IA y restaurar la voz humana al texto

chichi-speech

Servicio RESTful para texto a voz de alta calidad utilizando Qwen3

claw-voice

Conectado a una sesión de usuario en vivo a través de voz

clonev

Clonar cualquier voz y generar habla utilizando Coqui XTTS v2.

critical-article-writer

Generar artículos de borrador y resúmenes.

🎙️Voz y transcripción/critical-article-writer

cult-of-carcinization

Dar voz y oídos a tu agente.

🎙️Voz y transcripción/cult-of-carcinization

deepdub-tts

Generar audio de habla utilizando Deepdub y adjuntarlo como MEDIO.

deepgram

Interfaz de línea de comandos para Deepgram (transcripción de voz a texto).

dellight-cro-revenue-ops

DELLIGHT.AI es una empresa emergente de IA en DIFC, Dubai.

🎙️Voz y transcripción/dellight-cro-revenue-ops

documents-ai

API de OCR en tiempo real y extracción de datos por Veryfi.

doubao-api-open-tts

Servicio de Texto a Voz utilizando Doubao (Motor Volcán).

🎙️Voz y transcripción/doubao-api-open-tts

duby

Convertir texto en voz utilizando la API Duby.so.

eachlabs-voice-audio

TTS, STT, conversión de voz utilizando ElevenLabs, Whisper, RVC.

🎙️Voz y transcripción/eachlabs-voice-audio

easyverein-api

Trabajar con la API REST v2.0 de easyVerein.

elevenlabs-agents

Crear, gestionar y desplegar ElevenLabs.

🎙️Voz y transcripción/elevenlabs-agents

elevenlabs-media

Generación de música con ElevenLabs.

elevenlabs-transcribe

Transcripción de audio a texto utilizando ElevenLabs.

🎙️Voz y transcripción/elevenlabs-transcribe

elevenlabs-tts

TTS de ElevenLabs - la mejor integración de ElevenLabs para OpenClaw.

elevenlabs-voices

Síntesis de voz de alta calidad con 18 personalidades, 32.

🎙️Voz y transcripción/elevenlabs-voices

eternal-haven-lore-pack

Packe de lore de Eternal Haven + packe mitológico.

🎙️Voz y transcripción/eternal-haven-lore-pack

faster-whisper

Habla local usando faster-whisper.

feishu-minutes

Obtener información, estadísticas, transcripción y medios de Feishu.

freshbooks-cli

CLI de FreshBooks para gestionar facturas, clientes y facturación.

gettr-transcribe-summarize

Descargar audio de un post en GETTR.

🎙️Voz y transcripción/gettr-transcribe-summarize

hebrew-nikud

Referencia de nikud (puntos vocálicos) hebreos para agentes de IA.

her-voice

Dale voz a tu agente.

inworld-tts

Texto a voz a través de la API de Inworld.ai.

jarvis-voice

Voz de IA metálica con TTS y estilo de transcripción visual

kokoro-tts

Genera audio hablado a partir de texto utilizando el motor local Kokoro TTS

lnbits

Gestión de la billetera Lightning LNbits (Saldo, Pagar, Factura)

miranda-sag

Text-to-Speech de ElevenLabs con UX de decir estilo mac

norman-categorize-transactions

Revisión y categorización de transacciones bancarias sin clasificar, coincidencia con facturas y verificación de entradas contables

🎙️Voz y transcripción/norman-categorize-transactions

norman-monthly-reconciliation

Realización de una reconciliación financiera mensual completa - revisión de todas las transacciones, coincidencia de facturas, verificación de saldos pendientes

🎙️Voz y transcripción/norman-monthly-reconciliation

ressemble

Integración de Text-to-Speech y Speech-to-Text utilizando la API HTTP de Resemble AI

siliconflow-tts-gen

Text-to-Speech utilizando la API SiliconFlow (CosyVoice2)

🎙️Voz y transcripción/siliconflow-tts-gen