Ana Sayfa/Konuşma ve Transkripsiyon
🎙️

Konuşma ve Transkripsiyon

(71)
🎖️Öne Çıkan
41,621

Mcporter

Mcporter: mcporter CLI kullanarak MCP sunucularını/araçlarını listeleme, yapılandırma, otentikasyon ve doğrudan çağırma (HTTP veya stdio), anlık sunucular, yapılandırma düzenlemeleri ve CLI/türü oluşturma dahil.

🎖️Öne Çıkan
31,978

OpenClaw YouTube Transcript

OpenClaw YouTube Transkripti: yt-dlp kullanarak YouTube videolarını metne dönüştürmek için doğrudan video URL'sinden altyazıları ve alttyazıları çıkarır (ses işleme gerekmez).

🎙️Konuşma ve Transkripsiyon/openclaw-youtube-transcript
🎖️Öne Çıkan
18,448

Sag

Sag: ElevenLabs text-to-speech ile mac-style konuşma UX'si.

🎖️Öne Çıkan
15,590

YouTube Transcript

YouTube Altyazısı: YouTube video altyazılarını getir ve özetle. Altyazı özetleme, transkripsiyon veya YouTube videolarından içerik çıkarma talep edildiğinde kullanın. Altyazı çekme için ev IP proxy'si kullanarak YouTube'un bulut IP engellerini atlar.

Local Whisper

Yerel Sanki: OpenAI Whisper kullanılarak yerel konuşma-dil metni dönüşümü. Model indirildikten sonra tamamen çevrimdışı çalışır. Çoklu model boyutları ile yüksek kaliteli transkripsiyon.

elevenlabs-voices

18 kişilik, 32'ye varan kaliteli ses sentezi

faster-whisper

Faster-whisper kullanarak yerel konuşma-dil yazılımı

elevenlabs-tts

ElevenLabs TTS - OpenClaw için en iyi ElevenLabs entegrasyonu

Voice Transcribe

Ses Transkribe: OpenAI'nin gpt-4o-mini-transcribe modeli kullanılarak, kelime önerileri ve metin değişiklikleri ile ses dosyalarını transkribe et. uv (https://docs.astral.sh/uv/) gerektirir.

jarvis-voice

Metalik AI ses kişiliği ile TTS ve görsel transkript stilleri

kokoro-tts

Yerel Kokoro TTS motorunu kullanarak metinten ses oluşturma

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text: Ses dosyalarını ElevenLabs Speech-to-Text (Scribe v2) kullanarak transkribe et.

Mlx Whisper

Mlx Whisper: Yerel konuşma-dil metni ile MLX Whisper (Apple Silicon optimize edilmiş, API anahtarı gerekmez).

Transcribe audio files via OpenRouter using audio-capable models

OpenRouter kullanarak sesli modeller (Gemini, GPT-4o-audio vb.) ile ses dosyalarını kaydet

🎙️Konuşma ve Transkripsiyon/openrouter-transcribe

Gemini STT

Gemini STT: Google'ın Gemini API'si veya Vertex AI kullanarak ses dosyalarını transkribe et

Tts

Metinleri Hume AI (veya OpenAI) API kullanarak sesli mesaja dönüştür. Kullanıcı sesli bir mesaj, sesli yanıt talep ettiğinde veya 'vive voix' ifadesini duyduğunda kullanılır.

Local Whisper

Yerel Sese Dönüş: Apple Silicon üzerinde MLX Whisper kullanarak Telegram ve WhatsApp için ücretsiz yerel konuşma metne d��nüştürme. Gizli, API maliyeti yok.

Transcribe

Ses dosyalarını metne dönüştür: Yerel Whisper (Docker) kullanarak ses dosyalarını metne dönüştür. Ses mesajları alındığında, ses dosyaları (.mp3, .m4a, .ogg, .wav, .webm) veya ses içeriğini transkribe edilmesi istendiğinde kullanılır.

assemblyai-transcribe

AssemblyAI ile ses/video kaydedin.

🎙️Konuşma ve Transkripsiyon/assemblyai-transcribe

elevenlabs-agents

ElevenLabs'ı oluşturma, yönetme ve dağıtma

Local STT (Nvidia Parakeet + Whisper Support)

Yerel STT (Nvidia Parakeet + Whisper Destek): Seçilebilir arka uçlar - Parakeet (en iyi doğruluk) veya Whisper (en hızlı, çok dilli).

audio-gen

Audiobook, podcast veya eğitim amaçlı ses içerikleri oluşturun.

critical-article-writer

Taslak makaleler ve özetler oluşturun.

🎙️Konuşma ve Transkripsiyon/critical-article-writer

audio-reply

TTS kullanarak ses yanıtları oluşturun.

it will help you to send voice messages to your AI Assistant and also can make it talk

Kullanıcının metni sesli mesajlara dönüştürmek, ses mesajlarını transkribe etmek veya çok dilli sesle çalışmak istediğinde kullanılır: ElevenLabs AI kullanarak Metin-Ses ve Ses-Metin. Yüksek kaliteli AI sesleri ve doğru transkript destekler.

elevenlabs-transcribe

ElevenLabs kullanarak sesi metne dönüştürme

🎙️Konuşma ve Transkripsiyon/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt: Yerel konuşma-dil yazısı ile NVIDIA Parakeet TDT 0.6B v3 (ONNX CPU üzerinde). Whisper'dan 30 kat daha hızlı, 25 dil, otomatik tanıma, OpenAI uyumlu API. Ses dosyalarını transkribe etmek, konuşmayı metne dönüştürmek veya cloud API'leri olmadan yerel olarak ses kayıtlarını işlemek için kullanın.

deepgram

Deepgram'ın komut satırı arayüzü için Deepgram konuşma tanıma aracılığıyla.

announcer

Ev boyunca AirPlay hoparlörleri kullanarak Airfoil + ile metin duyurun.

Speech To Text

Ses'i Metne Çevir: inference.sh CLI aracılığıyla Whisper modelleri ile sesi metne dönüştür. Modeller: Fast Whisper Large V3, Whisper V3 Large. Yetenekler: transkripsiyon, çeviri,...

Voice

Ses: Microsoft Edge'in TTS motorunu kullanarak ��zelleştirilebilir seslerle metni sesli oku, doğrudan oynat ve geçici dosya temizleme yap.

addis-assistant-stt

Konuşma'dan Metin (STT) ve metin sağlar

Pocket Tts

CPU kullanarak 8 yerleşik ses veya Kyutai'nın Pocket TTS modeli ile özelleştirilmiş ses klonlama ile ofline yüksek kaliteli İngilizce konuşma oluşturma

inworld-tts

Inworld.ai API'si üzerinden metin-ses dönüşümü

Voicenotes

Voicenotes: Voicenotes.com'dan ses notlarına eşitlemeyi ve erişmeyi sağlar. Kullanıcı ses kayıtlarını, transkriplerini ve AI özetlerini Voicenotes'tan almak istediğinde kullanılır. Notları çekme, markdown'a eşitleme ve transkriplerde arama destekler.

claw-voice

Ses yoluyla canlı kullanıcı oturumuna bağlanıyorsunuz.

Transcribe Audio with Parakeet MLX

Parakeet MLX ile Ses Kaydını Yazıya Dönüştür: Apple Silicon için Parakeet MLX (ASR) ile yerel konuşma-dil yazısı (yani API anahtarı gerekmez).

clonev

Coqui XTTS v2 kullanarak herhangi bir sesi klonlayın ve konuşma oluşturun.

cult-of-carcinization

Aracınıza bir ses ve kulak verin.

🎙️Konuşma ve Transkripsiyon/cult-of-carcinization

deepdub-tts

Deepdub kullanarak konuşma sesi oluşturun ve MEDYA olarak ekleyin.

chichi-speech

Qwen3 kullanarak yüksek kaliteli metin-ses dönüşümü için bir RESTful hizmeti olan Chichi-Speech.

lnbits

LNbits Lightning Cüzdanı (Bakiye, Ödeme, Fatura Yönetimi)

Voicenotes Official

Voicenotes Official: Bu Voicenotes ekibinden gelen resmi beceri, OpenClaw'a yeni API'ler erişimi ve semantik olarak arama yapma, tam metinleri alma, t... tarafından filtreleme yeteneği sağlar.

tl;dw - YouTube Video Summarizer

YouTube Video Özeti: YouTube video transkripsiyonlarını çıkarır ve tam videoyu izlemeksizin ana noktaları, argümanları ve sonuçları vurgulayan özetler sunar.

Openai Tts.Bak 2026 01 28T18:01:23+10:30

OpenAI Sesli Konuşma API'si aracılığıyla metin-leşir (Text-to-speech)

🎙️Konuşma ve Transkripsiyon/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

Genel Ses Tanıma Skilli. Çeşitli ses formatlarını (ogg/mp3/wav/m4a) destekler, sesi metne dönüştürmek için SenseVoice API'yi kullanır. Kullanıcı ses mesajı gönderdiğinde, ses dosyası gönderdiğinde veya sesi transkribe etme ihtiyacı olduğunda tetiklenir.

freshbooks-cli

Fatura, müşteri ve faturalandırma yönetimi için FreshBooks CLI

Text To Speech

Metin Sözlüye Çevirme: inference.sh CLI üzerinden DIA TTS, Kokoro, Chatterbox ve daha fazlası ile metni doğal konuşmaya dönüştür. Modeller: DIA TTS (konuşmacı), Kokoro TTS, Chatterbox, Hig...

AssemblyAI Transcriber

AssemblyAI Transcriber: Ses dosyalarını konuşan kimin konuştuğunu belirleyerek (kim ne zaman konuşuyor) transkribe eder. 100'den fazla dili destekler, otomatik dil tespiti ve zaman etiketleri içerir. Toplantılar, röportajlar, podcast'ler veya ses mesajları için kullanılır. AssemblyAI API anahtarı gerektirir.

🎙️Konuşma ve Transkripsiyon/assemblyai-transcriber

Whisper Transcribe

OpenAI Whisper kullanarak ses dosyalarını metne dönüştürme. Otomatik dil tespiti, çoklu çıktı formatları (txt, srt, vtt, ), toplu işleme ve model seçimi (küçükten büyüğe) destekler. Ses kayıtları, podcast'ler, ses mesajları, konferanslar, toplantılar veya herhangi bir ses/video dosyasını metne dönüştürmek için kullanılır. Mp3, wav, m4a, ogg, flac, webm, opus, aac formatlarını destekler.

eternal-haven-lore-pack

Eternal Haven Kronikleri efsane pack'ı + mitolojik persona pack'ı

🎙️Konuşma ve Transkripsiyon/eternal-haven-lore-pack

agent-voice

AI ajansları için komut satırı blog platformu

akaunting

REST API aracılığıyla Akaunting açık kaynak hesap yazılımıyla etkileşimde bulun

auto-whisper-safe

RAM-güvenli ses transkripsiyonu ile otomatik parçalama — çökme olmadan 16GB makinada çalışır.

brw-de-ai-ify

AI tarafından oluşturulan jargonu kaldırın ve insan sesini metne geri getirin.

dellight-cro-revenue-ops

DELLIGHT.AI, Dubai'deki DIFC'de bulunan bir AI start-up'tır.

🎙️Konuşma ve Transkripsiyon/dellight-cro-revenue-ops

documents-ai

Veryfi tarafından sağlanan gerçek zamanlı OCR ve veri çıkarma API'si.

doubao-api-open-tts

Doubao (Volcano Engine) kullanarak metinten ses hizmeti sunan Doubao API'si.

duby

Duby.so API kullanarak metni sese dönüştürme

eachlabs-voice-audio

ElevenLabs, Whisper ve RVC kullanarak TTS, STT ve ses dönüşümü

easyverein-api

easyVerein v2.0 REST API ile çalışma

elevenlabs-media

ElevenLabs müzik oluşturma

feishu-minutes

Feishu'dan bilgi, istatistikler, transkript ve medya çekin

gettr-transcribe-summarize

GETTR gönderisinden ses indirin

🎙️Konuşma ve Transkripsiyon/gettr-transcribe-summarize

hebrew-nikud

AI ajansları için İbranice nikud (harf noktaları) referansı

her-voice

Aracınıza ses verin

miranda-sag

Mac tarzı UX ile ElevenLabs metinten ses (text-to-speech)

norman-categorize-transactions

Kategorize edilmemiş banka işlemlerini gözden geçir ve kategorize et, faturalarla eşleştir ve muhasebe girişlerini doğrula

🎙️Konuşma ve Transkripsiyon/norman-categorize-transactions

norman-monthly-reconciliation

Tam aylık mali dengeleme gerçekleştir - tüm işlemleri gözden geçir, faturaları eşleştir, açıkları kontrol et

🎙️Konuşma ve Transkripsiyon/norman-monthly-reconciliation

ressemble

Resemble AI HTTP API kullanarak Metinten Ses ve Sesten Metin entegrasyonu

siliconflow-tts-gen

SiliconFlow API (CosyVoice2) kullanarak Metinten Ses (Text-to-Speech)