হোম/বক্তৃতা এবং প্রতিলিপি
🎙️

বক্তৃতা এবং প্রতিলিপি

(71)
🎖️বৈশিষ্ট্যপূর্ণ
41,621

Mcporter

Mcporter: mcporter CLI-এর মাধ্যমে MCP সার্ভার/টুলগুলোকে সরাসরি তালিকা করা, কনফিগার, অথেন্টিকেশন করা ও কল করা (HTTP বা stdio), অদূর্ঘটনা সার্ভার, কনফিগ সংশোধন, CLI/type জেনারেশন সহ সমস্ত কাজ করা হয়

🎖️বৈশিষ্ট্যপূর্ণ
31,978

OpenClaw YouTube Transcript

OpenClaw YouTube Transcript: yt-dlp-এর মাধ্যমে ভিডিও ইউরি থেকে সরাসরি ক্যাপশন ও সাবটাইটল উদ্ধার করে যুটিবাইট ভিডিওকে টেক্সটে রূপান্তর (শ্রাব্য প্রক্রিয়া ছাড়া)

🎖️বৈশিষ্ট্যপূর্ণ
18,448

Sag

সাগ: এলিভেনল্যাবস টেক্সট-টু-স্পিচ সঙ্গে ম্যাক-স্টাইল সে আইএক্স

🎖️বৈশিষ্ট্যপূর্ণ
15,590

YouTube Transcript

YouTube ট্রান্সক্রিপ্ট: YouTube ভিডিওর ট্রান্সক্রিপ্ট ফেচ করুন এবং সারাংশ করুন। YouTube ভিডিওর সারাংশ, ট্রান্সক্রিপ্ট, বা কনটেন্ট উদ্ধার করার জন্য ব্যবহার করুন। রেজিউডেনশিয়াল IP প্রক্সির মাধ্যমে ট্রান্সক্রিপ্ট ফেচিং করে YouTube-এর ক্লাউড IP ব্লককে চলাচল করে।

Local Whisper

স্থানীয় শুধুমাত্র কথা বলা: OpenAI Whisper-এর মাধ্যমে স্থানীয় কথা-টু-টেক্সট ব্যবহার করা। মডেল ডাউনলোডের পর সম্পূর্ণরূপে অলাভ্য চালানো যায়। বহুসংখ্যক মডেল আকারের উচ্চগুণমান ট্রান্সক্রিপশন।

elevenlabs-voices

elevenlabs-voices: ১৮টি পারসোনা, ৩২টি হাইকোয়ালিটি ভোক্স সিনথেসিস

faster-whisper

ফাস্টার-হিপার স্পিচ-টু-টেক্সট

elevenlabs-tts

elevenlabs-tts: ElevenLabs TTS - ওপেনক্লউ এর জন্য সর্বোত্তম ElevenLabs ইন্টিগ্রেশন

Voice Transcribe

ওয়েব ট্রান্সক্রাইব: ওপেনএআইর গপ্ট-4o-মিনি-ট্রান্সক্রাইব মডেল ব্যবহার করে অডিও ফাইল ট্রান্সক্রাইব করুন। শব্দকোষ সুঝাওয়া এবং টেক্সট রিপ্লেসমেন্ট প্রয়োজন। uv (https://docs.astral.sh/uv/) চালু করুন।

jarvis-voice

জারভিস-ভয়স: টিএসএস এবং ভিস্যুয়াল ট্রান্সক্রিপ্ট স্টাইলিং সহ মেটালিক এআই ভয়স পার্সোনা

kokoro-tts

কোকোরো-টিটিএস: স্থানীয় কোকোরো টিটিএস ইঞ্জিন ব্যবহার করে টেক্সট থেকে কথোপকথন সৃষ্টি

ElevenLabs Speech-to-Text

ElevenLabs স্পিচ-টু-টেক্সট: ElevenLabs স্পিচ-টু-টেক্সট (Scribe v2) ব্যবহার করে অডিও ফাইল ট্রান্সক্রাইব করুন.

Mlx Whisper

Mlx Whisper: স্থানীয় কথা-টু-টেক্সট এমএলএক্স ওয়িস্পার (অ্যাপল সিলিকন অপটাইমাইজড, কোন এপি কী নয়)

Transcribe audio files via OpenRouter using audio-capable models

OpenRouter-এর মাধ্যমে শ্রুতিফাইল ট্রান্সক্রাইব করুন: OpenRouter-এর মাধ্যমে শ্রুতিসম্পন্ন মডেল (জেমিনি, GPT-4o-audio, ইত্যাদি) ব্যবহার করে শ্রুতিফাইল ট্রান্সক্রাইব করুন.

Gemini STT

জেমিনি এসটিটিএম: গুগলের জেমিনি এপিআই বা ভার্টেক্স এআই ব্যবহার করে অডিও ফাইল ট্রান্সক্রাইব করুন

Tts

Tts: __PROTECTED_X__ করে টেক্সট টু স্পিচ কনভার্ট করুন (হুম এআই এপিআই বা ওপেনএআই এপিআই ব্যবহার করুন)। যখন ব্যবহারকারী শুনানোর বাক্য জিজ্ঞাসা করে, বক্তৃতা প্রতিক্রিয়া চায়, বা 'ভিভ ভোক' কিছু শুনতে চায় তখন ব্যবহার করুন।

Local Whisper

স্থানীয় শুধুমাত্র: Telegram এবং WhatsApp-এর জন্য এমএলএক্স শুধুমাত্র ব্যবহার করে মুক্ত স্থানীয় স্পিচ-টু-টেক্সট। গোপন, কোনও API দরকার নেই.

Transcribe

ট্রান্সক্রাইব: স্থানীয় হোয়াইসার (ডকার) ব্যবহার করে অডিও ফাইলগুলোকে টেক্সটে রূপান্তর করুন। কখনও কখনও ভোক্তা বার্তা, অডিও ফাইল (.mp3, .m4a, .ogg, .wav, .webm) পেয়ে থাকার সময় বা অডিও কনটেন্ট রূপান্তর করার অনুরোধ করা হলে ব্যবহার করুন।

assemblyai-transcribe

অ্যাসেম্বলি এআই-এর মাধ্যমে অডিও/ভিডিও ট্রান্সক্রাইব

elevenlabs-agents

elevenlabs-agents: ElevenLabs তৈরি, পরিচালনা, এবং ডিপ্লয়

Local STT (Nvidia Parakeet + Whisper Support)

স্থানীয় STT (Nvidia Parakeet + Whisper Support): বাছয়যোগ্য ব্যাকেন্ড - Parakeet (সর্বোত্তম নিশ্চিততা) বা Whisper (দ্রুততম, বহুভাষিক).

audio-gen

অডিওবুক, পডকাস্ট বা শিক্ষামূলক অডিও কনটেন্ট তৈরি করা

critical-article-writer

স্কিমচা নিবন্ধ এবং সারাংশ তৈরি করুন

audio-reply

TTS ব্যবহার করে অডিও উত্তর তৈরি করা

it will help you to send voice messages to your AI Assistant and also can make it talk

এটি আপনাকে আই অ্যাসিস্ট্যান্টকে আওয়াজ বার্তা পাঠানোর সাহায্য করবে এবং তাকে কথা বলতে সক্ষম করতে পারে: ElevenLabs AI-র টেক্সট-টু-স্পিচ এবং স্পিচ-টু-টেক্সট। যখন ব্যবহারকারী টেক্সটকে স্পিচে রূপান্তরিত করতে, আওয়াজ বার্তা ট্রান্সক্রিপ্ট করতে বা বহুভাষায় আওয়াজের সাথে কাজ করতে চায়, তখন ব্যবহার করুন। উচ্চগুণমান AI আওয়াজ এবং নিষ্পষ্ট ট্রান্সক্রিপ্টশন সমর্থন করে।

elevenlabs-transcribe

elevenlabs-transcribe: ElevenLabs ব্যবহার করে অডিও টু টেক্সট ট্রান্সক্রাইব করুন

Parakeet Stt

পারাকিট এসটিটি: এনভিডিয়া পারাকিট টিডিটি ০.৬বি ভি৩ (ওয়ানএক্স অন সিপিইউ)-এর সাথে স্থানীয় স্পিচ-টু-টেক্সট। হোস্পারের থেকে ৩০গুণ দ্রুত, ২৫টি ভাষা, স্বয়ংক্রিয় পরিচয়ন, ওপেনআই-সমন্বয়মূলক API। অডিও ফাইলগুলির ট্রান্সক্রিপ্টিং, কথা থেকে টেক্সট রূপান্তর, বা ক্লাউড এপিআইসহ স্থানীয়ভাবে আওয়ার্ড রেকর্ডিং প্রক্রিয়াকরণ করার জন্য ব্যবহার করুন.

deepgram

ডিপগ্র্যাম - ডিপগ্র্যাম কথা-টু-টেক্সট কমান্ড-লাইন ইন্টারফেস

announcer

এয়ারপ্লে স্পিকারের মাধ্যমে এয়ারফোইল প্লাস ব্যবহার করে বাড়িতে টেক্সট ঘোষণা করা

Speech To Text

ভাষা থেকে টেক্সট: inference.sh CLI দ্বারা Whisper মডেলস মাধ্যমে অডিওকে টেক্সটে রূপান্তর করুন। মডেলস: Fast Whisper Large V3, Whisper V3 Large। ক্ষমতা: রূপান্তর, অনুবাদ,...

Voice

ভোকস: মাইক্রোসফট এডজের TTS ইঞ্জিন ব্যবহার করে টেক্সট টু স্পিচ কনভার্ট, সমায়িত ভোকস, এবং স্বচ্ছন্দ অস্থায়ী ফাইল পরিষ্কার করা.

addis-assistant-stt

অডিস-অ্যাসিস্ট্যান্ট-এসটিটি: স্পিচ-টু-টেক্সট (এসটিটি) ও টেক্সট প্রদান করে

Pocket Tts

পকেট টিটিএস: ৮টি অন্তর্নিহিত ভোক্তা বা কিউটাইর পকেট টিটিএস মডেলের সাথে কাস্টম ভোক্তা ক্লোনিং ব্যবহার করে CPU-তে অলাভ্য ইংরেজি কথা উৎপন্ন করুন.

inworld-tts

ইনওয়ার্ড-টিটি-এস: Inworld.ai API দ্বারা টেক্সট-টু-স্পিচ

Voicenotes

ভোয়াইসনোটস: ভোয়াইসনোটস.কম থেকে সিঙ্ক এবং এক্সেস ভোয়াইস নটস। যখন ব্যবহারকারী তাদের ভোয়াইস রেকর্ডিং, ট্রান্সক্রিপ্ট, এবং এআই সামর্থ্য সংগ্রহ করতে চায়, এই ব্যবহার করুন। নটস ফেচ করা, মার্কডাউনে সিঙ্ক এবং ট্রান্সক্রিপ্ট সার্চ সমর্থন করে।

claw-voice

কণ্ঠ দিয়ে লাইভ ব্যবহারকারী সেশনে সংযুক্ত হওয়া

Transcribe Audio with Parakeet MLX

Parakeet MLX: অডিও ট্রান্সক্রাইব করুন (এপল সিলিকনের জন্য স্থানীয় স্পিচ-টু-টেক্সট এবং ASR)

clonev

কোকি এক্সটিটিএস ভি২ ব্যবহার করে কোনো কোনো স্বরকে ক্লোন করে কথা উৎপন্ন করুন

cult-of-carcinization

আপনার এজেন্টকে একটি স্বর দিয়ে এবং শ্রুতিশক্তি প্রদান করুন

deepdub-tts

ডিপডাব এবং মিডিয়া হিসাবে সংযুক্ত করে কথা উৎপন্ন করুন

chichi-speech

কুয়েন ৩ ব্যবহার করে উচ্চগুণমান টেক্সট-টু-স্পিচ সার্ভিস

lnbits

এলএনবিটস: এলএনবিটস লাইটনিং ওয়েলেট (ব্যালেন্স, পে, ইনভয়েস ম্যানেজ)

Voicenotes Official

ভয়সনটস অফিসিয়াল: ভয়সনটস দল থেকে এই অফিসিয়াল দক্ষতা OpenClaw এর নতুন API এর অ্যাক্সেস এবং সেম্যান্টিক অনুসন্ধান, সম্পূর্ণ ট্রান্সক্রিপ্ট রিট্রিভ করা, ফিল্টার করা...

tl;dw - YouTube Video Summarizer

tl;dw - YouTube ভিডিও সামরিজার: YouTube ভিডিওর ট্রান্সক্রিপ্ট উদ্ধার করে এবং মূল বিষয়, মতামত এবং নিষ্কর্ষগুলি উপস্থাপন করে, সম্পূর্ণ ভিডিও দেখতে হয় না.

Openai Tts.Bak 2026 01 28T18:01:23+10:30

OpenAI Tts.Bak 2026 01 28T18:01:23+10:30: টেক্সট-টু-স্পিচ ওপেনএআই অডিও স্পিচ এপিআই-র মাধ্যমে

speech-recognition

স্পিচ-রেকগনিশন: সাধারণ স্পিচ পরিচ্ছন্নকারী সক্ষমতা। বিভিন্ন আউডিও ফরম্যাট (ogg/mp3/wav/m4a) সমর্থন করে, সিলিকন বেসিড মোবাইল সেন্সভউইস এপিআই ব্যবহার করে স্পিচ থেকে টেক্সট ট্রান্সক্রিপশন করে। যখন ব্যবহারকারী স্পিচ মেসেজ, আউডিও ফাইল পাঠায় বা আউডিও ট্রান্সক্রিপশন চায়, তখন এটি ট্রিগার হয়।

freshbooks-cli

ফ্রেশবুকস-সিলি: বিল, গ্রাহক, এবং বিলোপক্রম পরিচালনার জন্য ফ্রেশবুকস সিলি

Text To Speech

টেক্সট টু স্পিচ: DIA TTS, Kokoro, Chatterbox এবং আরও সহযোগীদের মাধ্যমে টেক্সটকে স্বাভাবিক কথা পরিবর্তন করুন inferenc.e.sh CLI-র মাধ্যমে। মডেলস: DIA TTS (আলাপচারিতা), Kokoro TTS, Chatterbox, Hig...

AssemblyAI Transcriber

অ্যাসেম্বলিAI ট্রান্সক্রাইবার: স্পিকার ডায়ারিজেশন (কে কবে কথা বলছে) সহ অডিও ফাইল ট্রান্সক্রাইব করুন। 100+ ভাষা, স্বয়ংক্রিয় ভাষা পরিচয়ন, এবং টাইমস্ট্যাম্পস সমর্থন করে। বৈঠক, সাক্ষাৎকার, পডকাস্ট, বা ভোক্স মেসেজ জন্য ব্যবহার করুন। অ্যাসেম্বলিAI API কী প্রয়োজন

Whisper Transcribe

ওপেনএআই ওয়িসপার ব্যবহ���র করে অডিও ফাইল টেক্সটে রূপান্তর। স্পিচ-টু-টেক্সট, স্বয়ংক্রিয় ভাষা পরিবর্তন, বহুবিন্যাস ফরম্যাট (txt, srt, vtt, ), ব্যাচ প্রক্রিয়াকরণ, মডেল বাছাই (ছোট থেকে বড়) সহায়তা করে। অডিও রেকর্ডিং, পডকাস্ট, ভোক্স মেসেজ, লেকচার, বৈঠক, কিংবা কোনো অডিও/ভিডিও ফাইল টেক্সটে রূপান্তরের জন্য ব্যবহার করুন। mp3, wav, m4a, ogg, flac, webm, opus, aac ফরম্যাটস সমর্থন করে।

eternal-haven-lore-pack

অবসাদী হ্যাভেন ক্রোনিকলস লোর প্যাক

agent-voice

এজেন্ট-ভয়েস: এআই এজেন্টদের জন্য কমান্ড-লাইন ব্লগিং প্ল্যাটফর্ম

akaunting

অকাউন্টিং: আরএসএইচ এপি দ্বারা অকাউন্টিং সফটওয়্যার অকাউন্টিং সফটওয়্যারের সাথে আলোচনা করুন

auto-whisper-safe

অটো-চাঙ্কিং সহযোগে RAM-সুরক্ষিত ভোক্তা ট্রান্সক্রাইব — 16GB মেশিনেও ব্যাক্সিং না হয়ে কাজ করে

brw-de-ai-ify

এআই-জর্জর সরানো এবং মানবীয় কণ্ঠকে টেক্সটে ফিরিয়ে দেওয়া

dellight-cro-revenue-ops

ডিফক, দুবাইতে একটি এআই স্টার্টআপ হিসাবে ডেললাইগ্হ্ট এআই

documents-ai

ভেরিফাই দ্বারা রিয়্যাল-টাইম ওসিআরসি এবং ডাটা এক্সট্রাকশন এপিআই

doubao-api-open-tts

ডৌবাও (ভলক্যানো ইঞ্জিন) ব্যবহার করে টেক্সট-টু-স্পিচ সার্ভিস

duby

ডাবি: ডাবি.so API ব্যবহার করে টেক্সট টু স্পিচ কনভার্ট করুন

eachlabs-voice-audio

eachlabs-voice-audio: TTS, STT, ভোক্স কনভার্ট ইলিভেনল্যাবস, হোয়েস, RVC ব্যবহার করুন

easyverein-api

easyverein-api: easyVerein v2.0 REST API-এর সাথে কাজ করুন

elevenlabs-media

elevenlabs-media: ElevenLabs সঙ্গীত সৃষ্টি

feishu-minutes

ফেইশু-মিনিটস: ফেইশু থেকে তথ্য, পরিসংখ্যান, ট্রান্সক্রিপ্ট, এবং মিডিয়া ফেচ করুন

gettr-transcribe-summarize

গেটট্র-ট্রান্সক্রাইব-সামারাইজ: GETTR পোস্ট থেকে অডিও ডাউনলোড করুন

hebrew-nikud

হিব্রু-নিকুদ: এআই এজেন্টদের জন্য হিব্রু নিকুদ (ব্যঞ্জনা নিদর্শন) রেফারেন্স

her-voice

হার-ভোয়স: আপনার এজেন্টকে একটি আওয়াজ দিন

miranda-sag

মিরান্ডা-স্যাগ: ম্যাক-স্টাইল সেই এক্স-ইউ সহ এলভেনল্যাবস টেক্সট-টু-স্পিচ

norman-categorize-transactions

নরমান-ক্যাটাগরাইজ-ট্রানসকশনস: অসংগঠিত ব্যাঙ্ক লেনদেনগুলি পর্যালোচনা করে, তাদের ইনভয়েসের সাথে ম্যাচ করে, লেখবন্ধন এন্ট্রিগুলি পরীক্ষা করে

norman-monthly-reconciliation

নরমান-মাসিক-রিকন্সিলিয়েশন: সম্পূর্ণ মাসিক আর্থিক রিকন্সিলিয়েশন করুন - সমস্ত লেনদেনগুলি পর্যালোচনা করুন, ইনভয়েসগুলির সাথে ম্যাচ করুন, বাকি চেক করুন

ressemble

রেসম্বল: রেসম্বল এআই এইচটিএম এপিআই ব্যবহার করে টেক্সট-টু-স্পিচ এবং স্পিচ-টু-টেক্সট ইন্টিগ্রেশন

siliconflow-tts-gen

সিলিকনফ্লো-টিটিএস-জেন: সিলিকনফ্লো এপিআই (কসি ভয়স ২) ব্যবহার করে টেক্সট-টু-স্পিচ