Загрузка...
Загрузка...
AI для аудио: транскрипция речи (Whisper, AssemblyAI, Deepgram), синтез голоса (ElevenLabs, OpenAI TTS, Cartesia), генерация музыки (Suno, Udio).
В каталоге: 13 серверов.
Транскрипция через Whisper — самый частый use-case: meeting-запись → текстовый протокол → саммари → задачи в трекер. Все серверы поддерживают timestamps и speaker-diarization (определение кто говорит) — полезно для интервью и подкастов. Синтез голоса через ElevenLabs или OpenAI TTS дошёл до уровня, неотличимого от человеческого, что используется для озвучки лекций, аудиокниг, IVR-роботов. ElevenLabs Voice Cloning позволяет клонировать голос по 1-минутной выборке — но обращение с этой технологией требует осторожности и юридического согласия. Музыкальные серверы (Suno, Udio) — экспериментальные: текст → 30-секундный трек, для джинглов / прототипов / контента в TikTok.
gpu-bridge-mcp-server ☁️ 🪟 - Unified GPU inference API with 30
MCP Telephony server for automating voice calls with Speech-to-Text and Speech Recognition to summarize call conversations. Send and receive SMS, detect voicemail, and integrate with Vonage APIs for a
Spix-HQ/spix-mcp ☁️ - Give AI agents a real phone number and voice. Make ou
AceDataCloud/MCPSuno ☁️ - Suno AI music generation, lyrics, covers,
transloadit/node-sdk ☁️ 🪟 - Agent-native media processing via Tr
Generate high-quality text-to-speech and text-to-voice outputs using the DAISYS platform and make it able to play and store audio generated
brainiall-mcp-server ☁️ - AI-powered speech t
MCP Server that uses the open weight Kokoro TTS models to convert text-to-speech. Can convert text to MP3 on a local driver or auto-upload to an S3 bucket
This service provides fast and reliable transcriptions for audio/video files and voice memos. It allows LLMs to interact with the text content of audio/video file
MCP server plugin for Claude Code that converts text to speech using OpenAI's TTS API. Features 6 voices, worker pool architecture, mutex-protected playback, and cross-platform support
An MCP server that installs other MCP servers for you
sats4ai ☁️ - Bitcoin-powered AI tools via Lightning Network micropaymen
Let the agent speak things out loud, notify you when he's done working with a quick summary