Какие модели работают с синтезом речи и переводом на лету?
Платформы типа OpenAI (API voice mode), Anthropic (Claude с экспериментальными расширениями), Google (Gemini с Google Meet) поддерживают компоненты этого конвейера. В составе используются отдельные модули: speech-to-text (Whisper-подобные), машинный перевод (мультиязычные кодеры вроде mT5), text-to-speech синтезаторы. Они соединяются в приложениях третьих сторон (Zoom, Discord). Однако полный end-to-end синтез + перевод + вывод в микрофон доступен пока только через API либо альфа-версии.