Перейти к основному содержанию
Обложка: 4 уровня голосового ввода для работы с ИИ
ИИ-гайды

4 уровня голосового ввода для работы с ИИ

💡 О чём гайд
Гайд раскрывает 4 уровня голосового ввода для работы с AI. Речь (150 слов/мин) значительно превосходит скорость печати (25-60 слов/мин). Системная диктовка работает везде, но требует проговаривания знаков препинания. Voice Mode позволяет диалоговать голосом, но прерывается на паузе. AI-диктовка в чате (уровень 3) — основной инструмент для длинных промтов на телефоне с отличной пунктуацией. Сторонние приложения (Super Whisper, WhisperFlow) — must-have для десктопа.
📢 Больше разборов — в канале «ИИ для чайников»

Самое большое собрание ИИ-гайдов в рунете

Каждый день — новый разбор. Забирай полностью и применяй.

Скорость речи 150 слов/мин против 25-60 слов/мин печати
Уровень 1: системная диктовка (встроенная, везде, нужно говорить знаки препинания)
Уровень 2: Voice Mode (живой диалог, но обрывается на паузе, в Claude не понимает русский)
Уровень 3: AI-диктовка в чате (отличное распознавание, на десктопе только ChatGPT)
Уровень 4: сторонние приложения (Super Whisper, работают везде, локальные модели ~500 МБ)
Переход на диктовку требует привычки, но результат несоизмеримо выше ручной правки

Уровень 1. Системная диктовка

Встроенная функция операционной системы (iOS, Android, Windows, macOS).

Как работает: Значок микрофона на виртуальной клавиатуре или клавиша F5 на Mac.

Плюсы:

  • Бесплатна
  • Работает везде
  • Не требует настройки

Минусы:

  • Нужно проговаривать знаки препинания («запятая», «точка»)
  • Плохо справляется с иностранными словами

Идеальная задача: Быстро что-то записать, когда под рукой нет других инструментов.

Уровень 2. Voice Mode

Режим живого диалога с AI, как с человеком. Есть в ChatGPT, Gemini и Claude.

Как работает: Нажать иконку в приложении и начать говорить. AI отвечает голосом.

Важная особенность: AI начинает отвечать после паузы в речи, поэтому длинные промпты надиктовать не получится.

Идеальные сценарии: Короткие диалоги на ходу — на кухне, в машине, на прогулке.

Проблема в Claude: Не понимает русскую речь в этом режиме (Push-to-Talk).

Уровень 3. AI-диктовка в чате

Диктовка длинных промтов прямо в окне ввода текста в мобильном приложении.

Как работает: Значок микрофона в строке ввода в приложениях Claude, ChatGPT, Gemini.

Преимущества:

  • Отличное распознавание с правильной пунктуацией
  • Подходит для больших текстов

Главный нюанс: На десктопе эта функция есть только у ChatGPT в веб-версии. В десктопном Claude и веб-версии Gemini её нет или она работает с ограничениями.

Основная рабочая лошадка: Для создания длинных промтов с телефона.

Уровень 4. Сторонние приложения

Отдельные программы для голосового ввода, работающие в любой строке на компьютере.

Примеры: Super Whisper, WhisperFlow, Voice Link, A

Примеры: Super Whisper, WhisperFlow, Voice Link, Aqua Voice.

Ключевое преимущество: Работают везде, где можно п

Ключевое преимущество: Работают везде, где можно поставить курсор (браузер, Word, Excel), особенно там, где нет встроенной кнопки диктовки.

Как работает: Нажал горячую клавишу → наговорил те

Как работает: Нажал горячую клавишу → наговорил текст → он появился в активном поле. Отличное распознавание с правильной пунктуацией и иностранными словами.

Модели: Часто используют локальные модели (например, ~500 МБ в Super Whisper), что обеспечивает приватность и скорость.

Сравнительная таблица поддержки Claude / ChatGPT / Gemini

Уровень / AIClaudeChatGPTGemini
1. СистемнаяВездеВездеВезде
2. Voice ModeНе понимает русскийОбрывает на паузеОбрывает на паузе
3. В чате (мобильная)ЕстьС ограничениями в веб
3. В чате (веб/ПК)НетЛучше всехЕсть, но с ограничениями
4. ПриложенияРаботают поверх всехРаботают поверх всехРаботают поверх всех

Личный опыт и советы

Переход требует привычки. Сначала неловко, мысли путаются (как при начале съёмок на камеру), но это быстро проходит.

Рабочий процесс: Можно диктовать сценарии, а затем вслух проверять и править ответы AI, как учитель — работу ученика. Это несоизмеримо быстрее ручной правки.

Диктовка в публичных местах становится нормой (как разговор по телефону). Для конфиденциальности уже появляются специальные маски (Hushme, Tadgh), скрывающие речь от окружающих.

Понравился разбор?

В канале «ИИ для чайников» — новый гайд каждый день

Перейти в канал

Голосовой ввод — неизбежный следующий уровень взаимодействия с технологиями. Если вы активно используете AI, переход с клавиатуры на диктовку — вопрос времени, и лучше сделать этот шаг раньше.

Часто задаваемые вопросы

Начните с уровня 1 (системная диктовка) — она встроена везде и не требует настройки. Если системная вас разочарует (много знаков препинания), переходите на уровень 3 (AI-диктовка в чате) для мобильного или уровень 4 (сторонние приложения вроде Super Whisper) для десктопа.
Это техническое ограничение: Voice Mode в Claude использует встроенную систему распознавания речи, которая плохо натренирована на русском языке. ChatGPT и Gemini работают лучше. Для русского используйте AI-диктовку в чате (уровень 3) или сторонние приложения (уровень 4).
Стоимость приложений варьируется: Super Whisper доступен как подписка (~$12/месяц). Многие альтернативы (WhisperFlow, Voice Link) также требуют платеж за функцию. Однако они окупаются за счёт ускорения работы в 3 раза против печати.
Диктовка в публичных местах становится нормой (как разговор по телефону), но для конфиденциальности уже появляются специальные маски (Hushme, Tadgh), скрывающие речь от окружающих. Выбор за вами: либо не бояться, либо использовать такие устройства.

Скачать гайд

Полная версия с примерами и подробными инструкциями.

📢 ИИ для чайников