Идеи

15 инструментов для озвучки текста

В блоге Unisender мы разбирали, как превратить устную речь в письменный текст. Но бывает наоборот — надо озвучить то, что написано. Например, чтобы создать аудиосопровождение для курса, записать подкаст или аудиокнигу, добавить голосовые подсказки в мобильные приложения.

Раньше для этого требовалось участие человека. Сейчас необязательно искать профессионального диктора или записывать свой голос, если нужно что-то озвучить. На фоне развития Text-to-Speech технологий общедоступными стали синтезаторы речи.

Расскажу, какие есть инструменты для озвучки текста и как ими пользоваться.

 

Название Тип Скачивание записи в аудиоформате Наличие бесплатной версии
Text-to-Speech Онлайн-сервис Да Да
Oddcast Онлайн-сервис Нет Да
2уха Онлайн-сервис Да Да
Voicemaker Онлайн-сервис Да Да
Apihost Онлайн-сервис Да Да
Text to Speech Online Онлайн-сервис Да Да
Texttospeech.ru Онлайн-сервис Да Да
VoxWorker Онлайн-сервис Да Да
Retell Сервис интеграции для сайтов Условно да, при потоковой обработке Тестовый период после регистрации
Yandex SpeechKit Сервис для чтения текста вслух Нет Да
Talk Free Приложение для Android Да Да
Text to Speech Приложение для ioS Да Да
Narakeet
Онлайн-сервис Да Да
NaturalReader Онлайн-сервис

Мобильные и настольные приложения

Да, на платном тарифе Демо-доступ
Microsoft Word Мобильные и настольные приложения Нет Да
Google Docs Онлайн-сервис Нет Да

Text-to-Speech 

Бесплатный онлайн-сервис помогает преобразовать в аудио текст объёмом меньше 500 символов. Text-to-Speech поддерживает 15 языков. На русском есть 2 женских голоса, которые звучат роботизировано. А в некоторых словах неверно ставится ударение. В целом создаётся впечатление, что текст читает женщина-иностранка.

Интерфейс Text-to-Speech

Для преобразования текста в голос достаточно нескольких секунд. Есть настройка скорости воспроизведения. Аудиозапись можно прослушивать неограниченное число раз. Чтобы сохранить результат, откройте контекстное меню и кликните «Сохранить аудио как». Запись сохранится в формате WAV.

Oddcast 

Онлайн-сервис позволяет озвучить до 600 символов за один раз. Среди 32 языков есть русский с выбором из трёх голосов — одного мужского и двух женских. Интересная фишка сервиса — можно добавить эффекты озвучки: скорость, эхо, реверберацию и другие. Визуально Oddcast привлекает тем, что текст зачитывает анимированный диктор, причём с помощью рандомайзера можно даже изменить его внешность.

Интерфейс Oddcast

Для профессионального использования сервис предлагает воспользоваться онлайн-API. С его помощью можно включить речь в любом онлайн- или мобильном приложении. После регистрации доступна 15-дневная бесплатная версия, дальше оплата взимается по факту использования. Минимальный платёж начинается от $99,50 — этого хватает на 40 000 минут аудиозаписи. Но из России оплатить не получится, проще пользоваться 15-дневной версией.

2уха 

Российский бесплатный сервис с довольно старомодным интерфейсом, и посредственной озвучкой: голос получается тихим и сильно роботизированным. Чтобы запустить перевод текста в голос, нужно загрузить исходный файл или написать текст в специальном поле. Можно настроить звучание: выбрать мужской или женский голос, изменить высоту тона и громкость, указать нужный формат файла на выходе (MP3 или AWB), озвучить знаки препинания. Также сервис позволяет указывать ударение при произношении — для этого нужно проставить знак «+» перед ударным слогом.

Интерфейс 2уха

Без регистрации можно обработать файл до 100 КБ. После регистрации доступна конвертация файлов размером больше 100 MБ и сохранение истории загрузок.

Apihost

В этом российском сервисе доступно огромное количество голосов — только в демо-версии их 16. Доступны женские и мужские голоса. Есть настройки, которые позволяют добиться максимально естественного звучания: обозначение ударения и пауз, настройка скорости речи и длины пауз, высоты голоса и даже интонации. Синтезированный голос очень похож на речь живого человека в разделах V3, V4 и V5. Результат можно скачать в формате MP3 или WAV.

Интерфейс Voicemaker

Владельцы сервиса не запрещают использовать результаты бесплатной озвучки в коммерческих целях, но не дают правовых гарантий. Кроме того, ограничен доступный объём текста для озвучки. На платном тарифе стоимость 1 000 символов варьируется в пределах 0,6 – 6,5 рублей. Есть безлимитный тариф от 5000 ₽/месяц.

Text to Speech Online 

Полностью бесплатный онлайн-инструмент, который позволяет конвертировать текст в голос и скачивать результат в MP3. Сервис поддерживает русский язык и предлагает выбор из 23 возможных голосов. Также можно изменить скорость или добавить эмоции в текст.

Интерфейс Text to Speech Online

Речь, синтезированная в Text to Speech Online, звучит с естественной интонацией и правильным произношением. Хоть по голосу и понятно, что текст читает робот. Минус сервиса: максимальный объём для единовременной озвучки — всего 2 000 символов. Поэтому большие тексты придётся озвучивать частями.

Texttospeech.ru

Российский онлайн-синтезатор речи с большим количеством голосов и демо-доступом. Бесплатно можно озвучить до 1 000 символов. Результат скачивается в формате MP3 или WAV. Есть настройки скорости и тона голоса. Есть настройки скорости и тона голоса, частоты звука, эффекта эхо и др.

Интерфейс TEXTTOSPEECH.RU

В платной версии стоимость озвучки — 1 или 3 рубля за 1 000 символов, за голос «Стандарт» и «Премиум» соответственно. При положительном балансе голоса с пометкой «FREE» можно использовать бесплатно и без ограничений.

VoxWorker 

Сервис помогает качественно конвертировать русский текст в речь. При озвучке соблюдается интонация, почти все слова произносятся правильно. Чтобы улучшить результат, можно добавить паузу или ударение, выбрать скорость речи и высоту голоса. В бесплатной версии доступны для выбора три женских и два мужских голоса. Но озвучивают текст они неественно, поэтому лучше использовать премиум-версию. В ней доступно 3 мужских и 3 женских голоса. Результат можно сохранить в файл формата MP3.

Интерфейс VoxWorker

В бесплатной версии после регистрации можно озвучивать до 5 000 символов в сутки, причём весь объём можно обработать за один раз. На платном тарифе лимита на дневной объём нет. Максимальная длина одного текста — 10 000 символов, стоимость рассчитывается по факту: 1 000 символов = 1 рубль.

Retell 

Сервис конвертирует текстовые сообщения и даже тексты онлайн-изданий в аудиостатьи. То есть, он умеет озвучивать не только написанный текст, но и делать потоковую обработку текстов. Сервис подключаются к любому сайту через RSS-фид и озвучивает все статьи на нем. Для озвучки доступны больше 100 голосов на 50 языках. В готовые аудиотексты можно встраивать рекламу. В личном кабинете пользователь может отслеживать статистику прослушиваний.

Примеры голосов Retell

Судя по тарифам на сайте, конвертация в речь текста до 500 000 символов бесплатна. Платной версией воспользоваться не получится: сервис не принимает российские карты.

Yandex SpeechKit 

Это бесплатный синтезатор речи, который работает на технологии глубоких нейронных сетей. То есть, сначала нейросеть оценивает текст целиком, поэтому точнее подбирает интонацию и эмоции в целом, присущие речи живого человека. Единственный минус — сервис распознает только до 500 символов текста.

Сервис полностью бесплатный.
Сервис полностью бесплатный.

Talk Free для Android

Бесплатное приложение позволяет записать и сразу озвучить текст. Результат сохраняется в формате WAV и доступен для экспорта. Помимо русского, Talk Free поддерживает много других языков.

Приложение Talk FREE

Через функцию «Поделиться» можно импортировать в сервис веб-страницы или текст из других приложений.

Text to Speech для iOS

Ещё одно мобильное приложение, причём для его работы не требуется интернет. В сервисе доступны 95 голосов на 38 языках. Можно перевести в голос написанный текст или импортировать нужный фрагмент для озвучки. Результат сохраняется на устройстве в виде аудиофайла.

Приложение Text to Speech

В Text to Speech для iOS можно настроить высоту тона и скорость произношения. Но создать речь, похожую на человеческую, все равно не выйдет.

Narakeet

Мощный инструмент преобразования текста в речь, который умеет озвучивать небольшие предложения, word-файлы и даже целые презентации. Сервис поддерживает 90 языков и предоставляет 600 голосов. На русском доступно 16 голосов. Но есть минусы: голоса не умеют склонять цифры и их нельзя настраивать. Можно расставлять только ударения.

15 инструментов для озвучки текста 14

У сервиса есть бесплатная версия на 20 генераций по 1 минуте. Платные тарифы стартуют от $6.

NaturalReader 

Синтезатор голоса позволяет читать PDF, DOCX и любые текстовые документы, умеет считывать текст с отсканированных документов, читает с веб-страниц и настольных приложений. Текст можно преобразовать в аудиофайлы, файлы MP3 для Windows или Mac. Правда, на русском документы читают обычные боты, и долго слушать их точно не получится. Голова заболит быстрее.

Веб-версия NaturalReader

Сервис можно использовать в веб-формате, в виде Android или iOS приложения, настольного приложения для Mac или Windows, браузерного расширения. Бесплатные компьютерные версии не позволяют конвертировать файлы — их можно использовать только для чтения вслух. Платная программа переводит текст в голос и сохраняет в формате MP3. Для этого нужно приобрести лицензию стоимостью от $99,50 до $199,50.

Microsoft Word или Google Документы

Если вам нужно просто озвучить текст в личных целях и без преобразования текста в аудиофайл, можно использовать обычный Word или Google Docs. 

В Word есть встроенная функция озвучки текста. Для её активации откройте раздел «Параметры» и выберите пункт «Настроить ленту». В левом столбце инструментов «Выбрать команды» кликните на «Все команды» и найдите «Проговорить». Выделите команду и добавьте её.

Параметры Microsoft Word

С правой стороны на панели редактора появится команда «Проговорить».

Панель Word

Теперь выделите нужный фрагмент текста и активируйте прочтение.

Выделенный текст для прочтения в Word

В Google Документах потребуется установить специальный плагин. Для этого перейдите в раздел «Расширения», выберите «Дополнения» и «Установить дополнения». Когда откроется окошко Google Workspace Marketplace, через поиск найдите расширение Read Aloud TTS и установите его.

Чтобы Google Docs прочитал текст вслух, выделите нужный фрагмент, кликните «Расширения», затем «Читать вслух ТТС» и «Открыть боковую панель». На открывшейся панели можно выбрать язык, голос, скорость прочтения.

Расширение в Google Document

Текст, озвученный в Microsoft Word или Google Document, можно записать на встроенный диктофон мобильного устройства.