Голосовой движок николай для андроид. Обзор синтезаторов речи для андроид

Вайбер на компьютер 25.05.2019
Вайбер на компьютер

Экранный диктор для Андроид или смартфон для слабовидящего или незрячего человека

Современный мир постоянно прогрессирует. Выпустился замечательный программный продукт — экранный диктор, благодаря которому человек лишенный зрения может окунуться в мир высоких технологий. Ранее мы писали , а в данном обзоре рассмотрим приложения для смартфона.

Программное обеспечение синтезатора речи выглядит в виде приложения, которое обеспечивает перевод текстовой информации в голосовую.

Большое разнообразие данной продукции не перестает удивлять пользователей, предлагаю подробно рассмотреть самые популярные.

Классификация приложений

Уже разработано и выпущено большое количество синтезаторов речи, с их помощью одно удовольствие не только воспринимать зрительно полезную информацию, но и слышать.

Данные программы делятся на два вида: платные и бесплатные.

Те программы, которые «шаровые» имеют более скудный арсенал возможностей, но тоже подлежат к использованию, с платными версиями дела обстоят повеселее, их обширность не знает предела.

Русскоязычные синтезаторы речи

Для таких операционных систем как Android, есть очень много вариантов синтезаторов речи, но большинство из них не имеют русскоязычных версий.

Рассмотрим несколько самых популярных экранных дикторов:

Данная программа разработана для Android. Обладает высокими показателями синтеза речи, многоязычная, насчитывает 25 разных языков, в том числе и русифицирована.

Разработчиками является Acapela Group S.A.. Примерная стоимость составляет 4 евро.

Мультиязычный синтезатор речи, который не является коммерческим. Обработка информации на 37-ми языках, озвучка хорошая есть много вариантов голосов.

Работает на нескольких операционных системах Linux, Mac OS, Microsoft Windows и RISC OS. Для правильного голосового воспроизведения, был разработан расширенный словарь.

Из-за некоммерческой деятельности программа работает немного хуже, чем платные приложения, но в планах у разработчиков есть идеи для улучшения работоспособности.

Настройка TTS

Первоначально необходимо определиться, какой из синтезаторов речи подходит больше всего. Скачать и установить приложение, после чего перейти к настройкам TTS. Разберем пошаговую инструкцию:

  1. Начинать необходимо с запуска;
  2. После чего необходимо зайти в настройки приложения;
  3. Выбрать и установить необходимый язык;
  4. Определиться с синтезом речи;
  5. Следует выбрать движок, чаще всего «автоматически»;
  6. Выставить скорость речи, которая подходит;
  7. По своему усмотрению настроить дополнительные параметры, необходимые для работы.

Когда все параметры выставлены, по необходимости, можно приступать к эксплуатации.

TalkBack — это стандартный утилит, который обычно встроен в ОС Android. Данная функция была разработана для людей с проблемным зрением, слабовидящие люди благодаря TalkBack, могут пользоваться гаджетами без особых проблем.

При первоначальном запуске программы можно воспользоваться инструкцией. В экранном дикторе очень обширные настройки. Во всех устройствах, на разных видах прошивки, есть небольшие отличия настроек сервиса.

Основными возможностями TalkBack считаются:

  • Меняющийся уровень громкости воспроизведения;
  • Возможность изменения тональности голоса;
  • Озвучка каждого нажатия клавиш;
  • Есть датчик расстояния, благодаря которому регулируется уровень звука;
  • Устройство сообщает информацию о поступающих вызовах и смс, принцип АОН;
  • Преобразование речи в текст и наоборот;
  • Управление жестами.

Это основные возможности, но есть и большое разнообразие второстепенных.

TalkBack — незаменимое приложение для людей, которые утратили возможность видеть, пользоваться теми же устройствами, что и зрячие

Для слабовидящих это настоящая находка. Людям с полноценным зрением данное приложение не будет удобным, оно может раздражать, и замедлять процесс работы на устройстве.

Человеку, который не может ничего видеть, будет достаточно сложно настроить программу самостоятельно, поэтому лучше всего обратиться за помощью к окружающим людям.

Для гаджетов, работающих на Android, есть возможность голосовой помощи в управлении. TalkBack произносит все иконки, на которые можно кликать пальцем, или просто во время передвижения по экрану.

В этом помогает функция «Изучение при касании». Есть подробная инструкция, как именно пользоваться этой функцией.

После ознакомления с инструкций, у пользователей не возникает проблем с работой в устройстве.

Для того, чтобы выбрать нужную иконку и активировать элемент, достаточно нажать пальцем на значок, при этом произойдет воспроизведение голосовой подсказки. Так же удобства придает скроллинг, сопровождение которого происходит разной тональности.

Видео: Acapela Tts Voices для Android

Заключение

Разобравшись с работой и функционалом экранных дикторов, можно сделать следующие выводы:

  1. Дикторы являются незаменимой программой для людей с проблемным зрением и слепотой;
  2. При помощи таких программ можно озвучить любую тестовую информацию;
  3. Информацию, воспроизводимую голосом, легко превратить в написанный текст;
  4. Стоимость на голосовые дикторы небольшая, есть даже бесплатные.

Для незрячих и слабовидящих пользователей устройств на системе Android основным источником информации о происходящем на экране является синтезатор речи. До тех пор, пока поддержка тактильных дисплеев не будет окончательно разработана и отлажена, имеет большое значение для пользователей с особыми потребностями.

Для ОС Android выпущено много синтезаторов речи, однако поддержка русского языка обеспечена далеко не у всех. Основная проблема – многоязычные тексты, с которыми некоторым голосовым движкам трудно справиться. Рассмотрим основные TTS системы.

Acapela TTS Voices

Один из самых популярных мультиязычных синтезаторов речи от Acapela Group доступен и для Android. Для синтезированных голосов характерно высокое качество речи и хорошая стабильность работы.

Движок Acapela TTS Voices можно без проблем найти и установить из Play Market. Программа бесплатная, но после ее первого запуска будет предложено купить и установить русский голос «Alyona» стоимостью 3,99 €.

SVOX Classic TTS

На втором месте среди коммерческих движков стоит SVOX Classic TTS. Синтезированная речь неплохого качества, но программа иногда не распознает заглавные латинские буквы. Также возникают вопросы в чтении цифр.

На Play Market есть бесплатная триальная версия русского голоса, которую можно свободно загрузить и протестировать в течение 2 недель.

eSpeak

Благодаря группе Eyes-Free Project на ОС Android, начиная с версии 1.6, был портирован кроссплатформенный Open-Source синтезатор eSpeak, поддерживающий русский язык. По сравнению с коммерческими программами, скорость и качество речи не сильно велики, но вполне приемлемы.

Первоначальная настройка

Установив TTS, нужно произвести его первоначальные настройки. Идем в такой последовательности:

  1. «Настройки»;
  2. «Язык и клавиатура»;
  3. «Синтез речи».

Использование экранного диктора

Для Android версии 3.2 и выше разработчиками Google выпущена утилита TalkBack , по функционалу напоминающая «Экранный диктор» для Windows. Начиная с Android Jelly Bean, приложение переустанавливается в систему и активируется из «Настройки» – «Специальные возможности». Для запуска следует передвинуть ползунок в положение «On».

Функции программы TalkBack:

  • Перечисление элементов на мониторе с одновременным их описанием;
  • Голосовые уведомления о происходящих событиях;
  • Уведомление о звонках и SMS-сообщениях;
  • Аудио и вибрационный отклик от устройства.

В своей работе утилита использует интерфейс TTS, установленный в системе по умолчанию. И хотя TalkBack уже относится к системным программам, она все же имеет один недостаток – для первоначальной активации нужен визуальный контроль, поэтому позаботьтесь о присутствии друга или члена семьи при первом знакомстве с приложением!

Управление Android-устройством с помощью TalkBack

Для девайсов с Android 4.0 и старше возможно управление с помощью прослушивания элементов экрана, которые находятся непосредственно под пальцем при его движении. Для этого в настройках TalkBack следует включить опцию «Изучение касанием».

После включения запустится демонстрационный ролик в двух частях, позволяющий обучиться.

Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.

В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.

Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.

Для удобства разделим движки TTS на три класса:

  • коммерческие;
  • свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
  • встроенные (средства, предоставляемые самой операционной системой).

Коммерческие движки

SVOX Mobile TTS

Цена: n/a
Языки: 26, включая русский
высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW

Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт - SVOX Mobile TTS . Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.

Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт . Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.

Отмечу, что Acapela предоставляет «облачный» синтез речи , а так-же портирование SDK под любую платформу.

Свободные движки

Flite
Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)

В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile , PalmOS, Android и .

Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить .

ESpeak портирован на Android . Самый простой способ его попробовать - это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.

Встроенные решения

Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).
Symbian

Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть

Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.

Дополнительные языковые пакеты можно загрузить , однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.

Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти


– очень удобное приложение, которое подарит вам возможность прослушать книги, которые сохранены в текстовом формате. Представляем вашему вниманию читалку с поддержкой синтеза речи Moon+ Reader. Правильный выбор для книгоманов!

Доступно видео:




Из большого числа читалок, которые поддерживают синтез речи, Moon+ Reader на русском языке – лучшая голосовая читалка на планшет. Как и любая другая программа для чтения она поддерживает разные форматы, онлайн библиотеки, где вы можете скачать тысячи бесплатных книг. В этом приложении огромное количество функций – 10 разных тем оформления, включая ночной режим, разные виды перелистывания страниц, программа сама убирает лишние пробелы и отступы, чтобы сделать чтение более комфортным. Читалка будет напоминать вам о вреде для глаз в случае долгого чтения, вы сможете настроить яркость и другие параметры, ну и конечно же словари. Кстати, эта программа поддерживает Google Translate. Голосовая читалка Moon+ Reader отлично подойдёт для планшетов на операционной системе Андроид.

Поговорим о функции голосового чтения – штука удобная и довольно занятная. Вы можете менять голоса своего устройства. Зачастую у таких голосовых модулей даже есть имена – Катя, Сергей, Юра. Но что бы такая функция начала работать, необходимо скачать определённые файлы и настроить программу. Об этом читайте ниже.
Для начала вам необходимо скачать и установить SVOX Classic TTS. Далее устанавливаем мужской или женский голосовой пакет (инструкция есть в описании к голосовому движку). Настраиваем SVOX Classic TTS. Далее в настройках самой читалки выбираем SVOX Classic TTS голосовым движком по умолчанию. Готово! Теперь вы можете пользоваться функцией чтения голосом и наслаждаться любимыми книгами!

Разработчики приложения Svox Russian Katja Voice решили осуществить мечты сотен тысяч человек – создать программу, которая будет читать требуемые тексты сама и вслух. И да, безусловно, приятным голосом. Приложение Svox Russian Katja Voice работает на платформе Android и доступно для всех без исключения мобильных устройств (планшеты, смартфоны). Эта библиотека чтения текстов голосом теперь доступна на русском языке. Примечателен тот факт, что несмотря на название программы, голосов в ней целых два–мужской и женский. Работа с сервисом происходит очень просто. При запуске программы на экране можно прочесть следующее сообщение: "Привет, я Катя. Введите текст, и я прочитаю Ваш текст вслух". После непосредственного ввода требуемой информации либо загрузки необходимого документа, книги, отрывка, а также манипулирования с настройками приложение начинает "говорить". Вернее, читать вслух то, что ввел пользователь.

Особенности программы:
- высокое качество чтения текстов;
- мужской и женский голоса "Катя" и "Юрий";
- четкая и правильная дикция, приятный тембр голоса;
- настройка необходимых параметров осуществляется вручную либо автоматически;
- возможность изменения скорости воспроизведения информации и громкости, а также повышение и понижение тона;
- возможность интеграция с GPS, в результате чего ваш телефон превращается в полноценный навигатор, указывающий правильный путь с помощью голосовых команд;
- возможность использования сервиса с другими приложениями (программа способна читать вслух входящие сообщения или оповещать о входящих звонках и прочих уведомлениях);
- в последней версии программы присутствует возможность коррекции произношения;
- простой и понятный дружественный интерфейс;
- постоянное обновление и поддержка со стороны разработчиков.
С приложением Svox Russian Katja Voice процесс прослушивания любимых книг и важных документов превращается в сплошное удовольствие.



Рекомендуем почитать

Наверх