Sw-motors.ru

Автомобильный журнал
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

И прочитал андроид человеческим голосом

И прочитал андроид человеческим голосом.

. или обзор лучших бесплатных голосовых читалок для андроида, то есть приложений для чтения электронных книг, текстов и сайтов на русском языке.

Поскольку я активно пользуюсь в последние годы мобильными девайсами то и книги читаю электронные в основном, они ничего не весят, места не занимают, удобно же когда вся твоя библиотека в 200 томов лежит в планшете. Недавно я скачала пару чудесных приложений и стала слушать чтение голосом текстов книг и интернет сайтов, а не читать их на планшете.

Иногда это очень удобно — когда руки заняты, например, или на ходу или просто когда глаза устали. Учитывая специфику этого сайта о путешествиях по Индии, можно предложить путешественникам еще варианты — можно слушать статьи путеводителя вместе с попутчиками — как экскурсовода — индийца на русском языке 🙂 А если серьезно, то такие читалки просто незаменимы в долгих поездках на поезде или автобусе — что бы не демонстрировать дорогой мобильный девайс окружающим и опять же глаза не утомлять в трясущемся транспорте.

Возможно не все знают о такой полезной возможности, вот делюсь. Это почти как аудио-книги, но спектр применения шире, только произношение увы не как у профессиональных чтецов.

Лучшая голосовая читалка для андроид — все форматы — бесплатно

Многие пользуются программами чтения для цифровых книг, и в некоторых таких читалках, хотя и не во всех, есть эта опция встроенная или загружаемая дополнительно как плагин к приложению. Функция чтения файлов в разных читалках отличается возможностью настроек собственно голоса и форматами файлов.
Я еще со времен чтения с телефона использовала олридер, версия под андроид умеет читать по-русски, но это программа не умеет работать с pdf в принципе, а у меня большая часть книг именно в этом формате. Я скачала для pdf и DjVu фулридер, эта читалка умеет озвучивать тексты, но пдф не совсем текстовый формат.

Перебрав все содержимое гугл маркета, я нашла прекрасную читалку eReader Prestigio, которая мало того, что распознает форматы от DjVu до музыкальных файлов, она умеет озвучивать даже pdf! Правда не любой, а только текстовый, поэтому прочесть графический пдф и дежавю конечно не может, но это единственная голосовая pdf читалка, которую можно скачать бесплатно! И на мой взгляд она — вообще лучшая.

Читалка имеет свою настройку голосового движка, скорости и тона речи, что очень удобно. Во время чтения приложение выделяет фрагмент, который озвучивает, цвета настраиваются. Поддерживаются также перевод текста, закладки, и прочие опции. Скриншоты из приложения, где показано на что нажимать, что бы включить и отрегулировать голос выше.

Интернет сайты можно не читать, а слушать

Поскольку я переворошила гугл плей на тему читалок мне попалась на глаза еще одна полезная категория приложений, приложений, которые умеют читать голосом произвольные тексты, введенные с клавиатуры, а также скопированные из буфера, и в том числе на интернет сайтах. Второе мне показалось очень интересным и полезным.

Что бы читать тексты на сайтах нужно просто нажать в браузере кнопку поделиться и выбрать программу, которая скачает в свой буфер текст и через несколько секунд прочтет его.
Правда не все главные версии сайтов позволяют себя читать, тут есть несколько вариантов:
1 — найти легкую версию для мобильных устройств или кпк, на индонете ссылка на мобильную версию вверху справа, если кто-то не знает.
Второй способ — если ваш браузер поддерживает режим чтения (браузеры с такой функцией см. в статье сравнение 13 браузеров, переходите в такой режим и уже из него жмете поделиться с читалкой.
3 способ — скопировать текст сайта в буфер обмена, оттуда вставить в программу и после запустить голосовой движок.

Сравнив все варианты я остановилась приложении T2S:Прочитайте вслух текст, это самая лучшая читалка по функциональности — не требовательная, маленькая и меньше всего загружает систему, и опять же она бесплатна.
В этом приложении чтение интернет страниц (в других — это платная опция) выделено в отдельный пункт, то есть вариант №4 — вставляете в читалку ссылку на нужную страничку сайта и он загрузится. А еще озвученный текст можно сохранить как звуковой файл.
Вариант чтения №1 на примере моего творческого блога и №4 — места, куда тыкать и вставлять ссылку на веб сайт на скриншотах обведены.

Как заставить андроид читать человеческим голосом?

Для того, что бы телефон или планшет заговорили нужно включить настройках языка андроид синтез речи, если он не включен, и скачать голосовые данные нужного вам языка. Встроенный в андроид по умолчанию синтезатор речи гугл в настоящее время предоставляет возможность выбора между 3 мужскими и 3 женскими голосами на русском языке. Скачивая пакет голосовых данных вы не должны озадачиваться их настройками, выбрать и настроить голос вы сможете потом, в программах о которых я писала выше.

Из бесплатных русских голосов на плей гугле есть голосовой движок RHVoice TTS, написанный слепой русской девушкой — программистом Ольгой Яковлевой, в нем только 1, но хорошо поставленный мужской голос, который читает довольно быстро и разборчиво, для художественной литературы отлично подходит, для научных книг не советую, настроек кроме громкости нет.
Движок стоит скачать, хотя бы для того, что бы написать отзыв и поддержать этот проект, единственный в своем роде, к тому же движок можно скачать совершенно бесплатно, не просят даже донейшн, таких людей имхо надо всячески поощрять.

Кроме бесплатных голосовых движков, которые называются TTS (от английского text to sound, то есть текст в звук), есть еще и платные, их довольно много и найти их можно запустив поиск по аббревиатуре TTS.

Надеюсь, что мой обзор и отзывы будут интересны кому-то из читателей, а не только поисковым роботам.
Если я что-то упустила или появились интересные проги после моего поста — пишите не стесняйтесь, если есть вопросы — постараюсь ответить.

Что такое tts двигатель

Microsoft Agent / Speech API

Microsoft Agent — это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи. Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista — полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista — Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.
[c]Движки для синтеза речи (TTS):

Читать еще:  Электрические подогреватели двигателя как поставить

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech — TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.

Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):

1. Acapela-Group Алёна 22Khz — 150Mb — SAPI5/SAPI4 — Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (

100MB — SAPI5 — Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина 22Khz — 44MB — SAPI5 (бывшая Татьяна-SAPI4) — что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 — Николай (Nicolai) 16Khz — 12MB SAPI4 + SAPI5 — эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно — ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia — SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 — работает только с одной встроенной программой — с другими не хочет — так уж устроен.
5. Сакрамент — Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) — Судя по образцам с сайта производителя качество голосов не очень — однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает — диск защищен «StarForce 3.02 protector» — так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать — вставлять диск, но мне надоело (достало).
6. Сакрамент — Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5— (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller — что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент — Рассказчик 1 (Борис) 6.5MB SAPI5 — Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван — Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP — точно не помню но кажется это был словарь вместе с TTS — качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB— сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB — то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4 (мужской и женский голос) 3MB — Что-то слабо похожее на русскую речь.

Итого — 22 (или 24 по разным источникам) возможных голосов на Русском языке.

В общем я лично пока рекомендую (из общедоступных) только 4 голоса:

1) Acapela-Group Алёна 22Khz — SAPI5/SAPI4
2) Loquendo Ольга / Loquendo Дмитри
3) Nicolai (v5.1 — лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
4) Katerina
(остальные пока слушать трудно — в следствии более низкого качества) но стоит упомянуть об их болезнях:

Многие считают что: Nicolai — голос выразительного дауна (или выразительного робота). Katerina — истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).

5) — как опция Сакрамент — Рассказчик 3 — но проблема с диском.

Ну а программы для их использования — это дело вкуса и отдельный разговор.

По поводу других языков — из самых известных производителей можно отметить достижения следующих разработчиков:

Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

Два синтезируемых голоса – мужской и женский;
Размер морфо-грамматического словаря – до 100 тыс словоформ.
Создание собственного голоса под заказ;
Синтаксический и семантический анализ.
Управление ритмикой и интонацией синтезированной речи в зависимости от содержания текста.
Естественное «человеческое» звучание синтезируемой речи;
Согласование падежей и времён;
Правильное произнесение имен собственных, числительных, сокращений и аббревиатур;
Изменения темпа речи – замедление или ускорение темпа до двух раз;
Возможность изменения основного тона голоса – от -25% или +50% относительно среднего значения;

Stroodder
1. Битрейт 64 кбитс
2. Над интонацией работаем. Она не случайная но плавность голоса будет значительно улучшена. Сейчас идет разметка по эмоциональному состоянию диктора, что приведет к значительному улучшению реализации интонации. Исчезнут неуместные эмоциональные проявления. Не будет резких всплесков в интенсивности речи.
3. Не каждая запятая выражается паузой. Обработка знаков препинания намного сложнее.

Знак ударений естественно есть

SelenaNight

Русский язык настолько богат сочетаниями аллофонов, что иногда точных не находится и приходится брать близкие.

Цитата:

Извините, а что нужно скачать, чтобы компьютерный голос читал текст и чтобы качать не много надо было, не эти 200метровые файлы. Объясните, пожалуйста, подробно.

Вот — полный комплект Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista — всего 13 Мб (зеркало). Там все, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Эксклюзив!

Также понадобится программа для чтения текста (говорилка), я рекомендую DeskBot (версию mini) — полное использование всех наворотов технологий MS Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0 — 5.x, напоминание времени, звуковые эффекты — реверберация, шепот и др., всего 1 Мб. Там же можно найти дополнительные анимированные персонажи от сторонних разработчиков. Ну и движки тоже другие можно попробовать, если стандартный TTS3000 не устроит.

Всем остальным, кто интересуется этой темой также рекомендую скачать дистрибутив Microsoft Speech API 5.1 — полный комплект со всеми голосовыми движками для Windows 95-XP. Собран собственноручно из msm-модулей с этой странички — 40 Мб. Или только SAPI без движков (включен в архив MSAgent.rar) — 500 Кб. Эксклюзив!

Читать еще:  Bmw тюнинг двигателя e36

SAPI 5.1 также можно найти здесь и здесь — абсолютно идентичные моим дистрибутивы, сделанные из тех же вышеупомянутых msm-модулей. По первой ссылке качается версия для Windows 95-2000, по второй для Windows 95-XP. На XP устанавливается только Mike + Mary Voices Addon, т.к. SAPI и TTS Engine (Sam Voice) на нее уже предустановлены. Если не нужен английский голосовой движок, то лучше качать мою 500 килобайтную версию.

Итак программа AUDIOBOOK может:

Анализ диалогов + Поддержка тегов и Чтение по ролям: 1. Русский — Английский. 2. Мужской — Женский.

Android не распознает двигатель TTS

Я разрабатываю здесь очень простое приложение. Это для моей дочери, страдающей церебральным параличом. Это просто большие кнопки YES и NO, чтобы она могла нажимать их, когда ее попросят.

Что ж. Я использую SVOX Classic TTS Engine.

Все шло гладко, пока мой планшет не обновился до ICS. Теперь каждый раз, когда я запускаю приложение, оно открывает рынок с просьбой установить TTS. Я нажимаю «back», а затем мое приложение говорит. Это VERY раздражает.

Вот что говорит Google API:

*A успешная проверка будет отмечена кодом результата CHECK_VOICE_DATA_PASS, указывающим на то, что это устройство готово говорить, после создания нашего объекта TextToSpeech. Если нет, то мы должны сообщить пользователю, чтобы он установил данные, необходимые для того, чтобы устройство стало многоязычной говорящей машиной! Загрузка и установка данных осуществляется путем запуска намерения ACTION_INSTALL_TTS_DATA, которое приведет пользователя на рынок Android и позволит ему инициировать загрузку. Установка данных произойдет автоматически после завершения загрузки. Вот пример того, как будет выглядеть ваша реализация onActivityResult():*

Если я удаляю область с «ATTENTION» выше (так как я уверен, что у меня установлен TTS), она работает при первом запуске приложения, если я оставляю приложение и открываю его снова, оно говорит «speak failed: not bound to tts engine»

Это похоже на то, что он не создает объект TTS, так как приложение все еще находится в памяти.

Итак, ребята. как вы думаете, ребята, что я должен делать??

Это сводит меня с ума, и мне действительно нужно общаться с моей дочерью через планшет!

Любая помощь будет оценена по достоинству!!

6 ответов

  • добавьте мой движок TTS в Android TTS Serivce, например SAPI

Я разработал свои собственные TTS приложений в Android. Есть ли какой-нибудь способ развернуть мой движок TTS в OS вместо запуска приложений TTS, чтобы другие приложения могли вызывать мой TTS? Что-то вроде SAPI в MS Window. SVOX может упаковать движок как apk, и после установки он добавляет новые.

Я заинтересован в выполнении синтеза японской речи на Android. В руководстве по Android TTS говорится: Движок TTS, который поставляется с платформой Android, поддерживает несколько языков: английский, французский, немецкий, итальянский и испанский. Тем не менее, я вижу приложение, которое делает.

У меня тоже была эта проблема с моим приложением: TTS работает в 2.3, но когда я попробовал 4.0, у него были те же симптомы, что и у вашей проблемы (которую я только что нашел, ища решение). Движок будет работать, если вы принудительно закроете приложение через настройки и запустите его снова, но просто «backing out» и возврат назад сделали движок TTS в ICS не привязанным.

Я попытался установить объект TTS (mTts) в null после запуска mTts.shutdown(). Когда я снова запустил приложение после резервного копирования, я получил ошибку null в строке mTts.speak() .

По крайней мере, для ICS что-то не отпускает движок TTS. Мое решение (на данный момент) заключается в том, что я сделал свой объект TTS статическим :

Я уже использовал только один объект TTS для приложения, поэтому я не думаю, что у этого подхода слишком много недостатков.

Я исправил это, установив ivona с обоими движками Tts, которые вылечили все проблемы, хотя я нахожу другие проблемы, такие как отсутствие установки tts по умолчанию, использование этих двух вместе делает одну работу не отличным исправлением, но ее исправлением,

Кроме того, я не могу найти возможность разрешить моему телефону устанавливать нерыночные приложения, т. Е. apk с моей карты SD

в моем приложении я также использовал checkintent.setAction(. ) , чтобы проверить, установлены ли необходимые файлы tts (что работало как заклинание перед обновлением до ICS). В ICS он всегда возвращал, что файлы отсутствуют. Поэтому теперь я просто игнорирую эту проверку: я создаю объект, и он инициализируется нормально. Более того, я использовал два экземпляра для двух разных языков. Это также, похоже, больше не работает. Теперь, когда я устанавливаю язык для одного из экземпляров, другой экземпляр объекта устанавливается на тот же язык (ведет себя как один экземпляр).

  • Android TTS — механизм ACTION_CHECK_TTS_DATA по умолчанию

В моем приложении (Android API 10) Я использую стандартный способ проверить, доступны ли движок TTS и голос: Intent checkIntent = new Intent(); checkIntent.setAction( TextToSpeech.Engine.ACTION_CHECK_TTS_DATA ); startActivityForResult( checkIntent, CHECK_TTS_DATA ); В устройстве с более чем одним.

Unhapilly мой язык не имеет поддержки TTS в запасе Android. Таким образом, мои пользователи должны загрузить сторонний голосовой движок TTS. Это QUITE раздражает, так как требует дополнительных шагов, чтобы заставить мое программное обеспечение работать. Есть ли ANY способ EMBED любой сторонний.

У меня была такая же проблема, и я ее решил. Может быть, это проблема со временем в ограничении, не уверен, но простое действие, прежде чем говорить, помогло мне. В любом случае я сделал это:

mTts = new TextToSpeech(this, this);

String engine = mTts.getDefaultEngine();

mTts = new TextToSpeech(this, this,engine);

Log.d(«»,». something here. «);

Затем, когда я нажимаю кнопку «Говорить», он говорит. Вы должны следить за состоянием переменной в методе OnInit. Возможно, отдельный поток может помочь поговорить в приложении.

Кстати, если вы уверены, что TTS установлен, вы можете удалить блок Intent checkIntent = new Intent(); для проверки.

Я определенно надеюсь, что это поможет вам.

Это то, что у меня есть в onActivityResult(. )

Вместо того , чтобы использовать if (resultCode == TextToSpeech.Engine.CHECK_VOICE_DATA_PASS) <. >, я проверяю, был ли уже создан экземпляр mTts . Вам также придется установить mTts как static , как упоминалось jlquant и Rakesh в предыдущем посте, так что у вас будет только один экземпляр. Например, private static TextToSpeech mTts .

Таким образом, если вы не «Force stop» приложение или оно не перестанет работать из-за ошибки, оно больше не будет вызывать startActivity(installIntent); -раздражающего виновника, который каждый раз просит вас установить TTS.

gingerbread разрешил установку tts по умолчанию в выводе voice input& / tts по умолчанию

Читать еще:  Что такое октановое число двигателя

gingerbread допускает только ‘preferred’ tts в языке и ввод / вывод текста в речь.

таким образом, tts предпочтительнее, чем по умолчанию, что просто означает, что не так ясно, к чему привыкать.

Я думаю, что по умолчанию с переопределениями приложений, где указано, это лучший вариант.

Похожие вопросы:

Я хочу использовать службу TTS для озвучивания текстовых сообщений, которые я написал в самом коде, таких как: header.setText(Hello!); Я видел TTS из пользовательского ввода, но я не хочу этого.

Я пытаюсь воспроизвести какой-то текст с приложением android, которое поможет слабовидящим людям, особенно с TTS, но в моем случае мне нужен португальско-бразильский язык, А класс TTS не имеет.

Добавляя новый язык к существующему движку TTS в android, могу ли я изменить существующий движок, не начиная с нуля? поскольку структура синтеза речи в какой-то степени выполнена, возможно, я смогу.

Я разработал свои собственные TTS приложений в Android. Есть ли какой-нибудь способ развернуть мой движок TTS в OS вместо запуска приложений TTS, чтобы другие приложения могли вызывать мой TTS.

Я заинтересован в выполнении синтеза японской речи на Android. В руководстве по Android TTS говорится: Движок TTS, который поставляется с платформой Android, поддерживает несколько языков.

В моем приложении (Android API 10) Я использую стандартный способ проверить, доступны ли движок TTS и голос: Intent checkIntent = new Intent(); checkIntent.setAction(.

Unhapilly мой язык не имеет поддержки TTS в запасе Android. Таким образом, мои пользователи должны загрузить сторонний голосовой движок TTS. Это QUITE раздражает, так как требует дополнительных.

Я должен разработать приложение android для Японии, которое должно использовать механизм преобразования текста в речь (Japnese TTS). Когда телефон android продается на японском рынке.

В Android 4.0 я могу реализовать класс TextToSpeechService для создания движка TTS. Есть даже пример TTS движка в SDK, чтобы следовать, что действительно легко. Однако я не вижу никакой информации о.

Что такое tts двигатель

Программа «Балаболка» предназначена для чтения вслух текстовых файлов. Для воспроизведения звуков человеческого голоса могут использоваться любые речевые синтезаторы, установленные на компьютере. Воспроизведение речи можно контролировать при помощи стандартных кнопок, подобных тем, что присутствуют в любой мультимедийной программе («воспроизвести», «пауза», «стоп»). Приложение умеет читать вслух содержимое буфера обмена, показывать текст, содержащийся в документах, изменять настройки шрифта и цвета, управлять процессом чтения из системного трея (области уведомлений) или при помощи глобальных сочетаний клавиш, произносить набираемый на клавиатуре текст, проверять орфографию, делить текстовый файл на несколько файлов меньшего размера, искать омографы. «Балаболка» предоставляет возможность удалить из текста все знаки переноса на концах строк; это позволит избежать запинок при чтении слов. Поддерживаются форматы файлов: AZW, AZW3, CHM, DjVu, DOC, DOCX, EML, EPUB, FB2, FB3, HTML, LIT, MD, MOBI, ODP, ODS, ODT, PDB, PDF, PPT, PPTX, PRC, RTF, TCR, WPD, XLS, XLSX.

Текст может быть сохранен в виде аудиофайла (поддерживаются форматы WAV, MP3, MP4, OGG, OPUS и WMA). Программа умеет работать с различными версиями пакета речевых функций Microsoft Speech API (SAPI). Он позволяет изменять скорость речи и высоту звука.

Программа «Балаболка» также может сохранять текст, читаемый компьютерным голосом, в файлах формата LRC или в тегах ID3 внутри звуковых файлов формата MP3. При воспроизведении такого звукового файла в медиаплеере текст отображается синхронно (так же, как тексты песен в музыкальных файлах).

Размер файла: МБ
Версия: История изменений
Тип лицензии: Freeware
Операционная система:

Всё ещё непонятно, зачем нужна такая программа? Вот полезные ссылки по теме:

  • Мифотека (каталог синтезаторов речи и программ для чтения вслух)
  • Синтез речи (статья в Wikipedia.org)
  • MyTTS-INFO (форум о преобразовании текста в речь)

Программа «Балаболка» позволяет изменять ее внешний вид при помощи тем оформления.

Программа может использовать компьютерные голоса, поддерживающие SAPI 4, SAPI 5 или Microsoft Speech Platform. Существуют бесплатные и платные (коммерческие) речевые движки. Самое высокое качество синтеза речи обеспечивают коммерческие голоса.

Ольга Яковлева разработала многоязычный синтезатор речи с открытым исходным кодом RHVoice (доступны русский, английский, грузинский, киргизский, португальский, татарский, украинский языки и эсперанто):

Ярослав Козак из Львова создал украинский синтезатор речи UkrVox. За основу был взят голос диктора украинского радио Игоря Мурашко.

Ссылки на сайты компаний, выпускающих коммерческие (платные) синтезаторы речи:

Из коммерческих речевых синтезаторов интерес для русскоязычных пользователей представляют следующие голоса:

  • Alyona (Acapela Group)
  • Katya, Milena и Yuri (Nuance/Cerence)
  • Nicolai (Digalo — Acapela Elan Speech Cube)
  • Tatyana и Maxim (IVONA)

Приобрести русские компьютерные голоса от компаний IVONA и Nuance можно на сайте фирмы Harpo. Русский голос от фирмы Acapela Group входит в состав программного продукта Infovox 4: купить его можно на сайте российской компании «Элита Групп».

Microsoft Speech Platform (версия 11.0) – набор инструментов, позволяющих разработчикам строить решения с распознаванием голоса и преобразованием текста в речь.

Для работы синтезатора речи необходимо загрузить и установить следующие компоненты:

  1. Microsoft Speech Platform — Runtime – серверная часть платформы, предоставляющая API для программ (файл x86_SpeechPlatformRuntimeSpeechPlatformRuntime.msi).
  2. Набор языков для серверной части (файлы, чьи имена начинаются с «MSSpeech_TTS_»).

Пользователь может использовать специальный список замен для улучшения качества воспроизведения речи. Это полезно в тех случаях, когда есть необходимость изменить произношение слов или отдельных слогов; для этого некоторое выражение в тексте заменяется на необходимое читаемое выражение. Для записи подобных правил замены используется синтаксис регулярных выражений; списки замен хранятся в файлах с расширением *.rex.

По просьбам российских пользователей была добавлена поддержка словарей для коррекции произношения с расширением *.dic. Этот формат словарей использовался в программе «Говорилка». Простые правила замены применяются к тексту быстрее, чем регулярные выражения.

Формат *.bxd объединяет достоинства двух других форматов. Словарь может содержать как регулярные выражения, так и правила для простой замены текста. В специальном редакторе можно создавать отдельные словари как для выбранного компьютерного голоса, так и для конкретного языка.

Файлы словарей находятся в папке «ДокументыBalabolka» («Мои документыBalabolka» в Windows XP).

Программа «Балаболка» поддерживает Hunspell (hunspell.github.io). Hunspell — это система проверки орфографии, предназначенная для языков со сложной системой словообразования и обширной морфологией. Hunspell используется в пакетах офисных приложений OpenOffice.org и LibreOffice, а также в браузере Mozilla Firefox.

Словари для Windows можно скачать отсюда:

«Балаболка» может использовать для проверки орфографии словари, входившие в состав программного продукта Microsoft Office 97/2000:

Программа позволяет использовать систему проверки правописания, встроенную в операционную систему. Spell Checking API доступен в Windows 8 и выше.

голоса
Рейтинг статьи
Ссылка на основную публикацию
ВсеИнструменты
Adblock
detector