Настройка схемы озвучивания

Программа BX Language acquisition умеет работать со звуковыми файлами форматов WAV, MP3 и OGG.

Для подключения звуковых файлов к программе Вам необходимо указать каталог со звуковыми файлами Слов и каталог со звуковыми файлами Переводов (если есть).
В примере показано подключение каталога со звуковыми файлами Слов: D:\WorkDocs\Sounds\EnglishBX
К программе BX Language acquisition можно подключить библиотеки звуковых файлов в форматах SAE, ABBYY Lingvo 5-15, English Platinum 2002. Если у Вас установлены программные продукты English Platinum 2002, озвученный словарь ABBYY Lingvo или продукты других производителей, использующие подобные форматы Звуковых библиотек (например: SAE), то Вы сможете расширить своё использование этих программных продуктов подключением этих библиотек к программе BX Language acquisition.

Для подключения Звуковой библиотеки в формате SAE: Вам необходимо указать путь к файлу библиотеки *.sae для Слова или Перевода.

Для подключения Звуковой библиотеки в формате English Platinum 2002: Вам необходимо указать путь к управляющему файлу библиотеки dic.txt для Слова или Перевода.

Для подключения Звуковой библиотеки в формате ABBYY Lingvo версий с 5 по 8: Вам необходимо указать путь к файлу библиотеки sound.pak (английская)для Слова или Перевода.

Для подключения Звуковой библиотеки в формате ABBYY Lingvo версий с 9 по 12: Вам необходимо указать путь к файлу библиотеки SoundE.dat (английская), SoundD.dat (немецкая) или SoundF.dat (французская) для Слова или Перевода.

Для подключения Звуковой библиотеки в формате ABBYY Lingvo X3,X5: Вам необходимо указать путь к файлу библиотеки sounden.lsa (английская), soundde.lsa (немецкая), soundfr.lsa (французская), soundru.lsa (русская), sounduk.lsa (украинская) или soundes.lsa (испанская) для Слова или Перевода.

В примере показано подключение Звуковой библиотеки Слов ABBYY Lingvo 12: C:\Program Files\ABBYY Lingvo 12\Data\SoundE.dat

Настройка схемы озвучивания

К программе BX Language acquisition можно подключить синтезаторы речи 4-го и 5-го поколений. Для подключения синтезаторов речи к программе их голоса необходимо предварительно установить на Вашем компьютере. Перед установкой синтезаторов необходимо установить на Вашем компьютере поддержку речевого синтеза 4 и 5 поколений.

Менеджер голосовых функций SAPI 4 - Microsoft Speech API 4.0 (850 Kb) для в Windows XP,2003,Vista и Windows 7.
Менеджер голосовых функций SAPI 5 - Microsoft Speech API 5.1 (6,14 Mb) для Windows 2000.

После установки поддержки речевого синтеза и самих синтезаторов речи на Вашем компьютере Вы сможете подключить их голоса к программе.
В примере показано подключение голоса IVONA Eric для Слова и голоса Katerina для Перевода с признаком входящего текста формата ANSI. По умолчанию синтезаторы 4-го поколения принимают входящий текст в формате ANSI, а синтезаторы 5-го поколения в формате Unicode. Но есть некоторые синтезаторы 5-го поколения, которые нарушают это правило и на вход требуют текст в формате ANSI, иначе молчат - в этом случае Вам необходимо поставить галочку в поле ANSI над именем синтезатора.

Скорость и громкость звучания синтезаторов регулируется ползунками под именем голоса. Громкость звуковых файлов и звуковой библиотеки регулируется соответствующими ползунками справа от имени каталога.

В случае необходимости, можно отключить/включить схему озвучивания для Активных методов обучения по отдельности для Слова, Перевода, Примера и Перевода примера галочками Озвучивать Слово, Озвучивать Перевод, Озвучивать пример и Озвучивать перевод (примера).

Внимание! Если для видеословаря настроена схема видео, то она является приоритетной перед основной схемой озвучивания.

Внимание! Включение и отключение звука или видеосигнала в программе осуществляется после настройки Схемы озвучивания и Схемы видео галочкой: [v] Включить схему озвучивания или через меню Урок - Озвучивать задания.

Как подключаются звуковые файлы из каталога и библиотеки?

Если рядом с каталогом или звуковой библиотекой лежит перекодировочный файл (см. ниже), то программа использует его значение в первую очередь. Если перекодировочного файла нет, то используется следующая схема:

1 – фраза или слово обрабатывается: из них выбрасываются все знаки препинания и символы, а также слова, заключённые в круглые скобки.
      2 – в обработанной фразе пробелы заменяются на знак подчёркивания "_".
      3 – если файл ищем в каталоге, то приклеиваем путь к каталогу и расширение ".wav"; если файл не найден, то ищем с расширением ".mp3" затем с ''.ogg".
      Найденный файл проигрываем.
      4 – если файл не найден, то обработанное слово ищем в Звуковой библиотеке и вызываем проигрыватель файла.
      5 – если файл не найден, то синтезируем фразу или слово со всеми знаками, за исключением слов в круглых скобках.

Например:

      Слово=American football! (m)
      Перевод=Американский футбол!
      1 - American football! (m) -> American football
      2 - American football -> American_football
      3 – c:\word\American_football.wav
      4 – dic.txt -> American_football Американский_футбол 14 060 -> C:\diction\DIC014\DIC060.WAV
     4 – SoundE.dat -> American football
     5 – синтезируем фразу American football!

Если такая схема озвучивания Вас не устраивает, то Вы можете установить приоритетность обхода каталогов со звуковыми файлами по своему вкусу.

В приоритетах:
     1 – это значит первый по порядку,
     2 – второй по порядку,
     3 – третий по порядку,
     0 – отключен.
И ещё один момент: после синтезатора программа не делает никаких дальнейших обходов каталогов.
Вы также можете включить схему озвучивания: только из каталога, или только из библиотеки, или только через синтезатор.

Структура библиотеки звуковых файлов DIC.TXT

Если у Вас есть желание составить свою библиотеку звуковых файлов, то ниже приводится структура файла DIC.TXT

{слово}{пробел}{пробел}{номер каталога}{пробел}{номер слова}
{слово}{пробел}{пробел}{номер каталога}{пробел}{номер слова}
{слово}{пробел}{пробел}{номер каталога}{пробел}{номер слова}
{слово}{пробел}{пробел}{номер каталога}{пробел}{номер слова}

Библиотека для перевода слов должна быть в таком порядке:

{перевод}{пробел}{пробел}{номер каталога}{пробел}{номер слова}
{перевод}{пробел}{пробел}{номер каталога}{пробел}{номер слова}

! Начиная с версии 5.0, разделителем может быть вместо {пробела} - знак {табуляции}, но не вместе - или пробел, или табуляция.

Где
слово - это заучиваемое слово.
перевод - это ответ к заучиваемому слову (можно не заполнять это поле).

Если слово или перевод состоит из нескольких слов, то слова должны быть связаны друг_с_другом_знаком_подчёркивания.

номер каталога - это номер каталога DICnnn, в котором расположено слово.
Номер nnn может быть от 0 до 999. Каталог должен иметь имя от DIC000 до DIC999
номер слова - это номер слова dicNNN.wav в каталоге DICnnn.
Номер NNN может быть от 000 до 999. Файл должен иметь имя от dic000.wav до dic999.wav

Cлова в Звуковой библиотеке могут быть в одном из следующих форматов WAV, MP3 или OGG
Например:

   American_football 14 060
   anchor 13 014
   baby 13 032
   bee 13 058
   cheese 14 148
   coconut 14 176
   fat 15 300
   film 15 303

Файл DIC.TXT должен быть в кодировке Windows 1251 и должен быть расположен в каталоге MAIN.
! Начиная с версии 5.0, файл может быть в кодировке Unicode 1200.

Каталог MAIN и каталоги DICnnn должны находиться в общем каталоге, например:
   MYLIB\
   MAIN\DIC.TXT
     DIC013\dic014.wav                {слово anchor}
            dic032.ogg                {слово baby}
            dic058.wav                {слово bee}
     DIC014\dic060.mp3                {слово American football}
            dic148.ogg                {слово cheese}
            dic176.mp3                {слово coconut}
     DIC015\dic300.ogg                {слово fat}
            dic303.wav                {слово film}

Пример словаря и звуковой библиотеки к нему можно скачать по этой ссылке.

Создание перекодировочных файлов

Вы можете создавать библиотеки звуковых файлов в более удобном виде: с помощью перекодировочных файлов.
Перекодировочный файл удобно использовать, если Вы создаёте библиотеку фраз или слов на языке, у которого нет аналога ANSI написания. В этом случае имена файлов со значением языков китайского, хинди и т.п. невозможно или неудобно создавать в Windows. Но всегда есть возможность создать файл с именем phrase10010.mp3, а его значение занести в перекодировочный файл в формате Unicode.
Перекодировочный файл - это текстовый файл в формате Windows ANSI или Unicode, который размещён рядом с каталогом звуковых файлов или звуковой библиотекой форматов .SAE, .DAT, .LSA, .PAK.
Перекодировочный файл должен иметь имя такое же как и у связанного с ним каталога или звуковой библиотеки и иметь расширение .TXT

Структура перекодировочного файла должна иметь следующий вид:

{слово}{табуляция}{имя файла}
{слово}{табуляция}{имя файла}
{слово}{табуляция}{имя файла}

Например, есть каталог C:\MYLIB\Rus со звуковыми файлами:
   C:\MYLIB\
            Rus.txt
            Rus\00612.wav        (басня)
                00613.wav        (бассейн)
                00614.wav        (бастион)
                00615.wav        (бастовать)
                00616.wav        (батальон)
                00617.wav        (батарейка)
                00618.wav        (батарея)
                00619.ogg        (батист)
                00620.ogg        (батон)
                00622.mp3        (Как проехать в библиотеку?)
                00623.mp3        (Здравствуйте, Джон! Меня зовут Иван, я из России.)
                Привет.ogg        (Привет!)

Файл Rus.txt должен содержать следующие строки:

   басня 00612.wav
   бассейн 00613.wav
   бастион 00614.wav
   бастовать 00615.wav
   батальон 00616.wav
   батарейка 00617.wav
   батарея 00618.wav
   батист 00619.ogg
   батон 00620.ogg
   Как проехать в библиотеку? 00622.mp3
   Здравствуйте, Джон! Меня зовут Иван, я из России. 00623.mp3

Где " "- знак табуляции

Перекодировочный файл Rus.txt присоединяется программой автоматически при указании каталога C:\MYLIB\Rus
Если рядом с каталогом нет перекодировочного файла, то программа ищет его в своём каталоге Sounds. Если слово или фраза не обнаруживается в перекодировочном файле, то программа ищет в указанном каталоге или звуковой библиотеке файл с именем значения слова.
Например, в перекодировочном файле нет слова "Привет!", поэтому программа найдёт файл с именем "привет.ogg" по схеме описанной выше.
В перекодировочном файле необходимо указывать фразу со всеми знаками препинания за исключением скобок () и .

Структура библиотеки звуковых файлов SAE

Общая структура библиотеки:

Сначала идёт список слов и их смещение в библиотеке.
После этого идёт набор склеенных между собой WAV, MP3, OGG файлов. Слово можно проиграть, узнав его смещение.

Структура списка слов библиотеки:
       4 байта - смещение начала склеенных WAV, MP3, OGG -файлов
       4 байта - количество озвученных слов в файле.
       8 байт - ничего интересного 00000000
Дальше идут описание имён файлов и описание их смещений и размеров.

Формат описания следующий:
             1 байт - длина имени файла (ограничение имени файла с расширением = 256 символов)
             ИМЯ_ЗВУКОВОГО_ФАЙЛА.WAV в формате ANSISTRING
               ( Пробелы заменены знаком подчёркивания _ )
               ( Расширение wav, mp3 или ogg обязательно! )
             4 байта - длина WAV, MP3, OGG-файла
             4 байта - Смещение относительно начала склеенных WAV,MP3,OGG -файлов.
             ... Следующее слово.
             ... Последнее слово.
            Далее идёт склеенное между собой бинарное содержимое звуковых файлов WAV, MP3, OGG.

Библиотека в формате SAE не может напрямую содержать имена файлов в формате Unicode. Для использования библиотеки китайских, японских, индийских слов и фраз необходимо воспользоваться системой перекодировочных файлов (см. выше). В этом случае в библиотеке SAE будут храниться файлы с именами, например: dic001.mp3, dic00.mp3 и так далее. А рядом с библиотекой должен лежать перекодировочный файл в формате юникод с именем таким же, как и имя библиотеки SAE, но с расширением TXT.

Например:
SoundChina.sae
SoundChina.txt

При подсоединении библиотеки к программе перекодировочный файл расположенный рядом с ней подключается автоматически. Если рядом с библиотекой нет перекодировочного файла, то программа ищет его в своём каталоге Sounds.

Примечание:
Редактор подобного формата называется Sound Archive Editor (SAE), его можно скачать здесь: Setup_SAE.exe

Настройка схемы озвучивания

Методы обучения

Работа с программой

Настройка ...

Создание словарей

Ссылки