Mari-Lab
Для создания синтезатора марийской речи методом правил необходим аудиокорпус — аудиозаписи объёмом более 10 часов, записанные голосом того человека, чей голос предполагается "синтезировать", и собственно тексты этих записей. Довольно большие объёмы аудиозаписей на разных языках: коми, удмуртском, башкирском, крымско-татарском, чувашском и др. языках можно найти на сайте bible.is.
Мы мужским голосом выбрали голос актёра Марийского национального театра драмы им. М. Шкетана Павла Ефимова. На сайте bible.is он озвучивает послания святого апостола Павла. Выкачиваем аудио, в звуковом редакторе режем его по предложениям, предложения могут быть и короткие, и длинные, они все заканчиваются точкой, знаком восклицания или вопросительным знаком: 001.wav, 002.wav, 003.wav, ..., а в файлах 001.txt, 002.txt, 003.txt — размещаем текстовые файлы с текстами соответствующих предложений. В данном аудиокорпусе получилось более 8 часов аудиозаписи: cloud.mail.ru.
Чтобы добрать необходимый объём аудиозаписей, строим студию звукозаписи, пишем аудиокниги, запускаем подкаст... И этот аудиокорпус будем выкладывать сюда: cloud.mail.ru.
Содержание
Раскладка клавиатуры
Электронные словари
Сервис проверки правописания
Машинные переводчики
Электронная библиотека
- Электронный архив журнала «Ончыко»
- Электронный архив журнала «У сем»
- Электронный архив журнала «Марий сандалык»
- Марийские словари
- Учебники на марийском языке
- Писатели Марий Эл
- Электрон книгагудо (Марийская электронная библиотека)
- Электрон книгагудо (группа в ВКонтакте)
- Электрон книгагудо в Облаке Mail.Ru
- Марийские лингвисты
- Библиография журнала «Ончыко»
- Марийские электронные книги в формате FB2, EPUB
- Марийские аудиокниги