Работа над созданием синтезатора марийской речи: различия между версиями
Андрей (обсуждение | вклад) Нет описания правки |
Андрей (обсуждение | вклад) Нет описания правки |
||
Строка 8: | Строка 8: | ||
[[Файл:001.mp3]] | [[Файл:001.mp3]] | ||
Тугеже идалыкым Венера виктара. Тиде – ӱдырамаш вий-куат. | |||
[[Файл:002.mp3]] | |||
[[Файл:002_2.mp3]] |
Версия от 12:12, 20 января 2022
Для создания синтезатора марийской речи методом правил необходим аудиокорпус — аудиозаписи объёмом 10-20 часов, записанные голосом того человека, чей голос предполагается "синтезировать", и собственно тексты этих записей.
Мы мужским голосом выбрали голос актёра Марийского национального театра драмы им. М. Шкетана Павла Ефимова. В звукозаписывающей студии записываем аудио, в звуковом редакторе режем его по предложениям, предложения могут быть и короткие, и длинные, они все заканчиваются точкой, знаком восклицания или вопросительным знаком: где 00101.wav, 00102.wav, 00103.wav, ... — разбитые по предложениям аудиофайлы, а 00101.txt, 00102.txt, 00103.txt, ... — текстовые файлы соответствующих предложений. Получаем такой аудиокорпус.
Пример датасета в формате The LJ Speech Dataset.
Салам, Андрей.
Тугеже идалыкым Венера виктара. Тиде – ӱдырамаш вий-куат.