Образцы марийской речи

Материал из Mari-Lab
Перейти к: навигация, поиск
Nylle ik shoya.jpg

Аудиокорпус с образцами речи необходим для создания системы распознавания речи и других продуктов, использующих речевые технологии. Для создания аудиокорпуса с образцами марийской речи будем использовать сборник марийских народных сказок «Сорок одна небылица».

Как помочь проекту

Организаторы надеятся на соучастность каждого марийца в данном проекте. Любой желающий помочь проекту может скачать файлы, которые надо озвучить, записать на цифровой диктофон или смартфон и выслать записанные файлы на почтовый адрес организаторов проекта: marisong@yandex.ru. Нам важны образцы речи любого человека: ребёнка, молодого человека, девушки, юноши, отцов, матерей, дедов и бабушек. Не играет роли как человек читает: бегло или выразительно, есть ли у него дефекты речи или нет.

Nylly ik altalymash.jpg

Для тех, кто будет читать на луговой литературной норме марийского языка: «Нылле ик шоя» в формате: pdf, docx, fb2, epub или mobi, а для горной литературной норме марийского языка — «Нӹллӹ ик алталымаш» в формате: pdf, docx, fb2, epub или mobi.

Кто желает читать только с книг, можно попытаться купить «Нылле ик шоя» 2018 года издания, а «Нӹллӹ ик алталымаш» вряд ли найдёте в продаже — эта книга издавалась аж в 1989 году. Можно скачать файл в docx-формате и распечатать их на принтере.

В конце каждой сказки записывающий будет говорить: “Я, Иванов Иван Иванович, 1960 года рождения, разрешаю использовать данную запись под любой свободной лицензией. г. Йошкар-Ола, Республика Марий Эл”. Исходные файлы не будут выкладываться в свободный доступ, а будут храниться отдельно для случаев при возникновения споров и пр. Сами записи со сказками, без вышеуказанной дописки об имени, года рождения, разрешения на использование записи и места проживания, будут отдельными треками выкладываться в сеть под свободной лицензией.

Перед началом записи прочтите весь материал про себя. Каждую сказку записывайте отдельным треком (файлом), не старайтесь за один присест записать все 10 сказок: в конце обычно будет язык заплетаться. Лучше всего записывать в 2 подхода по 5 сказок. Если вы запнулись, не останавливая запись, перечитайте заново данное предложение.

Запись на смартфон

Для чтения с телефона, планшета лучше всего использовать программу-читалку электронных книг. Если ваш смартфон на ОС Android, зайдите с него на Play Маркет и установите любую читалку для электронных книг, например: eBoox. Обратите внимание, что программа-читалка ReadEra не отображает заглавную букву Ӹ.

Diktofon.jpg

Для записи используйте программу "Диктофон", которая есть в каждом смартфоне. Предварительно в настройках выставьте необходимый формат, качество записи. Предпочтительней, конечно, WAV-формат. Но файлы такого формата относительно тяжёлые. Эти файлы пересылать организаторам проекта получится только с использованием облака: Mail, Яндекс или Google.

Организаторов вполне устроит и mp3-формат, при этом качество записи не забудьте выставить "Высокое" — для дешёвых моделей Xiaomi — это 192 бит/c. Такие файлы легко пересылать по электронной почте. Не забывайте адрес организаторов: marisong@yandex.ru.

Если вы в своём смартфоне не нашли приложение "Диктофон", то его легко сможете скачать, например, для ОС Android в Play Маркете выберите любое бесплатное приложение "Диктофон".

Запись на цифровой диктофон (рекордер)

Удобней всего записывать на цифровые диктофоны или портативные рекордеры. Записанные треки с помощью usb-шнуров легко перекидываются на компьютер или ноутбук, которые затем отсылаются на почтовый адрес организаторов проекта с использованием облака: Mail, Яндекс или Google.

Tascam.jpg

Портативные рекордеры обычно записывают в WAV-формате. Например, "Мӱкш орол" весит около 20 Мб, "Маска, рывыж, еҥ" — свыше 20 Мб, "Нылле ик шоя" — около 25 Мб, "Моско бурмистр" — около 15 Мб, "Тумна ден рывыж" — около 15 Мб, "Ош вӱльӧ" — около 40 Мб, "Кугыватын ӱдыржӧ" — свыше 40 Мб, "Рывыж ден киса" — свыше 15 Мб, "Шершаш" — свыше 65 Мб, "Шым тулык ӱдыр" — около 60 Мб. Эти показатели получились при записи портативным рекордером TASCAM DR-22WL, где характеристика WAV: 44100 Hz, 16 bit, Mono.

Ссылки