Ссылки для упрощенного доступа

Ученые разработали синтезатор удмуртской речи


Лингвисты и программисты научили нейросеть зачитывать тексты на удмуртском.

Исследователи из Ижевска создали синтезатор удмуртской речи — программу, позволяющую преобразовать текстовые файлы в звуковые. Такие синтезаторы применяются в онлайн-переводчиках и других языковых приложениях, а также на сайтах, адаптированных под использование слабовидящими людьми.

Синтезатор речи стал результатом сотрудничества лингвистов из Удмуртского института истории, языка и литературы и специалистов в области искусственного интеллекта из Удмуртского федерального исследовательского центра Уральского отделения Российской академии наук.

В основу программы легла глубокая нейронная сеть Tacotron, которая обучалась на специально подготовленных текстах, озвученных ведущей радио "Моя Удмуртия" Светланой Пикулевой.

Cинтезатор окажется в открытом доступе уже в нынешнем виде — ученые планируют интегрировать первые наработки в Национальный корпус удмуртского языка в ближайшие дни, не дожидаясь окончательной версии программы.

Удмуртский — один из языков коренных народов России, относится к финно-угорской группе уральской языковой семьи. Носители языка проживают в Удмуртии, Татарстане, Башкортостане, Марий Эл и других регионах Поволжья и Урала, преимущественно в сельской местности. Переписи населения фиксируют падение числа носителей: если в 2002 году удмуртский в качестве родного языка указали 463 тысячи россиян, то в 2010 — 324 тысячи. Ученые и активисты в Удмуртии активно борются с проблемами ассимиляции и языкового сдвига. Аспирант Технологического университета города Брно (Чехия) Алексей Герасимов выделил собственные средства для публикации научной литературы на удмуртском языке. Летом в Удмуртии работает лагерь удмуртского языка "Яратоно удмурт кыл".

Ранее "Idel.Реалии" рассказывали о планах лингвиста Андрея Чемышева по созданию аналогичного синтезатора речи для марийского языка. Он будет использоваться в мобильном голосовом помощнике и в "Яндекс.Переводчике".

Подписывайтесь на наш канал в Telegram.

XS
SM
MD
LG