Тотальная неудачница и убийца жёстких дисков.
#post-id: 8138-00-48
#original-date: 6.11.2022 Sun
#original-time: 12:48 AM
#original-day: 8138
#original-host: WinXP Home SP3 (Build 2600)

Леденящий душу пиздец. Озвучка фрагмента моего рассказа нейросетью.

https://pics.lindachan.net/share/voice/0000.html

Вариант #1:

https://pics.lindachan.net/share/voice/0000.mp3

Сделан на этом сайте:

https://www.narro.co

Вариант #2:

https://pics.lindachan.net/share/voice/0000.wav

Сделан на этом сайте:

https://cybervoice.io

Первый сайт принимает URL текста и только в HTML формате. Второй сайт поддерживает разные варианты ввода, в том числе вставку простыни текста. Сейчас там всё бесплатное, но раздел «Prices» как бы намекает.

#upd(5.03.2023 - 4:10 PM):

Демоны подсказали ещё один сайт:

https://coqui.ai

Так как там поддерживается только английский, подготовила вот такое:

https://pics.lindachan.net/share/voice/0001.html

Переводила для теста вот таким переводчиком, который, якобы, лучше гуглотранслейта.

https://www.deepl.com/translator

Так вот, сервис озвучки немного замороченный, ему нельзя скормить текст и сказать, читать отсюда и до обеда. Там всё разбивается на реплики длинной в твит и каждая со своими настройками. Поэтому при вставке всего текста он автоматически разбивается на реплики, при чём по границе слов, а не предложений, из чего получаются паузы.

Короче, берём текст и ручками скармливаем по предложению. Да, у меня почти нигде не получилось так, чтобы в одной реплике было больше одного предложения, поэтому реплик была целая куча. Отсюда вытек ещё один нюанс. У каждой реплики свои настройки, и у них есть некое не заданное пользователем умолчание, так что каждую пришлось перенастроить. Групповые настройки тоже замечены не были, поэтому сначала мне пришлось в каждой реплике выбирать голос, а потом – настроение.

Получилось вот такое:

https://pics.lindachan.net/share/voice/0001.wav