Тотальная неудачница и убийца жёстких дисков.
#post-id: 8138-00-48
#original-date: 6.11.2022 Sun
#original-time: 12:48 AM
#original-day: 8138
#original-host: WinXP Home SP3 (Build 2600)
Леденящий душу пиздец. Озвучка фрагмента моего рассказа нейросетью.
https://pics.lindachan.net/share/voice/0000.html
Вариант #1:
https://pics.lindachan.net/share/voice/0000.mp3
Сделан на этом сайте:
https://www.narro.co
Вариант #2:
https://pics.lindachan.net/share/voice/0000.wav
Сделан на этом сайте:
https://cybervoice.io
Первый сайт принимает URL текста и только в HTML формате. Второй сайт поддерживает разные варианты ввода, в том числе вставку простыни текста. Сейчас там всё бесплатное, но раздел «Prices» как бы намекает.
#upd(5.03.2023 - 4:10 PM):
Демоны подсказали ещё один сайт:
https://coqui.ai
Так как там поддерживается только английский, подготовила вот такое:
https://pics.lindachan.net/share/voice/0001.html
Переводила для теста вот таким переводчиком, который, якобы, лучше гуглотранслейта.
https://www.deepl.com/translator
Так вот, сервис озвучки немного замороченный, ему нельзя скормить текст и сказать, читать отсюда и до обеда. Там всё разбивается на реплики длинной в твит и каждая со своими настройками. Поэтому при вставке всего текста он автоматически разбивается на реплики, при чём по границе слов, а не предложений, из чего получаются паузы.
Короче, берём текст и ручками скармливаем по предложению. Да, у меня почти нигде не получилось так, чтобы в одной реплике было больше одного предложения, поэтому реплик была целая куча. Отсюда вытек ещё один нюанс. У каждой реплики свои настройки, и у них есть некое не заданное пользователем умолчание, так что каждую пришлось перенастроить. Групповые настройки тоже замечены не были, поэтому сначала мне пришлось в каждой реплике выбирать голос, а потом – настроение.
Получилось вот такое:
https://pics.lindachan.net/share/voice/0001.wav
#original-date: 6.11.2022 Sun
#original-time: 12:48 AM
#original-day: 8138
#original-host: WinXP Home SP3 (Build 2600)
Леденящий душу пиздец. Озвучка фрагмента моего рассказа нейросетью.
https://pics.lindachan.net/share/voice/0000.html
Вариант #1:
https://pics.lindachan.net/share/voice/0000.mp3
Сделан на этом сайте:
https://www.narro.co
Вариант #2:
https://pics.lindachan.net/share/voice/0000.wav
Сделан на этом сайте:
https://cybervoice.io
Первый сайт принимает URL текста и только в HTML формате. Второй сайт поддерживает разные варианты ввода, в том числе вставку простыни текста. Сейчас там всё бесплатное, но раздел «Prices» как бы намекает.
#upd(5.03.2023 - 4:10 PM):
Демоны подсказали ещё один сайт:
https://coqui.ai
Так как там поддерживается только английский, подготовила вот такое:
https://pics.lindachan.net/share/voice/0001.html
Переводила для теста вот таким переводчиком, который, якобы, лучше гуглотранслейта.
https://www.deepl.com/translator
Так вот, сервис озвучки немного замороченный, ему нельзя скормить текст и сказать, читать отсюда и до обеда. Там всё разбивается на реплики длинной в твит и каждая со своими настройками. Поэтому при вставке всего текста он автоматически разбивается на реплики, при чём по границе слов, а не предложений, из чего получаются паузы.
Короче, берём текст и ручками скармливаем по предложению. Да, у меня почти нигде не получилось так, чтобы в одной реплике было больше одного предложения, поэтому реплик была целая куча. Отсюда вытек ещё один нюанс. У каждой реплики свои настройки, и у них есть некое не заданное пользователем умолчание, так что каждую пришлось перенастроить. Групповые настройки тоже замечены не были, поэтому сначала мне пришлось в каждой реплике выбирать голос, а потом – настроение.
Получилось вот такое:
https://pics.lindachan.net/share/voice/0001.wav