Галерея

#1

Место для выкладки работ созданных с использованием нейросетей. Если это ваше творчество, просьба указывать тип сети, и комментировать степень участия в создании - т.е. достигнут ли результат просто генерацией по тексту, требовалась выборка черновика, обработка для hi-res, inpaint деталей, и т.д.

#2

Для затравки.
Создано на одной из полуреалистичных моделей SD 1.5. Черновик предварительно отбирался из ~30 картинок размера 640х360, Затем твики prompt для подгонки деталей. После чего был применен upscale через основную модель до ~2K (здесь было с десяток попыток - подбирались параметры, чтобы вытянуть мелкие детали), и финальный downscale через 4x_foolhardy_Remacri до FullHD под формат для обоев.

#3

slant, какой-то неправильный энтерпрайз вышел

#4

Ну, это вообще-то просто дирижабль имелся в виду. Правда Sci-Fi разлива, но чисто атмосферный агрегат.

symon2014 · #5

Заказывал в Fooocus рыжего кота в чёрной шляпе и сапогах. Шляпа нормально. А вместо сапог получились берцы )) , и неизвестно откуда взялся жилет ))

symon2014 · #6

И вот что из этого получается

https://www.youtube.com/watch?v=im7ywgFvWDs

symon2014 · #7

https://www.youtube.com/watch?v=AgFU5Rjyz6c

symon2014 · #8

Не спалось

Слепил ещё чуду , краткий процесс создания в описании под роликом

https://youtu.be/wxtMN547Ru0

#9

Дошли у меня руки до аудио...
https://www.mediafire.com/file/jzktxv3z ... 9.mp3/file

Актриса чей голос использован (Helene Roles) - на русском не говорит, и вообще француженка. Потому и кавер тоже с акцентом.

А вот это - исходник который использовался как основа:
https://www.mediafire.com/file/0c4xx4sq ... d.mp3/file

Дела оказалось на 2 часа, из них 1.5 - тренировка модели голоса. Остальное - расщепление оригинала и датасета на голос и музыку, и потом сведение обратно музыки оригинала и нового голоса. Сама конвертация одного голоса в другой - минута или две.

#10

Как у них там с руками сейчас обстоят дела?

#11

У моделей на базе Pony XL (PDXL) - очень даже неплохо. При генерации шанс получить правильные пальцы сразу - примерно 70%.

Это если модель использовать правильно - не пытаться использовать маленькое разрешение и неправильные самплеры (Хотя бы одна сторона должна быть более 1024, а лучше - одна выше 1280, а вторая выше 900.) А самплеры - euler_a и dpm_2m. Остальные - очень ситуативно.

У PDXL с лицами несколько хуже чем у sd 1.5. Плохо детализированы на средних разрешениях (когда это уже не совсем портрет), и модель предпочитает выдавать одно лицо "по умолчанию". Решается через adetailer (для детализации и качества) и lora (чтобы получить не дефолтное лицо.)

У SDXL - что-то промежуточное между PDXL и SD 1.5.

#12

Еще один вариант: https://www.mediafire.com/file/9iuj3hvf ... 9.mp3/file
Трио. Оригинальный исполнитель и две модели.

Галерея

Галлерея

Галлерея

Галлерея

Галерея

Галерея

Галерея

Галерея

Галерея

Галерея

Галерея

Галерея

Кто сейчас на конференции