Галерея
-
Автор темы - Сообщения: 4859
- Зарегистрирован: 21 июн 2017, 18:09
- Решено: 111
- Благодарил (а): 53 раза
- Поблагодарили: 2177 раз
- Контактная информация:
Галерея
Место для выкладки работ созданных с использованием нейросетей. Если это ваше творчество, просьба указывать тип сети, и комментировать степень участия в создании - т.е. достигнут ли результат просто генерацией по тексту, требовалась выборка черновика, обработка для hi-res, inpaint деталей, и т.д.
-
Автор темы - Сообщения: 4859
- Зарегистрирован: 21 июн 2017, 18:09
- Решено: 111
- Благодарил (а): 53 раза
- Поблагодарили: 2177 раз
- Контактная информация:
Галлерея
Для затравки.
Создано на одной из полуреалистичных моделей SD 1.5. Черновик предварительно отбирался из ~30 картинок размера 640х360, Затем твики prompt для подгонки деталей. После чего был применен upscale через основную модель до ~2K (здесь было с десяток попыток - подбирались параметры, чтобы вытянуть мелкие детали), и финальный downscale через 4x_foolhardy_Remacri до FullHD под формат для обоев.
Создано на одной из полуреалистичных моделей SD 1.5. Черновик предварительно отбирался из ~30 картинок размера 640х360, Затем твики prompt для подгонки деталей. После чего был применен upscale через основную модель до ~2K (здесь было с десяток попыток - подбирались параметры, чтобы вытянуть мелкие детали), и финальный downscale через 4x_foolhardy_Remacri до FullHD под формат для обоев.
-
- Сообщения: 5997
- Зарегистрирован: 16 дек 2017, 21:59
- Решено: 40
- Откуда: Феодосия
- Благодарил (а): 32 раза
- Поблагодарили: 762 раза
- Контактная информация:
Галерея
Заказывал в Fooocus рыжего кота в чёрной шляпе и сапогах. Шляпа нормально. А вместо сапог получились берцы )) , и неизвестно откуда взялся жилет ))
-
Автор темы - Сообщения: 4859
- Зарегистрирован: 21 июн 2017, 18:09
- Решено: 111
- Благодарил (а): 53 раза
- Поблагодарили: 2177 раз
- Контактная информация:
Галерея

https://www.mediafire.com/file/jzktxv3z ... 9.mp3/file
Актриса чей голос использован (Helene Roles) - на русском не говорит, и вообще француженка. Потому и кавер тоже с акцентом.

А вот это - исходник который использовался как основа:
https://www.mediafire.com/file/0c4xx4sq ... d.mp3/file
Дела оказалось на 2 часа, из них 1.5 - тренировка модели голоса. Остальное - расщепление оригинала и датасета на голос и музыку, и потом сведение обратно музыки оригинала и нового голоса. Сама конвертация одного голоса в другой - минута или две.

-
Автор темы - Сообщения: 4859
- Зарегистрирован: 21 июн 2017, 18:09
- Решено: 111
- Благодарил (а): 53 раза
- Поблагодарили: 2177 раз
- Контактная информация:
Галерея
У моделей на базе Pony XL (PDXL) - очень даже неплохо. При генерации шанс получить правильные пальцы сразу - примерно 70%.
Это если модель использовать правильно - не пытаться использовать маленькое разрешение и неправильные самплеры (Хотя бы одна сторона должна быть более 1024, а лучше - одна выше 1280, а вторая выше 900.) А самплеры - euler_a и dpm_2m. Остальные - очень ситуативно.
У PDXL с лицами несколько хуже чем у sd 1.5. Плохо детализированы на средних разрешениях (когда это уже не совсем портрет), и модель предпочитает выдавать одно лицо "по умолчанию". Решается через adetailer (для детализации и качества) и lora (чтобы получить не дефолтное лицо.)
У SDXL - что-то промежуточное между PDXL и SD 1.5.

Это если модель использовать правильно - не пытаться использовать маленькое разрешение и неправильные самплеры (Хотя бы одна сторона должна быть более 1024, а лучше - одна выше 1280, а вторая выше 900.) А самплеры - euler_a и dpm_2m. Остальные - очень ситуативно.
У PDXL с лицами несколько хуже чем у sd 1.5. Плохо детализированы на средних разрешениях (когда это уже не совсем портрет), и модель предпочитает выдавать одно лицо "по умолчанию". Решается через adetailer (для детализации и качества) и lora (чтобы получить не дефолтное лицо.)
У SDXL - что-то промежуточное между PDXL и SD 1.5.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей