Общие разговоры

#1

Нейросеть https://fusionbrain.ai/diffusion создала по запросу:

#2

Похож?

#3

hellonet писал(а): ↑
10 апр 2023, 15:17
Похож?

#4

E=mc2

#5

Коня на скаку остановит...

#6

hellonet, с конечностями у неё прям проблемы... а так прикольная игрушка

#7

WWolf писал(а): ↑
10 апр 2023, 15:44
с конечностями у неё прям проблемы...

Что есть , то есть. Но обещают исправлять помаленьку

#8

P.S. с велосипедами что-то тоже не срастается у сетки

P.P.S. ваще крыша (или что там у неё) поехала

#9

WWolf писал(а): ↑
10 апр 2023, 16:58
с велосипедами что-то тоже не срастается у сетки

Да у нее и с пингвином не срастается. На второй картинке сколько плавников(крыльев) у пингвина?

#10

Вот на счет нейросетей... Как ковыряющий эту тему уже с полгода, могу высказать несколько тезисов:
1. Называть Это AI или по нашему ИИ - неправильно в корне. Какой бы из смыслов (Интеллект/Идиот) не подразумевался.

Это нейросеть, но при этом - система, в принципе не имеющая никакого собственного мнения и мотивации что-либо делать, даже на уровне рефлексов (которых у нее тоже нет). Оно может лишь пропустить через себя какие-то данные, перемешав и выдав на выходе нечто "похожее/основанное" на них. И каждый раз - процесс будет абсолютно одинаковым для того же исходника, если специально не примешивать случайный "шум" к исходнику. В общем - крайне сложный, но все же - просто инструмент обработки данных. По схеме взаимодействия представляющий из себя классический "черный ящик" - дали что-то на вход, получили что-то на выходе. Без подачи на вход - на выходе ничего не будет. Если же "зациклить" выход на вход - результат очень быстро вырождается в повторяющуюся последовательность. Бессмысленную.
Возможно в будущем и будет развитие этого в нечто большее - но пока так. Восстание машин отменяется.

2. Нейросеть нихрена не "понимает" - что именно она делает. Даже разрекламированный ChatGPT. Потому для меня ни одна нейросеть не проходит тест Тьюринга - я быстро вижу характерные признаки что картинка или текст генерировались нейросеткой, именно из-за внутренней несвязности результата. Это трудно описать, но повозившись с этим - видишь, и очень четко - в том что генерирует нейросеть нет общего смысла, нет целостности. Что позволяет быстро определять что это работа нейросети. Причем для картинок - во многих случаях могу сказать какая именно модель использовалась (если использовался какой-то популярный микс или база).

3. Для тех у кого нет такого опыта - один из самых характерных признаков - руки. И ноги. Менее характерный - черты лица. Популярные модели имеют тенденцию генерировать лица с некоторыми общими чертами - это становится заметно когда сам их используешь. И хотя черты лица поддаются управлению - очень сложно скрыть ВСЕ черты. А добиться рук без ошибок - практически невозможно. Лишь где-то 2-5% изображений содержащих кисть будут без ошибок в анатомии (причем наверняка будут ошибки в чем то еще).
4. Нейросеть можно использовать как инструмент для улучшения картинки (даже предварительно сгенерированной этой же самой нейросеткой) и добиваться ошеломляющих результатов, в том числе и фотографического качества. Но только через ручное управление - овладеть которым, задача примерно равной сложности с овладением графическим редактором. Самые интересные результаты можно получить используя рисунок-основу - обычный скетч, CG, либо 3D рендер. Я такие изображения для себя называю AI-Assisted, в противовес разбежавшемуся по сайтам-галереям тегу AI-Generated. Т.к. ручного труда требуют лишь не многим меньше, чем чем просто рисование в графическом редакторе. А иногда и больше - далеко не все сюжеты поддаются обработке через нейросеть с равной легкостью и эффективностью. И еще одна серьезная проблема: трудно не получить красивый результат. Трудно получить ЖЕЛАЕМЫЙ результат. Т.е. если вы для себя видите какую-то картину, и хотите ее реализовать - даже через "ручное управление" достичь желаемого может быть много сложнее чем нарисовать эту картинку или смоделировать ее в 3D самостоятельно. Но вот работы вида AI-Assited распознать как работы созданные с помощью нейросети однозначно уже не получается.
5. Нейросеть не способна создать что либо новое. Она может лишь комбинировать части того, что в ней есть. Для графики - Т.к. модели тренировали на уже существующих произведениях - лучше всего у существующих моделей с портретами, причем поясными. Поставить персонажа в полный рост уже может быть некоторой сложностью (если не знать некоторых хитростей), при этом самый популярный ракурс - 3/4 или анфас. Уже повернуть строго в профиль персонажа - достаточно трудно. Показать со спины - ОЧЕНЬ трудно. А чтобы он еще и не оборачивался на зрителя - практически невозможно. То же самое касается поз и действий. Просто вспомните - чего вы не увидите на существующих картинах - и это будет практически невозможно получить от нейросетки.
6. При всем этом - изредка нейросеть способна создать шедевр практически сама, по самому примитивному запросу. Но... "Если посадить тысячу обезьян в комнату с пишущими машинками - при наличии достаточного времени они воспроизведут произведения Шекспира"(с) - вот эта цитата описывает ситуацию максимально полно. Получается такой шедевр все же чаще чем у обезьян Шекспир - но лишь потому, что нейросеть все же целенаправленно фильтрует закономерности соседних точек изображения (или слов текста) - постоянно сравнивает их с образцами близко расположенных точек/слов в модели, и как именно эти образцы были оценены. А не получается чаще - потому что сама она нихрена не понимает, и просто считает циферки - какая больше.

P.S. Извиняйте, если кому "убил магию" - но пока ее там в общем-то и нету.

Просто инструмент. Чертовски интересный, с очень высоким потенциалом применения, но после полугода копания в теме - ни разу не дающий сомневаться в такой классификации.

#11

Не по теме

по-хорошему от сообщения Анекдоты, юмор, приколы... (Пост hellonet #131890) и до текущего конца темы, кмк, уместно всё вынести в отдельную тему, и назвать в духе: "Графические нейросети - баловство", а после пояснений от @slant, добавить в заголовок "мифы и реальность"

#12

Понятие ИИ меняется со временем.
В начале 19-го века за ИИ сошёл бы калькулятор.
В начале 20-го века за ИИ сошёл бы телефон с голосовым помощником.

#13

demonlibra писал(а): ↑
11 апр 2023, 07:55
Понятие ИИ меняется со временем.

Не-а. ИИ - искусственный интеллект. Т.е. сущность аналогичная живому разуму. Пусть бы и не человеческому. Или хотя-бы - имитация животного с рефлексами и инстинктами. Это не меняется.

Меняется понимание - что именно разумом считать, но не "количественно" а скорее "качественно". Сейчас предполагается, что разум включает в себя умение не только решать но и ставить задачи для решения. Это умеет любое животное - оно ставит себе задачи (найти пищу, место для сна, и т.д.)
Нейросеть этого не умеет. Т.е. можно дать ей нужную модель и "команду" решать такие задачи - и она будет с ними справляться. Но собственных "желаний" у нее в принципе возникнуть не может, как и собственного отношения к задаче или хотя-бы "оценки приоритета". Если смотреть подробно - нейросеть имитирует только один из "механизмов" мозга/разума: выбор одного варианта из многих, на основе существующей модели (опыта). Модель после окончания тренировки - статична. Сама тренировка - отдельный процесс который интегрировать с "нормальной работой" пока не очень понятно как - т.к. он совершенно не автономен, и требует "переключения смысла работы" это трудно описать - но суть в том что нейросеть должна для обучения модели работать не так, как обычно. Неким аналогом можно считать электродвигатель - если подать на него ток - он будет крутить вал. А если самому крутить вал - получится генератор тока. Вот примерно так соотносится "обучение" и нормальная работа у текущих нейросетей, одновременно это не совмещается.

#14

slant писал(а): ↑
11 апр 2023, 11:44
а скорее "качественно"

Да уж, любопытно бы было как в процессе разрешения человеческих конфликтов нейросеть будет интерпретировать такое возражение одной из сторон как "это не по понятиям". Вообще на просторах Интернет имеет место в корне неверная, но устойчивая практика любые нейросети представлять как искусственный интеллект. Интересно было бы узнать как этот "ИИ" отредактирует графическое изображение с заданием "отредактировать так, чтобы выражение лица не было лошадиным".

#15

madesta писал(а): ↑
11 апр 2023, 13:53
Да уж, любопытно бы было как в процессе разрешения человеческих конфликтов нейросеть будет интерпретировать такое возражение одной из сторон как "это не по понятиям".

Никак. Нейросети текущего типа (пока?) не способны выносить многоплановые суждения. Нейросеть лишь может выбрать один из предлагаемых вариантов, основываясь на примерах взятых из модели. Да, учитываться в этом выборе может очень большое количество факторов (если они есть в модели), но сам выбор - единичен.
Для примера, нейросеть-автопилот: она в каждый момент времени лишь сравнивает текущую ситуацию с теми, что есть в ее модели. Находит максимальное соответствие текущей, и делает то, что сделали в подобном случае большинство водителей, чьи действия попали в базу модели. Не понимая зачем она это делает. Просто "миллионы леммингов не могут ошибаться" и "Все побежали - и я побежал".
Маршрут и его выбор - она этим не занимается, этим занят обычный алгоритм навикомпа. Он не умеет рулить, но знает куда надо добраться (GPS и т.д). И постоянно скармливает желаемое направление езды на вход нейросети. Как капитан корабля - рулевому. А нейросеть играет именно роль рулевого - ей самой пофиг куда, она лишь может ответить на вопрос "как в этот момент надо двигаться в заданном направлении, таким образом, чтобы не закончить в столбе или на встречке".

madesta писал(а): ↑
11 апр 2023, 13:53
"отредактировать так, чтобы выражение лица не было лошадиным".

Сейчас есть экспериментальная нейросетка натренированная разбирать запрос подобного вида на естественном языке, и преобразовывать его в текст который можно скормить "обычным" нейросетям генерирующим графику. Результат такого каскадного выполнения - некоторая иллюзия, что такой каскад понимает о чем его просят. Но чудес там не получается. Хотя если быть совсем не в теме - можно знатно по удивляться что комп "понимает" такие запросы.

Но по сути - происходит каскадный процесс:
1. Анализируем картинку (нейросеть-классификатор графика->текст, распознание образов).
2. Получили что-то вроде "красивая картинка, девушка, лицо с признаками лошади".
3. Передаем на вход нейросети-преобразователя текста результат из пункта 2 и "убрать лошадиные черты лица".
4. Нейросетка анализирует то что ей дали, и "вычитает" неугодные нам слова из текста. На выходе что-то вроде "красивая картинка, девушка, лицо"
5. Результат из пункта 5 скармливается на вход обычной генерирующей нейросети.
6. Имеем картинку без упоминания "лошадиного лица".

Зато с акцентом на лице - т.к. в тексте теперь просто "лицо" и сетка будет искать в модели как примеры в первую очередь те картинки, где "лицо" есть в описании, и является важным. Так что скорее всего в результате получим поясной (а то и одну голову) портрет, даже если изначально был ростовой. Чтобы такого избежать - нужно увеличить "вес" позы персонажа, т.е. указать что-то вроде "убрать лошадиные черты лица, портрет в полный рост" - после преобразования на вход генерации будет подано что-то вроде "красивая картинка, девушка, лицо, в портрет в полный рост". Но может и "красивая картинка, девушка, в портрет в полный рост" - и тогда может оказаться так, что она будет в маске или прикрываться веером, например...

Т.е. тут фактически работают три разных нейросети. Та что в пункте 1 это уже давняя разработка - широко используется для обучения генерирующих нейросетей, точнее - для черновой подготовки материала для моделей, т.к. каждая картинка для тренировки должна быть с текстовым описанием ее содержимого. А для общей тренировки сети их нужны десятки, если не сотни тысяч. Ну и в комплект почти всех интерфейсов к Stable Diffusion (той самой открытой прошлой осенью для публики генерирующией графику нейросети) она тоже входит. Ну и в автопилотах нечто подобное тоже.
Stable Diffusion - открытая генерирующая нейросеть. Генерирует картинку на основе текста, или/и исходной картинки.
И третья нейросеть - сейчас в виде плагина к Web GUI для Stable Diffusion уже доступна. Позволяет такое вот "командование" на естественном языке. Правда все это исключительно на английском.

symon2014 · #16

Пора защитить диссертацию )) Материала достаточно

#17

symon2014 писал(а): ↑
11 апр 2023, 15:40
Пора защитить диссертацию

Не, у аттестационной комиссии свои дети и родственники имеются. У нас же "молодым везде у нас дорога".

#18

Уважаемые модераторы, может реально сделать из этого отдельную тему? и перенести все посты в неё?

#19

hellonet писал(а): ↑
11 апр 2023, 15:51
может реально сделать из этого отдельную тему

Полагаю, что это предложение может быть рассчитывать на то, что администрация форума может принять его к рассмотрению. Тем более, как мне видится, это будет не последнее сообщение на тему ИИ и нейросетей.

#20

hellonet писал(а): ↑
11 апр 2023, 15:51
Уважаемые модераторы, может реально сделать из этого отдельную тему? и перенести все посты в неё?

Для такой темы - простой темы мало.
Решили сразу подфорум.

Некоторое изначальное наполнение от меня возможно будет чуть позже. Сегодня несколько не до того.

Кто сейчас на конференции