Общие разговоры
-
- Сообщения: 4535
- Зарегистрирован: 21 июн 2017, 18:09
- Решено: 101
- Благодарил (а): 51 раз
- Поблагодарили: 2006 раз
- Контактная информация:
Общие разговоры
Вот на счет нейросетей... Как ковыряющий эту тему уже с полгода, могу высказать несколько тезисов:
1. Называть Это AI или по нашему ИИ - неправильно в корне. Какой бы из смыслов (Интеллект/Идиот) не подразумевался.
Это нейросеть, но при этом - система, в принципе не имеющая никакого собственного мнения и мотивации что-либо делать, даже на уровне рефлексов (которых у нее тоже нет). Оно может лишь пропустить через себя какие-то данные, перемешав и выдав на выходе нечто "похожее/основанное" на них. И каждый раз - процесс будет абсолютно одинаковым для того же исходника, если специально не примешивать случайный "шум" к исходнику. В общем - крайне сложный, но все же - просто инструмент обработки данных. По схеме взаимодействия представляющий из себя классический "черный ящик" - дали что-то на вход, получили что-то на выходе. Без подачи на вход - на выходе ничего не будет. Если же "зациклить" выход на вход - результат очень быстро вырождается в повторяющуюся последовательность. Бессмысленную.
Возможно в будущем и будет развитие этого в нечто большее - но пока так. Восстание машин отменяется.
2. Нейросеть нихрена не "понимает" - что именно она делает. Даже разрекламированный ChatGPT. Потому для меня ни одна нейросеть не проходит тест Тьюринга - я быстро вижу характерные признаки что картинка или текст генерировались нейросеткой, именно из-за внутренней несвязности результата. Это трудно описать, но повозившись с этим - видишь, и очень четко - в том что генерирует нейросеть нет общего смысла, нет целостности. Что позволяет быстро определять что это работа нейросети. Причем для картинок - во многих случаях могу сказать какая именно модель использовалась (если использовался какой-то популярный микс или база).
3. Для тех у кого нет такого опыта - один из самых характерных признаков - руки. И ноги. Менее характерный - черты лица. Популярные модели имеют тенденцию генерировать лица с некоторыми общими чертами - это становится заметно когда сам их используешь. И хотя черты лица поддаются управлению - очень сложно скрыть ВСЕ черты. А добиться рук без ошибок - практически невозможно. Лишь где-то 2-5% изображений содержащих кисть будут без ошибок в анатомии (причем наверняка будут ошибки в чем то еще).
4. Нейросеть можно использовать как инструмент для улучшения картинки (даже предварительно сгенерированной этой же самой нейросеткой) и добиваться ошеломляющих результатов, в том числе и фотографического качества. Но только через ручное управление - овладеть которым, задача примерно равной сложности с овладением графическим редактором. Самые интересные результаты можно получить используя рисунок-основу - обычный скетч, CG, либо 3D рендер. Я такие изображения для себя называю AI-Assisted, в противовес разбежавшемуся по сайтам-галереям тегу AI-Generated. Т.к. ручного труда требуют лишь не многим меньше, чем чем просто рисование в графическом редакторе. А иногда и больше - далеко не все сюжеты поддаются обработке через нейросеть с равной легкостью и эффективностью. И еще одна серьезная проблема: трудно не получить красивый результат. Трудно получить ЖЕЛАЕМЫЙ результат. Т.е. если вы для себя видите какую-то картину, и хотите ее реализовать - даже через "ручное управление" достичь желаемого может быть много сложнее чем нарисовать эту картинку или смоделировать ее в 3D самостоятельно. Но вот работы вида AI-Assited распознать как работы созданные с помощью нейросети однозначно уже не получается.
5. Нейросеть не способна создать что либо новое. Она может лишь комбинировать части того, что в ней есть. Для графики - Т.к. модели тренировали на уже существующих произведениях - лучше всего у существующих моделей с портретами, причем поясными. Поставить персонажа в полный рост уже может быть некоторой сложностью (если не знать некоторых хитростей), при этом самый популярный ракурс - 3/4 или анфас. Уже повернуть строго в профиль персонажа - достаточно трудно. Показать со спины - ОЧЕНЬ трудно. А чтобы он еще и не оборачивался на зрителя - практически невозможно. То же самое касается поз и действий. Просто вспомните - чего вы не увидите на существующих картинах - и это будет практически невозможно получить от нейросетки.
6. При всем этом - изредка нейросеть способна создать шедевр практически сама, по самому примитивному запросу. Но... "Если посадить тысячу обезьян в комнату с пишущими машинками - при наличии достаточного времени они воспроизведут произведения Шекспира"(с) - вот эта цитата описывает ситуацию максимально полно. Получается такой шедевр все же чаще чем у обезьян Шекспир - но лишь потому, что нейросеть все же целенаправленно фильтрует закономерности соседних точек изображения (или слов текста) - постоянно сравнивает их с образцами близко расположенных точек/слов в модели, и как именно эти образцы были оценены. А не получается чаще - потому что сама она нихрена не понимает, и просто считает циферки - какая больше.
P.S. Извиняйте, если кому "убил магию" - но пока ее там в общем-то и нету. Просто инструмент. Чертовски интересный, с очень высоким потенциалом применения, но после полугода копания в теме - ни разу не дающий сомневаться в такой классификации.
1. Называть Это AI или по нашему ИИ - неправильно в корне. Какой бы из смыслов (Интеллект/Идиот) не подразумевался.
Это нейросеть, но при этом - система, в принципе не имеющая никакого собственного мнения и мотивации что-либо делать, даже на уровне рефлексов (которых у нее тоже нет). Оно может лишь пропустить через себя какие-то данные, перемешав и выдав на выходе нечто "похожее/основанное" на них. И каждый раз - процесс будет абсолютно одинаковым для того же исходника, если специально не примешивать случайный "шум" к исходнику. В общем - крайне сложный, но все же - просто инструмент обработки данных. По схеме взаимодействия представляющий из себя классический "черный ящик" - дали что-то на вход, получили что-то на выходе. Без подачи на вход - на выходе ничего не будет. Если же "зациклить" выход на вход - результат очень быстро вырождается в повторяющуюся последовательность. Бессмысленную.
Возможно в будущем и будет развитие этого в нечто большее - но пока так. Восстание машин отменяется.
2. Нейросеть нихрена не "понимает" - что именно она делает. Даже разрекламированный ChatGPT. Потому для меня ни одна нейросеть не проходит тест Тьюринга - я быстро вижу характерные признаки что картинка или текст генерировались нейросеткой, именно из-за внутренней несвязности результата. Это трудно описать, но повозившись с этим - видишь, и очень четко - в том что генерирует нейросеть нет общего смысла, нет целостности. Что позволяет быстро определять что это работа нейросети. Причем для картинок - во многих случаях могу сказать какая именно модель использовалась (если использовался какой-то популярный микс или база).
3. Для тех у кого нет такого опыта - один из самых характерных признаков - руки. И ноги. Менее характерный - черты лица. Популярные модели имеют тенденцию генерировать лица с некоторыми общими чертами - это становится заметно когда сам их используешь. И хотя черты лица поддаются управлению - очень сложно скрыть ВСЕ черты. А добиться рук без ошибок - практически невозможно. Лишь где-то 2-5% изображений содержащих кисть будут без ошибок в анатомии (причем наверняка будут ошибки в чем то еще).
4. Нейросеть можно использовать как инструмент для улучшения картинки (даже предварительно сгенерированной этой же самой нейросеткой) и добиваться ошеломляющих результатов, в том числе и фотографического качества. Но только через ручное управление - овладеть которым, задача примерно равной сложности с овладением графическим редактором. Самые интересные результаты можно получить используя рисунок-основу - обычный скетч, CG, либо 3D рендер. Я такие изображения для себя называю AI-Assisted, в противовес разбежавшемуся по сайтам-галереям тегу AI-Generated. Т.к. ручного труда требуют лишь не многим меньше, чем чем просто рисование в графическом редакторе. А иногда и больше - далеко не все сюжеты поддаются обработке через нейросеть с равной легкостью и эффективностью. И еще одна серьезная проблема: трудно не получить красивый результат. Трудно получить ЖЕЛАЕМЫЙ результат. Т.е. если вы для себя видите какую-то картину, и хотите ее реализовать - даже через "ручное управление" достичь желаемого может быть много сложнее чем нарисовать эту картинку или смоделировать ее в 3D самостоятельно. Но вот работы вида AI-Assited распознать как работы созданные с помощью нейросети однозначно уже не получается.
5. Нейросеть не способна создать что либо новое. Она может лишь комбинировать части того, что в ней есть. Для графики - Т.к. модели тренировали на уже существующих произведениях - лучше всего у существующих моделей с портретами, причем поясными. Поставить персонажа в полный рост уже может быть некоторой сложностью (если не знать некоторых хитростей), при этом самый популярный ракурс - 3/4 или анфас. Уже повернуть строго в профиль персонажа - достаточно трудно. Показать со спины - ОЧЕНЬ трудно. А чтобы он еще и не оборачивался на зрителя - практически невозможно. То же самое касается поз и действий. Просто вспомните - чего вы не увидите на существующих картинах - и это будет практически невозможно получить от нейросетки.
6. При всем этом - изредка нейросеть способна создать шедевр практически сама, по самому примитивному запросу. Но... "Если посадить тысячу обезьян в комнату с пишущими машинками - при наличии достаточного времени они воспроизведут произведения Шекспира"(с) - вот эта цитата описывает ситуацию максимально полно. Получается такой шедевр все же чаще чем у обезьян Шекспир - но лишь потому, что нейросеть все же целенаправленно фильтрует закономерности соседних точек изображения (или слов текста) - постоянно сравнивает их с образцами близко расположенных точек/слов в модели, и как именно эти образцы были оценены. А не получается чаще - потому что сама она нихрена не понимает, и просто считает циферки - какая больше.
P.S. Извиняйте, если кому "убил магию" - но пока ее там в общем-то и нету. Просто инструмент. Чертовски интересный, с очень высоким потенциалом применения, но после полугода копания в теме - ни разу не дающий сомневаться в такой классификации.
-
- Сообщения: 317
- Зарегистрирован: 08 сен 2016, 02:49
- Решено: 1
- Благодарил (а): 52 раза
- Поблагодарили: 192 раза
- Контактная информация:
Общие разговоры
Не по теме
по-хорошему от сообщения Анекдоты, юмор, приколы... (Пост hellonet #131890) и до текущего конца темы, кмк, уместно всё вынести в отдельную тему, и назвать в духе: "Графические нейросети - баловство", а после пояснений от @slant, добавить в заголовок "мифы и реальность"
-
- Сообщения: 844
- Зарегистрирован: 12 авг 2017, 09:09
- Решено: 13
- Откуда: Ростов-на-Дону
- Благодарил (а): 29 раз
- Поблагодарили: 204 раза
- Контактная информация:
Общие разговоры
Понятие ИИ меняется со временем.
В начале 19-го века за ИИ сошёл бы калькулятор.
В начале 20-го века за ИИ сошёл бы телефон с голосовым помощником.
В начале 19-го века за ИИ сошёл бы калькулятор.
В начале 20-го века за ИИ сошёл бы телефон с голосовым помощником.
Basic (ZXSpectrum)→Ms-Dos→W95→W98→Me→XP→W7→Ubuntu 15.10→Xubuntu 16.04→Linux Mint 18.2-21.1
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD
Контекстное меню Nemo
Сценарий вывода данных оценки ресурса диска SSD
-
- Сообщения: 4535
- Зарегистрирован: 21 июн 2017, 18:09
- Решено: 101
- Благодарил (а): 51 раз
- Поблагодарили: 2006 раз
- Контактная информация:
Общие разговоры
Не-а. ИИ - искусственный интеллект. Т.е. сущность аналогичная живому разуму. Пусть бы и не человеческому. Или хотя-бы - имитация животного с рефлексами и инстинктами. Это не меняется.
Меняется понимание - что именно разумом считать, но не "количественно" а скорее "качественно". Сейчас предполагается, что разум включает в себя умение не только решать но и ставить задачи для решения. Это умеет любое животное - оно ставит себе задачи (найти пищу, место для сна, и т.д.)
Нейросеть этого не умеет. Т.е. можно дать ей нужную модель и "команду" решать такие задачи - и она будет с ними справляться. Но собственных "желаний" у нее в принципе возникнуть не может, как и собственного отношения к задаче или хотя-бы "оценки приоритета". Если смотреть подробно - нейросеть имитирует только один из "механизмов" мозга/разума: выбор одного варианта из многих, на основе существующей модели (опыта). Модель после окончания тренировки - статична. Сама тренировка - отдельный процесс который интегрировать с "нормальной работой" пока не очень понятно как - т.к. он совершенно не автономен, и требует "переключения смысла работы" это трудно описать - но суть в том что нейросеть должна для обучения модели работать не так, как обычно. Неким аналогом можно считать электродвигатель - если подать на него ток - он будет крутить вал. А если самому крутить вал - получится генератор тока. Вот примерно так соотносится "обучение" и нормальная работа у текущих нейросетей, одновременно это не совмещается.
-
- Сообщения: 2048
- Зарегистрирован: 11 июн 2017, 21:47
- Решено: 30
- Откуда: BY
- Благодарил (а): 79 раз
- Поблагодарили: 438 раз
- Контактная информация:
Общие разговоры
Да уж, любопытно бы было как в процессе разрешения человеческих конфликтов нейросеть будет интерпретировать такое возражение одной из сторон как "это не по понятиям". Вообще на просторах Интернет имеет место в корне неверная, но устойчивая практика любые нейросети представлять как искусственный интеллект. Интересно было бы узнать как этот "ИИ" отредактирует графическое изображение с заданием "отредактировать так, чтобы выражение лица не было лошадиным".
-
- Сообщения: 4535
- Зарегистрирован: 21 июн 2017, 18:09
- Решено: 101
- Благодарил (а): 51 раз
- Поблагодарили: 2006 раз
- Контактная информация:
Общие разговоры
Никак. Нейросети текущего типа (пока?) не способны выносить многоплановые суждения. Нейросеть лишь может выбрать один из предлагаемых вариантов, основываясь на примерах взятых из модели. Да, учитываться в этом выборе может очень большое количество факторов (если они есть в модели), но сам выбор - единичен.
Для примера, нейросеть-автопилот: она в каждый момент времени лишь сравнивает текущую ситуацию с теми, что есть в ее модели. Находит максимальное соответствие текущей, и делает то, что сделали в подобном случае большинство водителей, чьи действия попали в базу модели. Не понимая зачем она это делает. Просто "миллионы леммингов не могут ошибаться" и "Все побежали - и я побежал".
Маршрут и его выбор - она этим не занимается, этим занят обычный алгоритм навикомпа. Он не умеет рулить, но знает куда надо добраться (GPS и т.д). И постоянно скармливает желаемое направление езды на вход нейросети. Как капитан корабля - рулевому. А нейросеть играет именно роль рулевого - ей самой пофиг куда, она лишь может ответить на вопрос "как в этот момент надо двигаться в заданном направлении, таким образом, чтобы не закончить в столбе или на встречке".
Сейчас есть экспериментальная нейросетка натренированная разбирать запрос подобного вида на естественном языке, и преобразовывать его в текст который можно скормить "обычным" нейросетям генерирующим графику. Результат такого каскадного выполнения - некоторая иллюзия, что такой каскад понимает о чем его просят. Но чудес там не получается. Хотя если быть совсем не в теме - можно знатно по удивляться что комп "понимает" такие запросы.
Но по сути - происходит каскадный процесс:
1. Анализируем картинку (нейросеть-классификатор графика->текст, распознание образов).
2. Получили что-то вроде "красивая картинка, девушка, лицо с признаками лошади".
3. Передаем на вход нейросети-преобразователя текста результат из пункта 2 и "убрать лошадиные черты лица".
4. Нейросетка анализирует то что ей дали, и "вычитает" неугодные нам слова из текста. На выходе что-то вроде "красивая картинка, девушка, лицо"
5. Результат из пункта 5 скармливается на вход обычной генерирующей нейросети.
6. Имеем картинку без упоминания "лошадиного лица". Зато с акцентом на лице - т.к. в тексте теперь просто "лицо" и сетка будет искать в модели как примеры в первую очередь те картинки, где "лицо" есть в описании, и является важным. Так что скорее всего в результате получим поясной (а то и одну голову) портрет, даже если изначально был ростовой. Чтобы такого избежать - нужно увеличить "вес" позы персонажа, т.е. указать что-то вроде "убрать лошадиные черты лица, портрет в полный рост" - после преобразования на вход генерации будет подано что-то вроде "красивая картинка, девушка, лицо, в портрет в полный рост". Но может и "красивая картинка, девушка, в портрет в полный рост" - и тогда может оказаться так, что она будет в маске или прикрываться веером, например...
Т.е. тут фактически работают три разных нейросети. Та что в пункте 1 это уже давняя разработка - широко используется для обучения генерирующих нейросетей, точнее - для черновой подготовки материала для моделей, т.к. каждая картинка для тренировки должна быть с текстовым описанием ее содержимого. А для общей тренировки сети их нужны десятки, если не сотни тысяч. Ну и в комплект почти всех интерфейсов к Stable Diffusion (той самой открытой прошлой осенью для публики генерирующией графику нейросети) она тоже входит. Ну и в автопилотах нечто подобное тоже.
Stable Diffusion - открытая генерирующая нейросеть. Генерирует картинку на основе текста, или/и исходной картинки.
И третья нейросеть - сейчас в виде плагина к Web GUI для Stable Diffusion уже доступна. Позволяет такое вот "командование" на естественном языке. Правда все это исключительно на английском.
-
- Сообщения: 2048
- Зарегистрирован: 11 июн 2017, 21:47
- Решено: 30
- Откуда: BY
- Благодарил (а): 79 раз
- Поблагодарили: 438 раз
- Контактная информация:
Общие разговоры
Полагаю, что это предложение может быть рассчитывать на то, что администрация форума может принять его к рассмотрению. Тем более, как мне видится, это будет не последнее сообщение на тему ИИ и нейросетей.
-
- Сообщения: 4535
- Зарегистрирован: 21 июн 2017, 18:09
- Решено: 101
- Благодарил (а): 51 раз
- Поблагодарили: 2006 раз
- Контактная информация:
Общие разговоры
Для такой темы - простой темы мало.
Решили сразу подфорум.
Некоторое изначальное наполнение от меня возможно будет чуть позже. Сегодня несколько не до того.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 0 гостей