Автор Тема: Играемся с нейросетками - MidJorney, Stable Diffusion и прочие. (Прочитано 1152 раз)

Михайлов Саша · « : 24 Апрель 2023, 04:32:03 »

Суть, наверное, понятна и из названия темы, но все-таки немного разовью мысль.
В последнее время в сети много говорят по поводу разных нейросеток - и тех, которые умеют писать текст (и не только текст, оказывается - с удивлением узнал, что ChatGPT вполне способен писать вполне корректные основы для разного рода программ или Web-страниц, что многие даже в работе используют: для написания макросов к таблицам, если работают с ними, например), и тех, которые умеют создавать картинки (и уже не только картинки, но и короткие видео) по текстовому описанию либо преобразовывать уже существующие. Решил с этим делом поиграться и я. Работа с текстом мне в этом плане не особо интересна, а вот картинки это уже совсем другой вопрос. Рисовать - во всяком случае людей так точно - я умею столь "хорошо", что сказать "не умею вообще" будет чертовским преувеличением моих умений, а нарисовать... может не приспичило, но захотелось уж точно. Если конкретнее, то нарисовать потихоньку если не всех, то хотя бы часть основных персонажей для того монструозного фанфика, который я потихоньку (надо дописать-таки главу, которую пишу третий год... кой черт меня понес писать крайне эмоциональные несколько сцен?) пишу.
В итоге, первая нейросетка, с которой познакомился, это MidJorney, бесплатный доступ к которой, увы, ныне закрыт на неопределенный срок полностью, раньше же давали не то 20, не то 25 бесплатных попыток. Разумеется, бесплатных попыток мне не хватило и близко - кое-как разобрался с адекватным составлением запросов, не более того - но и платить весьма заметную (20, что ли долларов) сумму за месяц доступа желания не было. Оказалось, впрочем, все довольно просто - "недорегистрированный" (без привязки к электронной почте) аккаунт в Discord бота-нейросетку вполне устраивал, а таких аккаунтов через приватное окно браузера прекрасно можно заводить "сколько желание есть". Окей, с попытками разобрались, составляем нужные запросы (раз за разом - стараясь попасть поближе к тому, что хочется, так как описание-то на английском вбивать надо), крутим-вертим-пытаемся до тех пор, пока что-нибудь интересное не получится. Честно скажу, что крутил по итогу не только я, но и две мои подруги тоже из интереса и для помощи (одна из них потом еще помогла с небольшим допиливанием в фотошопе - нейросетка редко когда делает глаза точно нужного цвета, идеально попасть в цвет одежки тоже не всегда выходит (впрочем, тут уже от формулировки зависит еще), ну и у нейросетей очень "хорошие" отношения с ладонями и пальцами: удлинить до безумия, сделать 7-8-10 тоненьких, длинющих и узеньких пальцев/слипшиеся пальцы вместо 5 нормальных - все это в легкую, увы).
Однако, вот что получилось в итоге, после лютого количества попыток и небольшого (именно что небольшого - в основном глаза и пальцы) допиливания в фотошопе (указываю заодно имя персонажа):
Мортэ:

Афина:

Гелия (собственно, она это тот самый персонаж, который фигурировал в серии Stargate:Atlantis s3e10 "Возвращение, часть 1", просто тут она моложе):

Некононичная версия мобильной платформы СУЗИ (EDI):

https://cdn.discordapp.com/attachments/677379479437574169/1072281013159473236/797e0ed7b426636c.jpg

Играемся с нейросетками - MidJorney, Stable Diffusion и прочие.

Но всему хорошему, увы, рано или поздно приходит конец, и в один нерадостный момент выяснилось, что бесплатного пробного доступа к MidJorney уже нет. Но персонажи, картинки к которым хотелось бы иметь, все еще очень есть, даже среди главных героев. Как-то это было... печально. Поиски чего-то годного привели примерно к ничему - платный доступ в одном месте, платный в другом, никакущее качество в третьем, альфа-тест с доступом "по приглашению" в четвертом...
В итоге удалось наткнуться на нейросеть Stable Diffusion. И вот тут уже стало интереснее. У нее есть определенные минусы: во-первых она ставится на комп, к которому есть какие-никакие, но требования; во-вторых интерфейс у нее навскидку менее удобен (или, правильнее сказать, более сложен), чем у MidJorney, так как последний все же работает в режиме бота для дискорда, и требуется просто отправить запрос. Зато есть и плюсы: во-первых, число генерируемых картинок ограничивается лишь желанием и фантазией; во-вторых, эта сеть умеет работать с как созданной ей же, так и готовой картинкой - при желании можно выделить область и дать запрос перерисовать эту область либо все вокруг нее, например полностью сменить фон, не имея заранее готового (более того - сейчас появился еще плагин, позволяющий подцепить эту сеть к фотошопу напрямую); ну и наконец эта сеть имеет ВОРОХ как основных, так и вспомогательных натренированных моделей, которые позволяют творить очень и очень крутые вещи. Пока что, к сожалению, разобрался я с этой сеткой далеко не так хорошо, как хотелось бы (оптимистично считаю, что процентов на 10-15 разобрался - все же техническая сторона вопроса - модели и прочее - мне дается пока прощен, чем "кишки", то бишь то самое, для чего эта нейросеть и нужна - генерирование и изменение картинок), но вот три примера, которые сделаны по простым, в общем-то, запросам, и единственное изменение, которому я из подверг, это увеличение вчетверо (изначально рекомендуется генерировать изображения в разрешении 512*512 пикселей, чтобы избежать проблем типа удваивающегося лица и т.п.):
woman, european, 35 yo, pale skin, in mass effect armor, light caramel hair, uneven haircut, futuristic city in the background:

woman, european, 35 yo, pale skin, in mass effect armor, apricot hair, uneven haircut, futuristic city in the background:

Конечно, качество пока хромает, но и вспомогательные модели, которые нормально повышают качество мордахи, я не использовал - фактически это просто была попытка разобраться, заработает ли с моим железом увеличение (как выяснилось - да, работает), а эти три картинки были выбраны в роли примеров. Есть куда стремиться - надо попробовать увеличение с иными моделями апскейла, точно надо попробовать модели, улучшающие качество мелких деталей типа лица, глаз и волос - но сам по себе эксперимент, как мне кажется, удался.
Если что, версия нейросетки, которая у меня стоит, это Stable Diffusion Portable: от классики отличается тем, что не нужно долбать себе мозга скачиванием одного тут, другого там, третьего еще где-то - установочник одним куском, хотя и скачивает файлы из сети (правда, предустановленных моделей она не имеет вообще, все скачивать на свой вкус). Минимум по требованиям - 4 гига памяти видеокарты, 8 гигов оперативки на компе (думаю, можно и при 4 гигах установить, но это из области "при установке в ту сторону не смотреть, не дышать и даже не думать" - даже мне при 8 гигах пришлось с закрытым браузером (правда, там под сотню вкладок висит) ждать, пока установится, иначе вылетала установка где-то на половине), места на жестком диске или твердотельнике гигов так от 20 и до бесконечности (сейчас у меня - даже с учетом того, что модели для увеличения мордахи у меня еще не установлены, например - папка разожралась гигов до 60, хотя часть моделей я, наверное, все же снесу, так как на мой вкус "не то").

Кто-нибудь кроме меня экспериментировал с чем-то в этом духе?

sergeycot · « **Ответ #1 :** 24 Апрель 2023, 06:09:11 »

Ага, вот почему ты в сети постоянно. Я то думал ты сова конкретная, спишь днем, а тут выныриваешь на сайте в то время когда у тебя глубокая ночь. Вот оно что, вместо спать, с Нейросветкой общаешся

.
А если серьезно, только слышал, сам даже не пробовал и не знал что можно не только ученым.

Михайлов Саша · « **Ответ #2 :** 24 Апрель 2023, 06:32:44 »

Цитата: sergeycot от 24 Апрель 2023, 06:09:11

Я то думал ты сова конкретная, спишь днем, а тут выныриваешь на сайте в то время когда у тебя глубокая ночь.

Собственно, недалеко от истины... Стараюсь совсем уж не совятничать по возможности, но получается обычно как-то... посредственно, мягко говоря.

Цитата: sergeycot от 24 Апрель 2023, 06:09:11

не знал что можно не только ученым.

Ну, если комп по параметрам попадает, то вполне можно попробовать поразвлекаться со Stable Diffusion, дело довольно интересное. Можно и в виде ботов в Telegram/Discord (да и просто в сети попадаются), но функционал, пожалуй, у них все же меньше (плюс еще найти вменяемый бесплатный вариант с открытым доступом не так просто стало, увы.

Блин, сейчас понял, что можно попробовать все в том же SD (либо в комбинации с фотожабой) сделать, например, план аквариума. Причем хоть под имеющиеся коряги-камни-растения. Реально попробовать забавы ради, что ли?..

Marie · « **Ответ #3 :** 24 Апрель 2023, 08:07:10 »

У MidJorney классные лица получились. У Stable Diffusion какие-то все одинаковые.

Цитата: Михайлов Саша от 24 Апрель 2023, 06:32:44

сделать, например, план аквариума. Причем хоть под имеющиеся коряги-камни-растения. Реально попробовать забавы ради, что ли?..

А вот это очень даже интересно!

Михайлов Саша, фанфик по Масс Эффекту?

Михайлов Саша · « **Ответ #4 :** 24 Апрель 2023, 08:40:37 »

Цитата: Marie от 24 Апрель 2023, 08:07:10

У Stable Diffusion какие-то все одинаковые.

Ну так запрос был "проще некуда" - чисто сетку потестировать. В MidJorney запросы-то на несколько строк были (даже по одежде одной строка примерно), а тут я как раз привел запросы и что получилось. Мордахи-то там можно и перегенерить легко, в общем-то - и просто так, и все больше уточняя (тут-то я ни цвет глаз не задавал, ни какие-то мелочи). Хотелось в первую очередь понять, сможет оно броньку из МЭ (хотя бы плюс-минус) сделать или же нет... Условно может, но, похоже, как минимум конкретно эта модель любит Железного человека - иначе как-то объяснить "реактор Старка" на каждой второй броне не выйдет. Конечно, опять же можно и нужно корректировать все там же, генерируя нужный участок картинки, но проверки ради сойдет, чтобы прикинуть, насколько жизнеспособно такое применение конкретно данной модели.

Цитата: Marie от 24 Апрель 2023, 08:07:10

А вот это очень даже интересно!

Ну, наверное попытаюсь потыкаться в эту сторону вечерком...
Жаль, что у меня не хватит мощности компа на обучение гиперсеток (вспомогательных моделей) - там уже 6 гигов видеопамяти нужно - а то попытался бы понаходить фоток/скринов из старых книг/рисунков плана аквариума и скормил бы нейросетке, чтобы получить вспомогательную именно для построения планов аквариума/террариума... Да и в целом идеи касательно гиперсеток есть (готовые образцы, к сожалению, не под любую задачу можно найти), а вот возможности их обучать пока нет (впрочем, возможно подруга поможет - все-таки даже ноутбучная RTX 3060 сильно превосходит мою GTX 1050Ti по всем параметрам).

А, да, забыл добавить - увы, но владельцам видюх от AMD не повезло: как минимум пока что Stable Diffusion запускается только на видеокартах от Nvidia...

Цитата: Marie от 24 Апрель 2023, 08:07:10

Михайлов Саша, фанфик по Масс Эффекту?

Кроссовер Stargate: Atlantis времен "за десять тысяч лет до канона" - разгар основной войны лантийцев с рейфами еще, если не начало только - так что знакомых имен с этой стороны ожидаемо почти нет, и Mass Effect времен "с начала МЭ2" (с середины миссии по спасению Гарруса с Омеги, в общем-то). Но да, основные события будут именно в реальности Mass Effect происходить, хотя и с некоторыми отличиями от канона, идущего из первой части (в основном некритичными - сейчас самое заметное это выжившая Бенезия, находящаяся (вполне ожидаемо) в психлечебнице... а больше как-то и не припоминается)...

Marie · « **Ответ #5 :** 24 Апрель 2023, 09:59:06 »

Цитата: Михайлов Саша от 24 Апрель 2023, 08:40:37

Условно может, но, похоже, как минимум конкретно эта модель любит Железного человека - иначе как-то объяснить "реактор Старка" на каждой второй броне не выйдет.

Цитата: Михайлов Саша от 24 Апрель 2023, 08:40:37

сильно превосходит мою GTX 1050Ti по всем параметрам

У меня так вообще GTX 950. Хотя она ещё вполне себе тянет. А вот с процем и памятью беда, очень хочу менять, но тут придётся и материнку новую брать. Жду в скором времени апгрейда.

Цитата: Михайлов Саша от 24 Апрель 2023, 08:40:37

Кроссовер Stargate: Atlantis времен "за десять тысяч лет до канона" - разгар основной войны лантийцев с рейфами еще, если не начало только - так что знакомых имен с этой стороны ожидаемо почти нет, и Mass Effect времен "с начала МЭ2" (с середины миссии по спасению Гарруса с Омеги, в общем-то). Но да, основные события будут именно в реальности Mass Effect происходить, хотя и с некоторыми отличиями от канона, идущего из первой части (в основном некритичными - сейчас самое заметное это выжившая Бенезия, находящаяся (вполне ожидаемо) в психлечебнице... а больше как-то и не припоминается)...

Ладно, пора признаться.

Игры биоварей мне не заходят.

Начинала и DAO, и ME 1, и Star Wars KOTOR, и Jade Empire, и даже балдурсы. Ну, прямо никак. Причем сюжет ME был интересен, но вот геймплей прямо не идет, и всё тут.

sergeycot · « **Ответ #6 :** 24 Апрель 2023, 11:09:39 »

Блин, разбередили. Я не имея телевизора, мало интересуюсь всякими общераспостраненными лайфаками, блин, название то ~~лайФАКи~~.
Саша, а куда лезть то?
Железо у меня:
проц 12400, 6 ядер, 12 потоков;
память две по 16гиг 3200, разогнал до 3700;
видюха 2060, 8гиг, не разгонял, незачем;
мать максун челенджер 660М.
И шо деять то для начала

.

Нашел в новостях: "Сбер создал чат-бота GigaChat. Это аналог ChatGPT, который хорошо знает русский язык"
Интересно, будет бесплатно?

Михайлов Саша · « **Ответ #7 :** 24 Апрель 2023, 23:35:59 »

Цитата: Marie от 24 Апрель 2023, 09:59:06

У меня так вообще GTX 950. Хотя она ещё вполне себе тянет.

А что у нее по памяти, кстати? 2 гига или 4 (подозреваю, что есть такие версии - у меня раньше GTX 760 была именно в версии с 4 гигами памяти, причем это был не MARS - мог взять, но решил фигней в виде SLI на одной плате не развлекаться)? Если 4, то вполне можно и с нейросеткой поиграться (на двух гигах это "как встретить динозавра, выйдя на улицу - либо встретишь, либо не встретишь": шансы, что сетка запустится, есть, но не особо высокие).

Цитата: Marie от 24 Апрель 2023, 09:59:06

Причем сюжет ME был интересен, но вот геймплей прямо не идет, и всё тут.

Знакомая фигня, на самом-то деле. Геймплей несколько скучноват и не для всех (а вот сюжет действительно хорош - собственно, это меня и подтолкнуло после прохождения трилогии начать здоровенный фанфик). "Андромеда" в теории поприятнее в плане геймплея, на "Масс Эффектом" там и не пахнет: противоречит канону на каждом шагу.

.
.

Цитата: sergeycot от 24 Апрель 2023, 11:09:39

Сбер создал чат-бота GigaChat. Это аналог ChatGPT, который хорошо знает русский язык

А ChatGPT тоже уже очень неплохо знает русский (и некоторое количество иных языков), сколь я помню. Собственно, пример:
https://www.youtube.com/watch?v=Lw1WrubK5fk&ab_channel=AlexGyver

Цитата: sergeycot от 24 Апрель 2023, 11:09:39

Интересно, будет бесплатно?

Пока сложно сказать. Подозреваю, что скорее по какой-нибудь подписке (хотя бесплатно потестировать может и можно будет - собственно, сейчас она доступна как Telegram-бот по приглашениям).

Цитата: sergeycot от 24 Апрель 2023, 11:09:39

лайФАКи

Лайффаки это немного не про то. То, что стопроцентно только так и можно назвать, разбирается на канале "Доктор Дью" на ютубе. Вот там реально ТАКИЕ образцы "лайфхаков" и "самоделок" автору присылают на поглядеть, работает оно или нет, что цензурно просто не назвать. Особенно "веселы" лайфхаки для бензокосы - настолько, что выпуск звался "как стать калекой за 300 рублей" или вроде того...

.
.

Цитата: sergeycot от 24 Апрель 2023, 11:09:39

И шо деять то для начала

Ну щитожжь... Делаем как-то так:
Шаг первый: идем сюда и скачиваем сам Stable Diffusion (кнопочка Code, там выбираем Download ZIP): https://github.com/serpotapov/stable-diffusion-portable Версий существует несколько, но с этой проще всего - не нужно для установки самой нейросетки скачивать дополнительные программы - фактически, это билд на базе версии, которая таких "развлечений" как раз требует, просто эти самые "развлечения" туда встроены и не нужно дополнительных телодвижений.
Шаг второй: учитывая, что оперативки аж 32 гига, то можно ничего не закрывать (это у меня 8 гигов всего, так что при открытом браузере установка несколько раз падала и приходилось качать заново - кстати, на случай, если установка упадет по какой-то причине, советую либо ZIP-файл, либо итог распаковки отдельно куда-то отложить: адекватно продолжить установку с того же места оно не умеет, приходится все с нуля): просто кидаем папку, получившуюся по итогу распаковки, как можно ближе к корню диска (самый простейший вариант - собственно, в корень диска и кинуть) и тут повнимательнее: ни в названии папки, ни в пути к ней (собственно, не только из-за длинных названий файлов, но и из-за этого лучше папку прямо в корне диска и делать) не должно быть русских букв, только латиница. У меня, например, папка обозвана как "stable-diffusion-portable-main" для узнаваемости, все прекрасно работает, но вообще можно оставить и название по умолчанию - все будет работать. Сделали это все - запускаем файл "webui-user-first-run.cmd" и тупо курим бамбук - даже при довольно быстром интернете минут 15 установка займет наверняка (один из скачиваемых файлов - собственно, именно на его распаковке у меня установка и билась из-за недостатка памяти при запущенном браузере - весит 2,3 гига).
Шаг третий: скачиваем модели. В роли базовой можно смело использовать вот эту: https://civitai.com/models/4823/deliberate Она весьма и весьма неплоха, хотя не для всех вариантов использования достаточна. Но при желании позволяет делать, например, такое (взято из примеров к модели, сам пока в таком духе и близко не развлекался, запрос там длинный весьма):

https://imagecache.civitai.com/xG1nkqKTMzGDvpLrqFT7WA/3bb43f1b-0cd6-4fba-04e8-fd113a79d000/width=3072/287623.jpeg

Играемся с нейросетками - MidJorney, Stable Diffusion и прочие.

Так как одной базовой модели, скорее всего, будет мало (хотя кто знает - зависит от личных пожеланий, собственно), качаем с того же сайта либо с https://huggingface.co (ошибки нет, оно именно .co, не .com) еще каких-нибудь на свой вкус, какие нравятся по превью (с превью, конечно, на civitai получше). Базовые (!) модели мы закидываем в папку по такому пути: (основная папка SD)/models/Stable-diffusion
Это совсем минимальный минимум, но после этого уже можно начинать развлекаться, пока остальное качается. Да - хоть одну основную модель лучше закинуть в папку до окончания установки, чтобы установочник не ругался на тему "модель не найдена" (совершенно некритично - потом он модель все равно найдет, когда она будет туда закинута - чисто ради "красота по красоте").
Шаг четвертый: скачиваем апскейлер. Так как я уже отметил, что как минимум людей во избежание косяков лучше делать в разрешении по умолчанию - 512*512 - то нужно, разумеется, увеличивать размеры (ибо как-то 512 на 512 это печаль и тоска, ничего толком не разглядеть). Конечно, если планируется в полный рост, то можно и добавить как минимум высоты (скажем, сделать 512*1024), но выходит не всегда корректно (хотя ничто не мешает перегенерить частично или полностью), но полный рост это несколько иной вопрос... и в любом случае понадобится увеличивать. За сим, качаем: https://huggingface.co/MoveScores18/x4-upscaler-Automatic1111_WebUI/tree/main Качать отсюда можно не все модели - полный комплект скорее для поиграться будет (собственно, я качнул все плюс несколько иных, но, скорее всего, поиграюсь, подберу на свой вкус и сотру остальные, чтобы место не жрали). Основные апскейлеры кидаются по такому пути (если подпапки нет по умолчанию - не помню уже - то создаем): (основная папка SD)/models/ESRGAN
Шаг пятый: скачиваем вспомогательные апскейлеры. Основные апскейлеры неплохо работают в целом, а вот с мелкими деталями у них все уже печальнее. Для мелких деталей больше подходят уже вспомогательные модели, зовущиеся VAE. Я мозг себе особо не долбал и скачал пока только официальные, потом может дополню: https://huggingface.co/stabilityai/sd-vae-ft-ema и https://huggingface.co/stabilityai/sd-vae-ft-mse/tree/main
Везде, где есть выбор, скачиваем файлы с форматами либо .ckpt, либо .safetensors, если у модели есть под одним названием и то, и то, лучше качать второй тип. .bin идут лесом, они для Git, который мы не запускаем вообще. VAE закидываем, соответственно, по пути: (основная папка SD)/models/VAE
Шаг шестой (этот уже окончательно необязательным является, это уже кому что хочется): скачиваем вспомогательные модели. Такие модели делятся минимум на два типа - Lora и гиперсети (hypernetworks), закидываются в соответствующие папки все в той же папке models. Lora - классические модели .safetensors/.ckpt, просто чаще всего мелкие, по паре-тройке сотен мегабайт (а порой и сотни-то не наберется). Чтобы они корректно использовались, нужно (помимо включения модели) в запрос вбивать слово, которое является запросом именно для вспомогательной модели - обычно такое указывается в описании модели (во всяком случае на civitai так чаще всего делают, без этого выкладывать вспомогательную модель дурной тон или около того). Гиперсети - в принципе, все то же самое, но формат файла .pt и подключается в другой вкладке.

С расширениями еще толком не разбирался (хотя точно знаю, что, например, с их помощью можно - пускай и с ограничениями - прикрутить эту сетку к фотошопу, что с учетом возможности замены основных моделей весьма приятно), но это уже настолько вспомогательный вопрос, что для меня можно назвать неактуальным (как минимум пока железо не обновлю), да и в большинстве случаев возможностей сетки хватает и так, если разобраться в ней получше и научиться поточнее составлять запросы (ну и если генерить/изменять картинки побольше).
С обучением моделей пока что плюс-минус в общих чертах разобрался только с гиперсетками (с моделями типа .ckpt/.safetensors пока нет, хотя в планах подразобраться, что и как, тоже имеется), но для меня это на неопределенное время чистая теория: для обучения сеток нужно минимум 6 гигов видеопамяти, а у моей видюхи только 4.
При желании можно даже на домашнем компе поднять сервак с доступом снаружи по какому-то личному адресу - например, развлекаться во время поездки в общественном транспорте с телефона/планшета - но с этим пока не разобрался опять же, как и чего.

Собственно, после выполнения шага три и когда установка успешно завершилась, Stable Diffusion уже можно начинать использовать (дополнительные модели, апскейлеры, VAEшки и прочее можно докидывать и в рабочую систему, просто жмякать кнопочку "обновить", чтобы оно увидело появившуюся модель. Запускается элементарно - запускаем файл webui-user (я пару раз открывал, заходя в папку, потом задолбался, сделал ярлык и кинул на рабочий стол), ждем, пока все подгрузится (у меня грузится чуть ли не с минуту, но почти все железо где-то 2014 года - в норме оно сильно быстрее грузиться должно), оно автоматом открывает вкладку в браузере/браузер (если он закрыт), работаем. Окошко консоли, в котором все логи выводятся, можно свернуть, но не закрывать - закрытие вырубает и Stable Diffusion.
Для работы с ней подходит любой браузер на баз Chromium - мозилла, гугл.хром, яндекс.браузер, цент.браузер (собственно, для работы с сетью его и использую, чтобы память не занимать мозиллой с сотней вкладок) и даже стандартный виндоусовский эдж. В случае, если браузером по умолчанию стоит мозилла (в иных, возможно, тоже - не проверял) нейросетка может матюгнуться в стиле "профиль файерфокс не найден" и браузер не открыть. В этом случае сетка все равно запущена (окошко консоли открыто), так что все, что необходимо сделать, это открыть браузер вручную и в адресную строку скопировать данное значение: http://127.0.0.1:7860/ (адрес всегда идентичен, так что сложностей не будет).

Сеть умеет генерить картинку по текстовому запросу (вкладки txt2img), изменять (img2img - вроде бы перерисовка части картинки (или ее достройка) это как раз про эту вкладку), работать с увеличением (Extras - хотя там не только про увеличение). Остальные вкладки интересны уже когда хочется разобраться подробнее - слияние файлов .ckpt (кстати, там же можно эти самые .ckpt конвертировать в .safetensors), тренировка сеток (в том числе и гиперсетей как раз), настройки...

Ну и немного о запросах. Там есть для них два поля: Prompt (верхнее) и Negative prompt (нижнее). Второе поле уже будет автоматически немного заполнено (это как раз уменьшит вероятность появления косяков с конечностями, пальцами и т.п. - если хочется генерить не людей, а что-то другое, поле можно очистить, при следующем запуске все равно все восстановится в это значение по умолчанию), и туда можно (и нужно) вбивать то, чего не хочется видеть на картинке. К примеру, стопроцентно не хочется черно-белую картинку получить, значит добавляем в нижнее поле одновременно (!) b&w и black&white. Тут главное не протупить и не указать в отрицательный запрос "no ...", так как получим, собственно, во всех картинках ровно то, чего видеть не хотим (плавали, знаем - добавил так в один из запросов "no lights on armor" во второе поле, покрутил раз пять и думал, какого черта везде ровно то, чего я не хочу). Добавлять в поле основного запроса (то, что мы хотим видеть) это самое "no ..." можно, но занятие изрядно бесполезное - все, чего видеть не хотим, кидаем во второе поле. Если что-то мы хотим видеть больше (либо генерим, генерим и генерим, а нужного все нет), то указываем так (...:...), где на месте первого многоточия после открывающей скобки тот участок запроса, который хотелось бы видеть сильнее остальных/который не получается, на месте второго идет цифра от 1,1 до 1,4 (выше смысла брать мало, могут пойти косяки (хотя в принципе в пределах 2 пробовать можно, но что получится - понятия не имею), ниже это стандартный запрос, шаг там в 0,1, чем выше - тем больший вес у части запроса), перед и после двоеточия пробелы не нужны.
CFG Scale указывает, как сильно сетке пытаться "импровизировать". По умолчанию стоит не то 7, не то 8, но чем меньше значение, тем выше уровень "импровизации". Это значение меньше 4 лучше не ставить (в принципе я ставил и 3, но порой сетка начинала сильно косячить уже).
Основные модели выбираются в верхней части страницы, в меню Stable Diffusion checkpoint, вспомогательные - под кнопкой Generate центральная, если не ошибаюсь, кнопка (либо вторая справа), там выпадает менюшка "отобразить вспомогательные модели" или типа того (чуть позже гляну, скажу точнее, если нужно), если нажать, то появятся вкладки - Hypernetworks, Lora и еще какие-то две, если я правильно помню. Выбираем интересующую нас модель, вспомогательную модель (если нужно/хочется), вбиваем запрос (на английском, но гугл.переводчик вполне успешно переводит слова для запросов и даже целые запросы), нажимаем сгенерировать. Если видно, что генерируемая картинка явно будет чем-то не тем, можно спокойно прервать генерацию и начать заново. Понравившуюся картинку сохраняем, перетаскиваем в Extras, увеличиваем, выбрав интересующий апскейлер и/или VAE. Можно работать и просто со скачанными из интернета картинками (вроде в img2img), изменяя их на свой вкус.

Marie · « **Ответ #8 :** 24 Апрель 2023, 23:41:37 »

Цитата: Михайлов Саша от 24 Апрель 2023, 23:35:59

разбирается на канале "Доктор Дью" на ютубе

Хороший канал, угарный, посматриваю иногда.

Marie · « **Ответ #9 :** 26 Апрель 2023, 05:46:24 »

Цитата: Михайлов Саша от 24 Апрель 2023, 23:35:59

А что у нее по памяти, кстати?

Кажется, 2.

Цитата: Михайлов Саша от 24 Апрель 2023, 23:35:59

противоречит канону на каждом шагу.

Довольно типичная ситуация со многими сиквелами.

Цитата: Михайлов Саша от 24 Апрель 2023, 23:35:59

Геймплей несколько скучноват и не для всех

Управление "Мако" - вообще отдельная тема.

Михайлов Саша · « **Ответ #10 :** 26 Апрель 2023, 21:56:48 »

Цитата: Marie от 26 Апрель 2023, 05:46:24

Кажется, 2.

Ну, да, на такой сетка может запустится, а может и нет, увы... Чистое 50 на 50...

Цитата: Marie от 26 Апрель 2023, 05:46:24

Довольно типичная ситуация со многими сиквелами.

Ну, трилогия (и DLC) - вполне качественно проработанная, четкая и не косячная история. Да, многим не нравится концовка (ибо это общий "хэппи энд", но не личный), но концепты Карпишина (ранний сценарист МЭ) победы не предусматривали вообще - только поражение... в теории два варианта поражения, на практике же 1, так как 20К вымпелов одних только дредноутов жнецов с учетом того, что дредноутов (и кораблей, сравнимых по огневой мощи) у рас цикла меньше тысячи, шансы уничтожить жнецов там даже не нулевые, а отрицательные.
А вот "Андромеда" противоречит всему вообще. Даже если считать, что она основана лишь на первой и второй частях (но вроде как это не так), то шансов хотя бы Млечный путь покинуть у "Инициативы Андромеда" нет как категории - масс-ядра, которые не требуют разрядки, на момент отправки были только у жнецов...

Цитата: Marie от 26 Апрель 2023, 05:46:24

Управление "Мако" - вообще отдельная тема.

Искренне не понимаю, в чем проблема. Сколько на нем катался - проблемы были только несколько раз, да и то скорее по собственной глупости (ну, прекрасная идея типа "постоять в гнезде молотильщика", или "наехать на мины")... А так - проблем с управлением почти не встречал. Удобная штука. "Хаммерхэд" поинтереснее, конечно, но отсутствие пулемета (что самое смешное, на модели он есть) несколько раздражает...

Михайлов Саша · « **Ответ #11 :** 03 Май 2023, 22:15:49 »

Хе. Оказывается, те, у кого есть гугловский аккаунт и свободное место на гугл.диске, вполне могут бесплатно потыкать Stable Diffusion. Мощного железа своего компа не требуется в таком случае, так как все "крутится" на стороне гугла, на реально мощном железе.

Михайлов Саша · « **Ответ #12 :** 08 Май 2023, 21:11:28 »

Да б...!!! Стоило мне найти способ юзать нейросетку (и даже надстройку, позволяющую нейросетку обучать, что критичнее) через гугл.колаб, как в этом самом гугл.колаб решили, что "а не гулять ли вам всем лесом" и стали в ноль резать подобное использование для бесплатных (а судя по тому, что говорят на форумах - для платных с дешевым тарифом тоже, что вообще за гранью добра, зла и разума) аккаунтов!

P.S. Да - составляю тут что-то типа гайдов по Stable Diffusion (смотрю подробные качественные видео и на их основе выделяю основную инфу). Если надо - могу поделиться.

sergeycot · « **Ответ #13 :** 09 Май 2023, 03:09:29 »

Шото нифига не деется в ентой нейросетке. Не, картинки какие то синтезируются, а нафига и зачем? Пытался свою картинку обработать, преобразовал, сгенерил в папку, а оно изувечило до неузнаваемости. В общем снес всё нафиг, дабы место на диске не занимало

.

Михайлов Саша · « **Ответ #14 :** 09 Май 2023, 04:50:01 »

Цитата: sergeycot от 09 Май 2023, 03:09:29

Пытался свою картинку обработать, преобразовал, сгенерил в папку, а оно изувечило до неузнаваемости.

Вот с этим я тоже долго тупил. Честно говоря, тут без гайда непросто.

Собственно, простенький гайд как-то так:
В Inpaint:
Для Just resize:

Denoising strength:
Чем выше - тем сильнее изменяется изображение (соответственно, если изменения нужны небольшие, есть смысл ставить что-то типа 0,3 или как-то так).
Работа с частями изображения (лицо, к примеру):
Mask mode - masked
область Only masked,
Padding, pixels - желательно не более 40

Крупная перерисовка (к примеру фон): Mask mode - not masked

Для Resize and fill:

Mask content - original
Mask mode - not masked
CFG Scale - в сторону увеличения

Mask blur - размытие вокруг маски, пикселей

Masked content:

fill - заполнение области тем, что в промпте с высоким приоритетом
original - попытка сохранить (или изменить - в зависимости от режима работы) то, что в области маски (как минимум "идею/суть")
latent noise - основывается на всем изображении (желательно использовать с пустым промптом)

Inpaint area:

Whole - "прислушиваться" ко всей композиции
Masked - основываться на закрытом маской

sergeycot · « **Ответ #15 :** 09 Май 2023, 04:59:34 »

Саша, ну нельзя так грубо материться в эфире

. Я из всего твоего написания, понял что я есть баран, а остальную матерщину просто не понял

.

Михайлов Саша · « **Ответ #16 :** 09 Май 2023, 07:39:31 »

Цитата: sergeycot от 09 Май 2023, 04:59:34

а остальную матерщину просто не понял

Это нужно интерфейс развернутым держать, чтобы понять, о чем речь. Без интерфейса чисто так пытаться понять - кукуха уедет (я знаю - я пытался). В принципе, разобраться там на базовом уровне это вопрос где-то получаса. Вот углубленно копаться - картинки для печати делать, например (которые можно хоть на А3 распечатать в отличном качестве) - это да, возни больше (хотя я опять же выжимки из видео по поводу "что и как" сделал, если кому надо, так что в принципе опять же возня больше по времени - сперва нагенерить что-то, что понравится, потом исправить косяки так, чтобы результат понравился, потом еще прилично времени убить на апскейл, ибо оно небыстро).

Кстати, сегодня проверил - четырехгиговой видюхи не хватает для того, чтобы нормально работать с изображениями больше, чем 512*512. Хотел скорректировать изображение Джейн для фаннфика - а фиг там, сетка матюгнулась на тему "видеопамять забита в ноль, гуляй нафиг".

Михайлов Саша · « **Ответ #17 :** 10 Май 2023, 09:33:24 »

Собственно, результат нескольких часов возни с нейросеткой на мощном компе (подруга пустила на удаленку повозиться):

Исходно нагенерилось вот это:

По итогу вылез косяк с плечом, конечно (хотя возможно я просто заапскейлил до нормального размера не ту картинку, а нужная так и лежит 720p), но для почти что первого раза вроде неплохо...