Burger
Нейрохудожница Валерия Титова — об изменениях в цифровом искусстве, сотне промптов для одной картины и своем обычном рабочем дне
опубликовано — 25.09.2023
logo

Нейрохудожница Валерия Титова — об изменениях в цифровом искусстве, сотне промптов для одной картины и своем обычном рабочем дне

Мама, я нейрохудожница

В начале сентября в Казани прошел третий международный фестиваль медиаискусства NUR. Чтобы поучаствовать в его образовательной программе (организованной в этом году совместно с открытой креативной платформой «Простор» от VK), из Москвы приехала нейрохудожница и авторка канала «ЭйАйЛера» Валерия Титова.

Используя нейросети, Валерия создает 2D-изображения, анимационные ролики, генерирует клипы и играет VJ-сеты, а в своих работах исследует темы социализации, ностальгии и любви в эпоху высоких технологий. Специально для «Инде» она рассказала, нужно ли нейрохудожнику уметь программировать, не погубит ли разнообразие искусства использование ИИ и что делать, если хочется не только творить, но и зарабатывать.



Нейрохудожник — не та профессия, которой можно выучиться в университете. Как ты оказалась в ней?

Во время пандемии у меня было много свободного времени и мало денег. Я начала думать, чем разнообразить свою деятельность, и пошла на курс «Нейросети для дизайнеров» Вадима Эпштейна в Bang Bang Education. Мы учили язык программирования, работали в основном с GAN — генеративно-состязательной нейросетью. Она состоит из двух моделей, одна из которых обучена генерировать данные, а другая — отличать смоделированные данные от реальных. Выглядит это так: ты «кормишь» нейросеть информацией, обучаешь и получаешь много изображений, в разной мере отличающихся от реальности.

Постепенно знакомилась с появляющимися нейросетями: StyleGAN, Neural Style Transfer, VQGAN+CLIP и другими. Чтобы лучше изучить каждую, написала шаблонный промпт — «Русскую принцессу». Когда встречала новую сетку, вбивала его и смотрела на результат — принцесса как минимум должна быть человеком. Так по одному общему промпту я отсматривала возможности нейросети. Видеосетки я тестировала точно так же.

Мне повезло: после учебы у меня не было длинного технологического ожидания. Уже через пару месяцев случился виток новых диффузионных моделей (модели, способные генерировать данные, аналогичные тем, на которых они обучаются. — Прим. «Инде»), лежащих в основе Midjourney и Stable Diffusion. Их я активно использую до сих пор, наряду с другими инструментами.

Когда ты начинала заниматься нейроискусством, оно требовало знания кода. Сейчас это все еще так?

Базовые технические навыки нужны, но они скорее про понимание принципов, чем про математику. Вы должны разбираться, как запустить программу, где и что можно дописать. Стопроцентное понимание кода не нужно. Я и сама сейчас его уже не дописываю — инструменты, с которыми я работаю, очень сильно опережают мои знания программирования. Мне проще написать коллеге или напрямую разработчику и сказать, что именно не работает. Иногда, если нужно написать какую-то строчку кода, я просто гуглю. И это важное отличие: я понимаю, что ее нужно написать, но совсем ничего не знающий о коде человек и этого не поймет.

You cut me to the heart, bastards. Анимация в Stable Diffusion

Как ты для себя определяешь, кто такой нейрохудожник?

Обычный художник, который использует нейросети как основной медиум. Я всем говорю, что я художница, а «нейро-» тут только потому, что я люблю кушать, и потому, что это на хайпе. Я работала в разных медиумах — в художественной школе использовала акварель, потом фотографию. Но сейчас у меня нет времени ни на какие другие. Я даже не монтирую видео и не редактирую изображения.


Клип для группы «нееет, ты что», над которым работала Валерия

Часто про нейросети говорят, будто они «выхолащивают» стиль, делают искусство неуникальным, обезличенным. Как ты относишься к такому? Можно ли сказать, что у тебя есть свой стиль и он не зависит от нейросети?

Когда мы говорим про нейросети, лучше говорить не про стиль, а про переобученность. Например, в Midjourney мы можем выкрутить параметр на ноль и обратиться к датасету, который будет больше соответствовать нашему промпту — текстовой подсказке для нейросети, написанной на естественном языке. Стиль в его классическом понимании всегда зависит от художника: раньше у меня были смазанные, насыщенные, зернистые фотографии, чем-то похожие на мои нынешние генерации.

Думаю, чем дальше будет развиваться прогресс, тем больше будет уходить представление, что у нейросетей есть какой-то свой стиль. Сейчас так может казаться из-за глитчей — изображений с различными цифровыми и аналоговыми ошибками. Но это короткий период. Все стремится к реалистичности, потому что она хорошо продается. Можем ли мы говорить, что есть стиль у Blender 3D (программа для создания трехмерной компьютерной графики. — Прим. «Инде»)?

Тогда что в нейроискусстве может быть ориентиром? Как понять, что одна картина — произведение искусства, а другая — случайная генерация?

Есть небольшая группа людей, задающих тренды, — например, Saint Laurent и Dreaming Tulpa. Мы видим у них совсем другой уровень, часто их работы — совершенны. Они выставляются в небольших галереях Азии, в Нью-Йорке на Таймс-сквер, в технологических центрах развитых стран. В России помогает фестивальная история — например, NUR. Такие события показывают, на кого ориентироваться. Постепенно рамочка того, что хорошо, а что не стоит внимания, проявится в России четче.

Я очень надеюсь, что нейроискусство войдет и в галерейную традицию. Современные галереи — и это комично — очень консервативны. Хорошие нейросети были уже в феврале 2023 года. Но видим ли мы сейчас нейрофильмы в кинотеатрах? Нет. Видим ли, что галереи заполнены работами нейрохудожников? Нет. Вхождение в искусство гораздо медленнее развития нейросетей.

К тому же эта среда пытается «обезопасить» себя от случайных, хайповых выборов. Учитывая, что хайпа в нейросетях много и ошибиться легко, есть такая медлительность, сопротивление, предвзятое мнение. Это похоже на NFT или игры — период от их появления до вхождения в искусство был довольно большим. Здесь будет так же. Да, нейросети быстро растут. Это такая гэмэошная свинья, которая разрывается в своей клетке, но при этом клетка у нее прочная и консервативная, чтобы никто не вырвался.

Как ты работаешь над своим искусством? Можешь рассказать о каком-нибудь важном для тебя проекте?

В парке «Зарядье» была выставка «Алиса в Нейроцарстве» — про путь героини Льюиса Кэрролла в России. Есть теория, что Кэрролл написал «Алису в Стране чудес» именно про нашу страну, потому что Россия была единственным государством, куда он приехал целенаправленно. У нас очень быстро перевели «Алису». Книга называлась «Соня в царстве Дива». Куратор Никита Лукинский нашел старые издания, пластинки Высоцкого, который озвучивал радиоспектакль «Алиса в Стране чудес», фотографии. Меня пригласили представить новый медиум — тогда в России было еще пять-десять человек, которые в целом идентифицировали себя как нейрохудожники.

Я работала с четвертой версией Midjourney. Ее особенность в том, что это закрытый продукт из коробочки. То есть мы не можем, в отличие от Stable Diffusion, обучить ее на своих данных. Мы можем заниматься только текстовым промптингом, не вырезая и не перегенерируя кусочки, — нужно сразу создать цельную картину.

У меня была задача сгенерировать при помощи нейросетей иллюстрации, стилизованные под эстетику Ивана Билибина, а скорее — под то, как эта эстетика представлена в массовом сознании. Русский народный костюм или русская девушка из сказок Билибина — вещь довольно примелькавшаяся. Мы все знаем, что у нее должна быть рубаха и одна коса как символ замужества. Татарский костюм Алисы от северной или западной Алисы будет для нас отличим не деталями, а общим фоном и настроением. Но это знаем мы, а не нейросеть. У нее есть некое представление о русском костюме и графике Билибина, но она использует ограниченные знания из датасетов. У меня получались то не те косы, то не тот костюмчик, то девочка вдруг в корсете — ведь она Алиса из викторианской Англии и, исходя из данных, у нее должен быть корсет. Я пробовала разные промпты, подмечала нужное — иногда сеть генерировала те самые розы, иногда что-то нужное из костюма или черты лица, которые я искала. Все это мы с куратором собирали потом, как коллаж.

С кроликом было проще — он выглядит как хорошая недешевая иллюстрация, хотя получился тоже не с первого раза. Я хотела нарядить его в кафтанчик, а он все время одевался в узбекский халат. Кадры с гусеницей я вообще убрала, потому что каждый раз, когда в промпте присутствовал кальян, автоматически все становилось очень восточным. Если было бы видео, человек мог бы «простить» неточности и не заметить мелочи за счет общего фона и настроения. А когда разглядываешь картину в статике — автоматически выдергиваешь фреймы, видишь все ошибки, начинаешь искать дополнительные смыслы за синими занавесками.

У меня было примерно по 30 промптов на каждую из картин, весь проект занял около трех недель плотной работы: садиться и генерировать, подмечать, добавлять и убирать, добиваться нужного конечного результата.

А если говорить про видео, работа нейрохудожника здесь сильно отличается? Кажется, что технически это еще более сложный уровень.

Да, больше уходит на техническую составляющую, а если точнее — на техническое ожидание. Я пионер в нейровидео. Я делала обработку танцующих людей нейросетями еще в ноябре прошлого года, хотя тогда был другой уровень, ведь инструмент за это время сильно усовершенствовался.

Очень долго была всего одна программа для генерации видео — Warp Fusion. Его создал русский разработчик Александр Спирин. Он сам делает все версии, добавляет новые функции, обслуживает программу, хотя это не его основная работа. К тому же Warp Fusion — это инструмент не «одной кнопки», а «класса истребитель». То есть, чтобы получить хоть какой-то результат, тебе нужно хоть раз нажать на каждую кнопку из панели или понять, где тыкать не стоит, потому что программа «упадет». Это тоже процесс работы нейрохудожника, и он делает меня счастливой.

Скоро я буду выставлять видеоинсталляцию в Останкино. Чтобы ее сделать, мне пришлось просить друга, 3D-художника Павла Харитонова смоделировать болванку для обработки. Мы были ограничены тем, как устроена башня, какие там будут экраны. Это интересная часть творчества — думать, как твоя работа будет показываться в реальности.

Тема выставки — «Визуальный переворот». У меня появилась идея связать ее с песочными часами. Так как башня высоко и далеко, видео должно было быть максимально простым и узнаваемым. Я сразу подумала, что нет ничего понятнее, чем лица. Попросила друга сделать две головы, которые в 3D вертятся вокруг своей оси, — чтобы потом обработать их, наложить сюжет и фон. Человек будущего, человек прошлого, как песок в часах, все в них пересыпается из одного в другое и никуда не девается. Я задавала промпт на каждый десятый кадр, и только тогда поняла, что нейросеть вообще не понимает, как выглядит человек со спины, — появляются глитчи. Тогда я решила, что голова будет вращаться на 180, а не 360 градусов. Еще одна интересная деталь — то, что нейросеть в этом эксперименте рисовала человека как мужчину, чаще пожилого. Мне пришлось отдельно задавать в промпте, чтобы появилась женщина: по сюжету у меня была медсестра. Во время генерации пробирки на фоне почему-то начали клеиться на ее лицо — получился некий стимпанк про женщину-«все свое ношу с собой».

Нейрогенеративная графика на Останкинской башне в Москве

Ты плотно работаешь с нейросетями несколько лет. Выработалось ли у тебя что-то вроде языка общения с нейросетью?

Я называю язык общения с нейросетью максимальным упрощением или «языком AliExpress». Это когда мы говорим: «женщина, колготки, черный, сетка». Мы не даем никакой лишней информации. Нужно не переборщить с подробностями, иначе нейросеть будет добавлять лишнее в ваше изображение. У Midjourney есть классный инструмент — shorten. Он показывает, как много энергетического веса в слове. Так ты можешь правильно расставить акценты, убрав лишние детали.

Мне иногда сложно работать с текстовыми сетками. Они намного больше похожи на людей, ими нужно манипулировать. А я не умею. Есть специалисты, которые взламывают сетки — подбирают промпты и заставляют ее показать то, что скрыто за цензурой. Это на самом деле серьезная проблема, хотя она еще не стала такой заметной.


Клип TAZ CHERNILL

Как думаешь, чем миру может помочь нейроискусство?

К прикладному я имею мало отношения. Думаю, что нейросети, в первую очередь, — визуальная свобода. Также мы видим, что очень много людей обеднены невозможностью визуально хорошо рассказывать истории. У них есть классные идеи, продукты, но они не могут ничего с ними сделать. А нейросети — доступный инструмент, который делает красиво почти сразу.

Или истории про раскадровки — хороший буст для того, чтобы люди лучше друг друга понимали. Ведь что такое искусство? Просто еще один язык, на котором мы общаемся, и я подозреваю, что если у нас есть дополнительная форма для реализации, то, может, мы как человечество станем лучше.

Клип для Андрея Замая

Обложка: Валерия Титова; фото предоставлены собеседницей