Текст генерации: furry monster with green eyes looking at us, the word «habrahabr» in the background, digital art, blue background, 3d

Привет, чемпион!

Недавно мне посчастливилось стать обладателем доступа к API Dalle-2. Если ты ещё не слышал про Dalle, то это такая CLIP-архитектура, обученная на огромном корпусе пар текст-изображение. Иначе говоря — она умеет генерировать очень качественные изображения из текста. Отличить результаты генерации от рисунков человека иногда просто невозможно! Это одновременно впечатляет и в то же время — немного шокирует.

По сравнению с предыдущей версией — DALL-E 2 умеет генерировать изображения в более высоком разрешении (1024×1024 пикселей, что в 16 раз превышает разрешение в предыдущей версии модели) да ещё и намного быстрее. Более того, DALL-E 2 позволяет редактировать уже существующие изображения.

Нет больше терпения ждать, давайте же опробуем её!

▍ Посмотрим на несколько моих сгенерированных фаворитов


image

Просто вау! Dalle-2 очень точно узнаёт сущности, которые закладываются в тексте. Видно, что сетка в курсе, что такое Moscow, как выглядит Эйнштейн и как седлают панду… (Панду? Хотя писали мы про быка, ну это мелочи). Более того, обратим внимание на сохранение стилей, заданных в тексте. Сеточка хорошо различает pixel, digital и cyberpunk стили. Кайф! Давайте поиграем ещё!

▍ Дизайнеры больше не нужны!


Допустим, мне очень нравятся красные роботы и я хочу сделать для себя постер на стену и т.д. Поиграем в дизайнера!

Я: Хочу, чтоб это был красный робот, который сёрфит на волне!
Дизайнер: Нет проблем, вот вам 4 варианта!

imageТекст генерации: Red robot surfing the wave

Я: Робот классный, но можно ещё на фоне сзади остров?
Дизайнер: Ага, держите ещё варианты!

imageТекст генерации: Red robot surfing the wave, island in the background

Я: Уже лучше, но всё ещё не то. Хочу в стиле масляных красок!
Дизайнер: Хорошо, сейчас нарисую маслом. Мне несложно!

imageТекст генерации: Red robot surfing the wave, island in the background, oil painting

Я: О, это именно то, что я и хотел. А может немного тропического добавить… И чтоб робот был объёмным! И чтоб digital! А ещё сейчас постеры в моде! А может не красный?
Дизайнер: Тропического чего? 3D и digital? Как постер? Aлло, дядь, ты чё?! Сейчас всё будет! Выбирайте!

imageТекст генерации: Red robot surfing the wave, island in the background, oil painting, tropical style, 3d, digital art

imageТекст генерации: Red robot surfing the wave, island in the background, oil painting, tropical style, 3d, digital art, like cinema poster

imageТекст генерации: Red robot surfing the wave by cyber surfboard, island in the background, oil painting, tropical style, 3d, digital art, very beautiful art

imageТекст генерации: Smart red robot surfing the wave, island in the background, oil painting, tropical style, 3d, digital art, very beautiful art

imageТекст генерации: Robot surfing the wave, island in the background, oil painting, tropical style, 3d, digital art, very beautiful art

imageТекст генерации: Green robot surfing the wave, island in the background, oil painting, tropical style, 3d, digital art

Вы только представьте, что всё это я сгенерировал меньше чем за пару минут. Причём все работы уникальны. Профессиональный художник/дизайнер генерировал бы такие работы несколько дней, недель, а то и больше!

▍ Доводим любителей пиксельных изображений до экстаза :)



imageТекст генерации: Winter smart red robot surfing the wave by cyber surfboard, island in the background, oil painting, tropical style, 3d, digital art, very very very very very very beautiful art, pixel art, pixel art

imageТекст генерации: Many little people entering the lunar big abandoned castle by bridge, there is purple light inside the castle, the view from street, very very beautiful pixel art

imageТекст генерации: Very beautiful Giant bath duck swimming in Moscow river, digital art, pixel art

imageТекст генерации: Tropical astronaut lying under the palm tree with cocktail, looking at the galaxy, digital art, pink background, pixel art

imageТекст генерации: Blue cat in space, digital art, galaxy background, like explosion of nebula, the view from the ground, pixel art

▍ Совмещаем несовместимое


Зачем нам фотошоп, если Dalle-2 способна на всё!? Будем смешивать котиков с рандомными предметами. Погнали!

Кот + подводная лодка =

imageТекст генерации: a cat submarine chimera, digital art

imageТекст генерации: a submarine cat chimera, digital art

Кот + робот =

imageТекст генерации: a cat robot chimera, digital art

imageТекст генерации: a cat transformer chimera, digital art

Кот + человек =

imageТекст генерации: a cat human chimera, digital art

imageТекст генерации: a human cat chimera, digital art

▍ Заглянем в будущее!


Меня всегда волновал вопрос — Как будут выглядеть города в будущем? Спросим у Dalle-2!

imageТекст генерации: city in the future

imageТекст генерации: the best view of city in the future, view from the space, very very beatiful art, digital art, sunshine at background, galaxy background

А что насчёт Москвы будущего? Как будут выглядеть закаты Москвы через много лет?

imageТекст генерации: the best view of Moscow city of the future, view from the space, very very beatiful art, digital art, sunset at background

imageТекст генерации: the best view of Moscow city of the future, view from the space, very very beatiful art, digital art, sunshine at background

imageТекст генерации: the best view of Moscow city of the future, view from the space, very very beatiful art, digital art, galaxy background

Охх, какой ништяк. Если всё будет так красиво, как это видит Dalle-2, то я очень жду будущего!

А что там по другим городам? Как будет выглядеть в будущем Египет? А Дубай? А Лондон?

imageТекст генерации: the best view of Egypt city of the future, view from the space, very very beatiful art, digital art, galaxy background

imageТекст генерации: the best view of Dubai city of the future, view from the space, very very beatiful art, digital art, galaxy background

imageТекст генерации: the best view of London city of the future, view from the space, very very beatiful art, digital art, galaxy background

imageТекст генерации: the best view of New York city in the future, view from the space, very very beatiful art, digital art, sunshine at background

▍ Выводы


Ну а что тут можно говорить?! Хоть ИИ ещё не скоро заменит программистов, но заставить дизайнеров искать новую работу — может уже завтра. То, что делают сетки от OpenAI, потрясает мою фантазию. Такой инструмент превращает тебя в художника за один миг. Ты становишься конкурентоспособным в вопросе дизайна и быстрого наброска примерного скетча рисунка. Dalle-2 — это как Lego, но только в рисовании чего угодно в самых разных стилистиках.

Если тебе тоже захотелось почувствовать себя художником, то пиши свой текст сюда в комментарии на Хабре, я отрисую тебе картинку. Ещё больше примеров артов можно посмотреть в моём телеграм канале.

Спасибо за помощь с доступом Олегу.

▍ Еще большое примеров в комментариях!



Вот ещё несколько генераций для хабра в качестве бонуса :)
image

image

image

image

image


Комментарии (694)


  1. steanlab
    26.07.2022 12:11
    +6

    Cпасибо, очень занимательно. Интересно что машинка выдаст на такие вот запросы:
    1)chemistry, physics and biology science in connection, prospects for the future
    2)carbon based lifeforms, biochemistry, universe inside us
    3)laboratory of impossible concepts, protective equipment, satellite communications

    А если просто «laboratory #66» что будет?


    1. Aleron75 Автор
      26.07.2022 12:36
      +22

      Давай что-то одно. Первое Dalle-2 видит как так =)


      1. steanlab
        26.07.2022 12:41

        Хорошо, давайте вот это «human skin, bacteria interaction, quorum sensing
        Предыдущеее красиво получилось. Но к теме близко наверное только последняя картинка. Дайте ее побольше размером, пожалуйста, „чтобы распечатать“ :))
        *задумался про то, сколько дней бы заняли игры с Dalle-2 будь у меня свободный доступ к нему


        1. Aleron75 Автор
          26.07.2022 12:56
          +10

          Ты слишком абстрактные и не популярные паттерны предлагаешь, но все равно норм.

          human skin, bacteria interaction, quorum sensing, digital art
          human skin, bacteria interaction, quorum sensing, digital art

          Пиши в телеге, там в комментариях скину 1024*1024 разрешение)



          Сам играю с Dalle-2 уже три дня и не могу остановится. Могу тебя понять)


          1. steanlab
            26.07.2022 13:00
            +4

            Ну слушай, не зря ж я от Дали еще со школы без ума. Красивые абстракции и ищем у ИИ, осмысленное и самому можно склепать :) С бактериями вышло красиво *сердечко*


            1. Aleron75 Автор
              26.07.2022 13:17
              +9

              universe inside us, digital art
              universe inside us, digital art

              По второму запросу тоже красота


              1. steanlab
                26.07.2022 13:27

                Прекрасно, да!


              1. statementxp
                26.07.2022 20:36

                О, а загрузи его фразой Google Pixel on table with hand over it)


                1. Aleron75 Автор
                  26.07.2022 22:41
                  +3

                  Лови =)

                  Google Pixel on table with hand over it, digital art
                  Google Pixel on table with hand over it, digital art


                  1. Grafyty
                    28.07.2022 10:40
                    +3

                    Сто лет не заходил в аккаунт хабра. Тут я для того что бы сказать спасибо за статью.


                1. Wesha
                  26.07.2022 22:47
                  +2

                  Google Pixel on table with hand over it

                  Это Вы сейчас пытаетесь провести старый тест на понимание "она уронила карандаш на стол и сломала его"?

                  Кстати, on the table.


                  1. crystallize
                    28.07.2022 17:53

                    Был виден в небе змей


              1. MarkFish
                28.07.2022 14:59
                +3

                Я в шоке...


                1. Aleron75 Автор
                  29.07.2022 10:53

                  Как тебе миньоны на чайной церемонии?

                  Minions Impressionism tea ceremony
                  Minions Impressionism tea ceremony

                  А ты работы ниже в комментариях еще посмотри. Вообще офигеешь =)


          1. Medeyko
            26.07.2022 17:24
            +2

            А что Вам мешает предоставить свободный доступ к полным изображениям? В договоре есть такой запрет?

            (Кстати говоря, насколько я видел, раньше в изображениях, генерируемых нейросетями, на более высоких разрешениях количество артефактов нелинейно увеличивалось. А мелкие картинки, конечно, прекрасны!)


            1. Aleron75 Автор
              26.07.2022 21:49

              Мне ничего не мешает) Просто тут проще отвечать скринами сразу на все варианты. За фулами пишите в тг.


              1. Faxfox
                27.07.2022 08:31
                +6

                Если пропустит цензура ) Naked woman with a large bust bathes in the Martian river at sunset


              1. Eclips4
                27.07.2022 11:11

                А вас в целом не пугает вся эта ситуация ? :) (Вопрос о текущих возможностях ИИ)


                1. Aleron75 Автор
                  28.07.2022 10:53

                  Именно у меня шок. Поэтому и решил написать статью об этом =)


      1. David_Zuloyan
        28.07.2022 10:53
        +2

        Здравствуйте, очень интересная статья, можно сгенерировать изображение по тексту: Four-eyed hellhound chained to a stone against a hellish background, super realistic 8k. Заранее спасибо.


        1. Aleron75 Автор
          28.07.2022 11:04
          +1

          four-eyed hellhound chained to a rock against a hellish background, super realistic 8k, digital art
          four-eyed hellhound chained to a rock against a hellish background, super realistic 8k, digital art

          Забий своих гончих из ада =)


          1. supercawa
            28.07.2022 16:23
            +2

            Интересно, не известные слова, Dalle просто игнорируются или же каким-то образом влияют на результат. Пока предполагаю? что игнорируются, ни у одного бобика не вижу четырех глаз.


            1. Alexey2005
              28.07.2022 16:38
              +2

              Поздравляю, вы похоже обнаружили ещё один недостаток этой нейронки: она не умеет считать. Запросы вида «six apples on the table» или «figure with seven corners» выполняются из рук вон плохо.
              Неизвестные слова нейронка отрабатывает по ассоциативным цепочкам. Можно скормить бессмысленный запрос типа «wabbus shibubius, fantasy art» и всё равно получить картинку, причём на картинках будет изображено примерно одно и то же.


              1. David_Zuloyan
                28.07.2022 19:17

                Да кажется так. Нейронка не смогла нарисовать пса с четырьмя глазами.


                1. Medeyko
                  28.07.2022 19:36

                  У Кандинского может получиться лучше: в русскоязычной среде понятие четырёхглазых собак есть (это которые с пятнышками-ложными глазами для введения врага в заблуждение).


                  1. R7R
                    28.07.2022 19:50

                    в русскоязычной среде понятие четырёхглазых собак есть


                    Кстати, а как нейронка переварит такое известное понятие, как Three Dog Night? :)


              1. Medeyko
                28.07.2022 19:30

                Я пожалуй даже обобщу, как искать подобные недостатки: там где естественным нейронками приходится напрягаться, там и искусственным сложно.

                Счёту дети сами не учатся, их приходится этому учить. Долго у людей было, по всей видимости, только «один, два, много» — что и для нейронок проще.


          1. David_Zuloyan
            28.07.2022 19:28

            Надо научиться лучше писать запрос. Конечно не четырёхглазая адская гончая но все равно результат хорош, большое спасибо. Кстати, а как можно получить доступ к API Dalle-2?


  1. Borovkov
    26.07.2022 12:12
    +7

    У меня у одного не получается оттуда доставать вменяемые картинки?


    1. ComodoHacker
      26.07.2022 12:18
      +13

      Если бы у всех был доступ, нас бы было много.


    1. Aleron75 Автор
      26.07.2022 12:57
      +2

      Плохо стараешься) Можно легко скачивать оригиналы.


  1. R7R
    26.07.2022 12:16
    +8

    Дизайнеры больше не нужны


    Уже довольно давно в MS PowerPoint появилась функция автоматической генерации графического оформления слайдов.
    Первая реакция — восторг, как в статье.

    Но потом она слегка задолбала своим разнообразным однообразием (легальный 365) — у человека фантазия намного разнообразнее и осмысленнее, чем у ИИ.


    1. Aleron75 Автор
      26.07.2022 13:00
      +7

      Но Dalle-2 каждый раз что-то уникальное генерирует. Иногда варианты отличаются очень сильное. При этом сущности из текста все равно хорошо сохраняются.


      1. R7R
        26.07.2022 13:05
        +6

        Примерно тот же принцип, но со смыслом

        image


        1. Aleron75 Автор
          26.07.2022 13:25
          +32

          Разве дизайнеры это не тот же самый калейдоскоп ?) Все мы сшиты из мыслей и слов, которые слышали ранее.


          1. R7R
            26.07.2022 13:29
            -10

            Разве дизайнеры это не тот же самый калейдоскоп ?)


            Нет
            Берем ноут ASUS A6Q00Vm (A6Vm-P745S58HWW) 2006 года и сравниваем его с MacBook Pro 13″ A1278 Mid 2009 ((Unibody)


            1. FreeNickname
              26.07.2022 14:42
              +5

              Compare ASUS A6Q00Vm laptop from 2006 with Macbook Pro 13" A1278 Mid 2009 (unibody)

              @Aleron75, тут запрос для Dalle :)


              1. Aleron75 Автор
                29.07.2022 11:04

                Ахах, ну ловите!

                Берем ноут ASUS A6Q00Vm (A6Vm-P745S58HWW) 2006 года и сравниваем его с MacBook Pro 13″ A1278 Mid 2009 ((Unibody), digital art, cyberpunk style
                Берем ноут ASUS A6Q00Vm (A6Vm-P745S58HWW) 2006 года и сравниваем его с MacBook Pro 13″ A1278 Mid 2009 ((Unibody), digital art, cyberpunk style


          1. Rive
            26.07.2022 14:34
            -4

            Если сшить голема из слов, он всё равно останется големом без намерений, который неспособен назначать и воспроизводить смыслы.


            1. Jian
              26.07.2022 14:37
              +4

              Слышали про киберпанковский парадокс Философский Зомби?


              1. Aleron75 Автор
                28.07.2022 11:06
                +2

                Какой-то термоядерный гибрид вышел

                cyberpunk paradox Philosophical Zombie, digital art
                cyberpunk paradox Philosophical Zombie, digital art


            1. Hardcoin
              26.07.2022 18:12
              +8

              А есть какое-то подтверждение, что живой человек способен назначать и воспроизводить смыслы? Какое-то вот надёжное, что бы взять две картинки и точно понять - в одной есть смысл, в другой нет. Или на веру всё?


          1. Nikita_Igorevich
            29.07.2022 10:54
            +1

            Боже, ахах. Так пусть псевдоинтеллект и стряпает человечеству макеты сложных интефейсов. Тут даже на счет художников то поспорить можно...


        1. mihnik
          27.07.2022 07:27
          +2

          Ой, а расскажите мне про смысл этой картинки? А то от меня убегает...


      1. MonkeyWatchingYou
        26.07.2022 20:20

        Del


      1. Deosis
        27.07.2022 07:46
        +1

        На примере городов будущего Dalle-2 генерирует только небоскребы. Другие варианты не рассматривабтся вообще.


        1. Jian
          27.07.2022 08:00
          +2

          На примере городов будущего Dalle-2 генерирует только небоскребы. Другие варианты не рассматриваются вообще.

          А какой город будущего вы хотели бы видеть?

          • "futuristic mansions city without skyscrapers"

          • "futuristic suburban area without skyscrapers"

          • "futuristic five-stored houses city without skyscrapers"

          • "futuristic three-stored houses city without skyscrapers"

          • "futuristic underground city without skyscrapers"

          • "futuristic balloons as houses city without skyscrapers"

          • "futuristic houses on trees city without skyscrapers"

          • "futuristic biologic houses in trees city without skyscrapers"

          • "futuristic biologic houses city without skyscrapers"

          • "futuristic diplodocus as house city without skyscrapers"

          • "futuristic forest city without skyscrapers"

          • "futuristic garden city without skyscrapers"

          • "futuristic jungles city without skyscrapers"

          • "futuristic palaces city without skyscrapers"

          • "futuristic castles city without skyscrapers"

          • "futuristic moats city without skyscrapers"

          • "futuristic underwater city without skyscrapers"

          • "futuristic space station city without skyscrapers"

          • "futuristic flying houses city without skyscrapers"

          • "futuristic levitating houses city without skyscrapers"

          @Aleron75


          1. kasyachitche
            27.07.2022 10:14
            +1

            В том то и проблема, что нужно придумать что мы хотим, а нам уже отрисуют. При этом нужно достаточно подробно описать что нам нужно, сгенерировать разные результаты из одного запроса Dalle 2, кажется, не может (что вполне логично, нет?). По сути, Dalle 2 это не дизайнер и не художник, а просто кисть для дизайнера или художника.


            1. cepera_ang
              27.07.2022 10:21
              +9

              А как должно быть? Система должна догадаться чего вы хотите увидеть и нарисовать это? Художники что ли сами находят людей и предлагают им нарисовать что-то, что у них (у людей) на уме?


              В принципе, это тоже возможно на текущем этапе (условный гугл/фейсбук обладают достаточным количеством информации, чтобы понять, чтобы вы хотели видеть нарисованным в конкретный момент), просто это потребует большего количества движущихся деталей — сборщик телеметрии, рекомендательную систему, анализатор и потом только генератор картинок.


              1. Alexey2005
                27.07.2022 10:28
                +3

                А как должно быть? Система должна догадаться чего вы хотите увидеть и нарисовать это?
                Бинго! Основная проблема с заказчиками чего угодно (рисунков, софта, музыки) заключается в том, что они обычно сами не знают, чего хотят. И уж тем более не способны внятно выразить свои мысли, лишь разводя руками и издавая странные мычащие звуки.
                Нарисовать, написать и закодить не так сложно, это уже рутина. Основная сложность заключается в том, чтобы вытащить смутные расплывчатые желания из головы заказчика и превратить их в техзадание.


                1. cepera_ang
                  27.07.2022 10:35
                  +8

                  Ну так это проблема двоякая: люди с одной стороны не знают чего хотят, с другой — способны понять, хотят ли они то, что видят. Поэтому художник в каком-то смысле служит навигатором и визуализатором внутренней картинки человека, которую от пытается получить, но не умеет. Если же компьютерная система будет позволять интерактивно исследовать пространство вариантов, то люди и самостоятельно довольно быстро смогут приходить к нужным картинкам.


                  Если с софтом это может быть довольно сложно (всё-таки трудно понять работает ли софт в точности так, как ты имел в виду) и с аудио тоже (оно длится во времени и можно непонимать почему звучит не так, как хочется), то с картинками самое оно — можно мгновенно оценить и легко крутить ручки («ммм, а можно вот тут робота в углу? Ой не, нафиг робота, давайте кошечку, так, только побольше, да ну фигня получилась, лучше поменьше, о самое оно»)


              1. kasyachitche
                27.07.2022 11:17
                +1

                Если мы говорим о системе, как о замене художников и дизайнеров, то да, система должна сама догадаться. Например, говоришь, нарисуй мне город будущего, а Dalle 2 выдает пару небоскребов. А тебе не нужны небоскребы, тебе нужен город будущего.
                Художник же может выдать кучу разных вариантов городов будущего из головы, может присовокупить к ним летающий паровоз или сцену четвертой мировой войны с камнями и палками. Поэтому человек может догадаться что тебе нужно, даже если ты этого сам не знаешь. А для Dalle 2 нужно составиться максимально конкретное ТЗ. Получается, что сначала у себя в голове нужно что-то "нарисовать", а потом просто перевести эту картинку в графический вид. Раньше для этого нужны были навыки и кисти, а теперь можно просто текстом.


                1. cepera_ang
                  27.07.2022 11:38
                  +4

                  Художник же может выдать кучу разных вариантов городов будущего из головы, может присовокупить к ним летающий паровоз или сцену четвертой мировой войны с камнями и палками

                  «Извините, я сказал город будущего, а не летающий паровоз или сцену четвёртой мировой войны, вы вообще способны понимать русский язык?» Или как нужно реагировать на художника, который выдаёт результаты даже хуже, чем нейросеть, придумывая что-то от балды?


                  Разница в том, что поиск вариантов в живым художником, будет занимать полдня на итерацию, а с машинным — две секунды. «блин, скучный город получился, одни небоскрёбы, а можно без небоскрёбов? А в стиле соларпанка? А теперь гораздо темнее. И чтобы похоже было на рендер из игры. А небо фиолетово-зелёное. Не, лучше красно-оранжевое. Так, а теперь орбитальную станцию на горизонте. Не, в стиле элизиума. Не фигня вышла, давай похожей на звезду смерти. Во, отлично» — итого десяток итераций можно за две минуты прогнать. С художником уже к пятому варианту будет «блин, этот заказчик не знает чего хочет вообще, давай плоти больше или бери последний вариант» и пройдёт минимум неделя.


                  Поэтому да, люди вполне смогут интерактивно усовершенствовать то, что надо нарисовать давая текстовые запросы (или картинки, что, кстати, тоже можно делать). А чтобы им было ещё проще — каталог таких запросов и лайфхаков уже доступен и будет только расширяться. «просто перевести картинку в графический вид» — это и была сложность для людей, которую решали художники, а не отсутствие фантазии.


                  1. kasyachitche
                    27.07.2022 13:52

                    «Извините, я сказал город будущего, а не москва-сити.» Или как нужно реагировать на художника, которому надо каждый штрих на рисунке проговаривать?

                    Мы говорим об одном и том же.


                  1. Levitanus
                    28.07.2022 09:56
                    +3

                    Мне кажется, что это хороший вариант для составления ТЗ. А потом уж пусть дизайнер работает


                    1. cepera_ang
                      28.07.2022 10:24
                      +3

                      Да, в каких-то случаях это может стать хорошей стартовой точкой, в каких-то может оказаться вполне достаточным для использования напрямую. В конце концов, не все делают художественные продукты уровня транснациональных корпораций, большинству достаточно будет просто хороших результатов, не обязательно лучшие в мире.


                    1. Jian
                      28.07.2022 10:47

                      Мне кажется, что это хороший вариант для составления ТЗ. А потом уж пусть дизайнер работает

                      Да, в идеале, это очень хороший вариант ТЗ. Но, но как уже писали в этом обсуждении большинство устроит бесплатный вариант "и так сойдёт".


          1. Jian
            27.07.2022 11:51
            +3

            @Aleron75 пожалуйста! Очень интересно, как нейросеть может представить футуристический город без небоскрёбов.


          1. Aleron75 Автор
            28.07.2022 11:11
            +4

            Запихнул все в один запрос. Классно вышло?

            futuristic mansions city without skyscrapers, futuristic suburban area without skyscrapers, futuristic five-stored houses city without skyscrapers, futuristic three-stored houses city without skyscrapers, futuristic underground city without skyscrapers, futuristic balloons as houses city without skyscrapers, futuristic houses on trees city without skyscrapers, futuristic biologic hous, digital art
            futuristic mansions city without skyscrapers, futuristic suburban area without skyscrapers, futuristic five-stored houses city without skyscrapers, futuristic three-stored houses city without skyscrapers, futuristic underground city without skyscrapers, futuristic balloons as houses city without skyscrapers, futuristic houses on trees city without skyscrapers, futuristic biologic hous, digital art


            1. Jian
              28.07.2022 11:14
              +1

              Больше всего мне второй вариант нравится. Первый и последний вариант тоже красивые. :)


            1. Refridgerator
              28.07.2022 11:50

              Так небоскрёбы же остались по сути — длинные высокие сооружения.


              1. cepera_ang
                28.07.2022 11:51
                +1

                На 2 и 4 — пятиэтажки, как запрошено :)


            1. supercawa
              28.07.2022 12:07

              Приблизительно так я и представлял полученные результаты, от Dalle. Единственный вариант, что меня удивил - это третий. Остальные варианты, явно популярны среди современных художников, что и будет сказываться на результатах Dalle. Как говорится на чем обучили, то и получили. Но даже при этом результаты поражают.


      1. nixtonixto
        27.07.2022 08:54

        В вашей же статье все сгенерированные роботы примерно одинаковые. Незначительные отличия только в голове и использовано 3 разных цвета…


        1. Jian
          27.07.2022 09:18

          Надо глянуть на вариант "metal ant robot".


      1. OjosTrist3s
        29.07.2022 10:55
        +1

        Привет)

        Когда можно будет получить в цепкие лапы Dalle-2?

        Прогони вот это пожалуйста (очень надо):

        psyhodelic mashroom heterosexual, among us, lsd art, oil painting, little creepy faces faces background


        1. Aleron75 Автор
          29.07.2022 10:57

          Уххх, какая-то психоделика...

          psyhodelic mashroom heterosexual, among us, lsd art, oil painting, little creepy faces faces background, digital art, cyberpunk style
          psyhodelic mashroom heterosexual, among us, lsd art, oil painting, little creepy faces faces background, digital art, cyberpunk style


    1. MrLoki
      26.07.2022 13:06
      +17

      Потому что это не ИИ и фантазии у него нет :) Любой из предложенных Dalle вариантов, это поиск в уже известных образах и усреднение с долей рандома (что и создаёт эффект однообразия — «лучшие» варианты будут похожи). Тоесть, строго говоря, именно «креативности» там нет вообще, а весь эффект, это лишь способность «склеить» неподходящие образы каким-то образом и «узнавание» образов. ML в данный момент может стать ассистентом с неплохим кругозором, но не дизайнером.


      1. Ivan22
        26.07.2022 13:08
        +18

        ну так это именно то что надо в 99% случаев


        1. R7R
          26.07.2022 13:09
          +3

          ну так это именно то что надо в 99% случаев


          Ну и будет в итоге как с современной музыкой.


          1. PereslavlFoto
            26.07.2022 15:54
            +8

            Современная музыка в совершенстве воплотила главное свойство музыки — товарность, способность продаваться.

            Если от дизайна требуется товарность, программный генератор будет работать лучше человека.

            Если же от дизайна требуется художественная выразительность и творческое мастерство (а вовсе не прибыльная товарность), то я хотел бы узнать город, в котором это требуется. Я туда уеду, чтобы не платить.


            1. R7R
              26.07.2022 17:06

              Современная музыка в совершенстве воплотила главное свойство музыки — товарность, способность продаваться.


              Гм. В моем детстве родители пачками покупали пластинки (еще на 78 оборотов).
              Когда я вырос, стал покупать пластинки сам (даже жена не смогла пресечь это увлечение :), доведя коллекцию до 400 шт.
              Потом пришлось покупать CD.
              (Еще потом вернулся винил :)
              Где-то в промежутке покупал через Эппл старые альбомы, записи с которых слушал в юности на магнитофонах — чисто, чтобы вернуть старые долги.

              Сейчас не покупаю ничего. Так как все старое у меня уже есть, а все новое — абсолютно не интересно.


              1. Kaputmaher
                26.07.2022 20:08
                +3

                Люди все больше слушают «старую» музыку, ту, что выпущена более полутора лет назад. Тенденция к «старению» треков продолжается уже 3 года, ранее такого не замечалось. Наибольшая популярность сейчас у треков, вышедших в 2017–2019 годах.

                via https://t.me/addmeto/4980


                1. R7R
                  26.07.2022 20:40
                  +2

                  Заголовок спойлера



                  1. 8street
                    27.07.2022 08:27
                    +2

                    Эм, ну почему всё? Просто современной музыки стало очень много. Искать действительно хорошую стало труднее.


                    1. R7R
                      27.07.2022 11:57

                      Искать действительно хорошую стало труднее.


                      В представленном видео показан топчик по годам.
                      Т.е. отбор уже произведен.


                  1. Vilaine
                    29.07.2022 04:41
                    +1

                    показывает, что проблемы начались где-то с конца 80х, а с середины 2000х — можно сказать, что с поп-музыкой уже все.
                    В примере сначала довольно унылая и откровенно старая по звучанию музыка с редкими интересными (до сих пор) треками, а потом ближе к нашему времени пободрее. Что сильно бросается в глаза уши — это изменяющаяся электроника и аранжировка, в этом по большей части и отличие.


              1. diakin
                26.07.2022 22:12
                +6

                Да раньше и Солнце ярче светило!


                1. tvr
                  27.07.2022 10:23
                  +3

                  И трава была зеленей и забористей!


              1. Skigh
                26.07.2022 22:36
                +6

                Сейчас не покупаю ничего. Так как все старое у меня уже есть, а все новое — абсолютно не интересно.
                Вы в молодости не общались с людьми постарше, которые любили старую музыку, а современную (на то время) игнорировали?


                1. R7R
                  27.07.2022 01:45

                  1980 г.



          1. Harley347
            26.07.2022 20:36
            +1

            А что не так с "современной музыкой"? Или претензии к какому-то конкретному жанру? Или даже к отдельным композициям?


            1. R7R
              26.07.2022 20:58

              Заголовок спойлера



              1. qark
                27.07.2022 01:06
                +5

                Как тогда было полно шаблонов, так и сейчас встречаются бриллианты.


                1. R7R
                  27.07.2022 01:46
                  +3

                  Как тогда было полно шаблонов, так и сейчас встречаются бриллианты.


                  Ищу такие бриллианты. Поделитесь.


                  1. Wesha
                    27.07.2022 02:29
                    +2

                    И со мной, пожалуйста.

                    Чтобы песня рассказывала историю, а не "бымц бымц банька моя я твой тазик бымц бымц".


                    1. IsUnavailable
                      27.07.2022 09:08
                      +2

                      Slice The Cake - Odyssey to the West


                      1. R7R
                        27.07.2022 12:06

                        Сравните с



                      1. supercawa
                        27.07.2022 16:27
                        +2

                        Если коротко все это дело вкуса. Если подробней, человеку будет нравится, то на чем сформировался его мозг, после уже трудно изменить вкусы и предпочтения данного человека. Потому и возникает непонимание "Отцов и детей". Вы не будете замечать или понимать того, что именно нравится новому поколению в музыке. Просмотрев видео, что Вы выше в спойлере предоставили про количество оригинальных музыкальных идей в поп- музыке, у меня вызвали положительные эмоции только те треки, которые вызывали те же положительные эмоции в детстве и юношестве. К примеру тот же "Smoke on the water" я бы так же отнес к не интересной и скучной, думаю, это из-за того, что я не увлекался данной группой или схожей по стилистике музыкой той эпохи. Старые композиции как и современные у меня не вызывают положительных эмоций или восхищения "о какая мелодия, такая сложная и потрясающая". Все выше написанное моё личное мнение, ни на чем не настаиваю.


                      1. R7R
                        27.07.2022 17:28
                        +1

                        Если подробней, человеку будет нравится, то на чем сформировался его мозг, после уже трудно изменить вкусы и предпочтения данного человека.


                        В детстве я слушал музыку в стиле А. Островского (см.)
                        В юности — советскую эстраду (т.н. ВИА)
                        В студенческие годы — диско.
                        Потом полюбил классику.
                        Сейчас я слушаю в основном джаз.

                        И все что я слушал — мне нравится и сейчас. Хотя вкусы менялись постоянно.

                        Вы не будете замечать или понимать того, что именно нравится новому поколению в музыке.


                        Мои дети, мои племянники и племянницы — к современной музыке абсолютно равнодушны (к классике и джазу, к сожалению — тоже).
                        Более того — у них нет ни малейшей тяги к тому, что бы слушать музыку своей молодости (это 90-тые годы).
                        (Скорее, это я буду ее слушать, чем они :)

                        Тут уже третье поколение готово выйти во взрослую жизнь (со специальностями компьютерная и программная инженерия и проч.) — к музыке же вообще интереса ноль.

                        Дело не в людях, дело в самой музыке.


                      1. Refridgerator
                        28.07.2022 06:19

                        Музыка есть вечная, а есть проходящая. Бах до сих пор не потерял ценности и регулярно исполняется, а по сложности без ущерба музыкальности ему по прежнему нет даже близких, не то что равных композиторов. Джаз тоже играется часто и многими, но джазовые стандарты давно уже не пополняются. Pink Floyd по концептуальной, музыкальной и звукорежиссёрской целостности альбомов тоже никто не смог превзойти. Развитие электронной музыки тоже прошло пик — и «Children» Роберта Майлса осталась непревзойдённой иконой. А другая популярная электронная тема, не потерявшая актуальности — внезапно является темой Эдуарда Артемьева из фильма 40-летней давности, и буквально вчера мне попалось видео на ютубе, где молоденькая девочка объясняла как её играть на синтезаторе.

                        Так что да, всё дело в музыке.


                      1. supercawa
                        28.07.2022 09:54
                        +1

                        Вы совершенно не правильно поняли мой текст. Я считаю так. Пока идет бурное развитие мозга Ваши вкусы могут меняться сколь угодно раз и вам будет нравится, то одно, то другое. А вот ближе к старости наш мозг уже не готов так активно меняться и может воспринимать, что то новое как, что то бездарное и плохое, а вот раньше было лучше. Заметьте, чем старее мы, тем ворчливее становимся. Вот об этом я и писал. Причем положительное подкрепление никто не отменял, услышав что то, что вам нравилось в детстве, так скажем из-за ассоциативным ностальгирующих моментов, вызовет все же положительные эмоции, не желе никаких. На любовь к тем или иным вещам очень сильно влияет окружение, к примеру: семья, школа, какой-нибудь признанный этим человеком авторитет (при чем чем больше авторитет у влияющего тем больше вероятность полюбить именно то что он пропагандирует), а не то, что это современно или же ретро. Так же человек может идти в разрез с обществом пытаясь, что то доказать, тем самым сформировав своё виденье(гнуть свою линию, меня никто не понимает, я уникален и т.п.), но обычно его что то должно было к этому подтолкнуть из того же окружения. Короче я тут могу долго философствовать и фантазировать, писать всякие глупости. Чем больше человек уверен в своих словах, тем больше бреда он может извергнуть.


                      1. R7R
                        28.07.2022 18:12

                        А вот ближе к старости наш мозг уже не готов так активно меняться и может воспринимать, что то новое как, что то бездарное и плохое, а вот раньше было лучше.


                        Вопрос — что такое старость и когда она начинается?
                        Ответ — это понятие не зависит от возраста, и присуще каждому человеку индивидуально.

                        Кто-то стал стариком в 25 и спился к 35 (смерть желаний и потеря жажды жизни), кто-то и в 75 дает фору молодым (как один мой знакомый профессор, в 75 лет самостоятельно освоивший компьютер (это было в 1998) на уровне продвинутого пользователя.

                        (конечно, с физическим здоровьем дела обстоят хуже, но мы не об этом параметре молодости :)

                        На любовь к тем или иным вещам очень сильно влияет окружение, к примеру: семья, школа, какой-нибудь признанный этим человеком авторитет


                        Гм. По данному предмету (музыке) дело обстояло с точностью до наоборот — любовь к зарубежной музыке (а к року — особенно) категорически не приветствовалась тогдашними авторитетами и школой особенно (см. фильм «Розыгрыш» (1977), там все сильно смягчено, но показано правильно :)
                        А в семьях детей отдавали в музыкальные школы, где опять же, зарубежная попса и рок категорически не приветствовались.

                        Так что не благодаря — а вопреки :)


                      1. snaiper04ek
                        28.07.2022 14:12

                        >>Если подробней, человеку будет нравится, то на чем сформировался его мозг, после уже трудно изменить вкусы и предпочтения данного человека.

                        ммм.... Всё детство слушал попсу с музтв и рэп, много рэпа, очень очень много рэпа. А ещё слушал чёрный рэп, не так много, но много. Я уже говорил, что слушал рэп? Слушал, да, и наизусть знал кучу треков, и до сих пор помню отдельные куплеты.

                        В 17 лет таки мне очень сильно зашли треки Fallout 3, и в моём плейлисте прописалось много музыки тех бородатых годов. В душе не знаю как она называется, но очень нравится.

                        В 19-20 лет, 2 года на повторе крутились ТОЛЬКО все альбомы Флёр. Только они, и больше ничего, 2 года. На столько мне зашло.

                        В 20 лет внутри аниме играли классические музыкальные композиции с концертов. Тогда у меня пропало отвращение к классике, а Рахманинов занял почётное место в сердечке.

                        В 25 лет, впервые смотря ДжоДжо, мне очень не нравилась открывающая композиция, потому что она была роком. Не тяжёлым, обычным. Сейчас, спустя 4 года, спокойно её слушаю, и за эти 4 года вообще в плейлист попало крайне много рок-композиций, в том числе старых, с печальным качеством. Smoke on the water - одна из них. Рок заходил в мою жизнь тяжело и со скрипом, но по итогу зашёл и обосновался основательно. Да, пару лет познакомился с Девидом Боуи. Отвал башки, как говорится.

                        Сейчас почти 30, а реп я с 20 лет(примерно) вообще не слушаю. То что нравилось раньше из репа - теперь не могу включать, воротит. Буквально несколько треков сос мыслом осталось в душе, иногда их включаю, но редко. Хотя, справедливости ради, за эти 10 лет таки нашлись-таки целых три трека, которые попали в мой плейлист, но это исключение.

                        Сейчас слушаю J-pop, J-rock, и вернулся к Флёр.

                        Короче говоря: теория классная, только жаль, что не работает.


                      1. supercawa
                        28.07.2022 15:24

                        Ну моя теория еще не опровергнута, 30 это еще не старость. Но то, что она шаткая, я согласен. Я сужу по себе и своему отцу. Видимо моё виденье узкое. А статистических данных уж точно у меня мало.


                      1. R7R
                        28.07.2022 18:18

                        Заголовок спойлера



                      1. IsUnavailable
                        28.07.2022 15:34

                        Хмм, всё что я смог найти:

                        "Похороны клопа" - ритуал разных народов по изгнанию из домов насекомых-паразитов.

                        Понятия не имею как это вообще относится к музыке и к поиску "бриллиантов". Если проясните - буду благодарен. Мне очень интересно.

                        На самом деле, я отвечал больше не вам, а Wesha, т.к. он предоставил, скажем так, более конкретное ТЗ. А вот что такое "бриллианты" в вашем понимании для меня загадка т.к. приведённая вами в пример песня одного риффа лично у меня никаких ассоциаций кроме как с новичками в магазине гитар не вызывает)


                      1. R7R
                        28.07.2022 18:26

                        Понятия не имею как это вообще относится к музыке


                        «Похороны клопа» — старый мем, обозначавший попытки самодеятельного музыканта публично импровизировать на гитаре, электрооргане, пианино и проч. музыкальных инструментах, опираясь по памяти на ранее услышанное.

                        Получалось довольно тоскливо, отсюда и «похороны» :)

                        (есть аналог для вокала — «что вижу, о том и пою»)


                      1. crystallize
                        28.07.2022 17:54
                        +3

                        Похороны клопа-отличный запрос для Dalle2!


                      1. Wesha
                        28.07.2022 04:17
                        +1

                        Когда я просил "без бымц-бымц", это не означало "с БАБАХ-БАРАБАХ"....


                    1. Moroshka
                      27.07.2022 10:57
                      +1

                      Ну справедливости ради у битлов тексты тоже весьма незамысловаты: я встретил ее, она сказала что любит тебя, еееее)


                      1. R7R
                        27.07.2022 12:02
                        +1

                        Заголовок спойлера

                        When I find myself in times of trouble
                        Mother Mary comes to me
                        Speaking words of wisdom
                        Let it be
                        And in my hour of darkness
                        She is standing right in front of me
                        Speaking words of wisdom
                        Let it be
                        Let is be, let it be
                        Let it be, let it be
                        Whisper words of wisdom
                        Let it be
                        And when the brokenhearted people
                        Living in the world agree
                        There will be an answer
                        Let it be
                        For though they may be parted
                        There is still a chance that they will see
                        There will be an answer
                        Let it be
                        Let is be, let it be
                        Let it be, let it be
                        Yeah, there will be an answer
                        Let it be
                        Let is be, let it be
                        Let it be, let it be
                        Whisper words of wisdom
                        Let it be
                        Let is be, let it be
                        Let it be, yeah, let it be
                        Whisper words of wisdom
                        Let it be
                        And when the night is cloudy
                        There is still a light that shines on me
                        Shine on 'til tomorrow
                        Let it be
                        I wake up to the sound of music
                        Mother Mary comes to me
                        Speaking words of wisdom
                        Let it be, yeah
                        Let it be, let it be
                        Let it be, yeah, let it be
                        Oh, there will be an answer
                        Let it be
                        Let it be, let it be
                        Let it be, yeah, let it be
                        Whisper words of wisdom
                        Let it be


                      1. Moroshka
                        27.07.2022 12:34

                        у поздних битлов да, тексты стали глубже, но популярность они набрали на текстах типа:

                        You think you’ve lost your love

                        Well, I saw her yesterday

                        It’s you she thinking of

                        And she told me what to say

                        She says she loves you

                        And you know that cant be bad…

                        или:

                        Love love me do

                        You know i love you

                        I’ll always be true

                        So please love me do


                      1. R7R
                        27.07.2022 13:06

                        но популярность они набрали на текстах типа:


                        На тот момент их фанатами были преимущественно экзальтированные девчонки, (см. видео того периода :)

                        Я, благодаря своим старшим двоюродным братьям, с их магнитофоном Днепр — познакомился с творчеством битлов еще в дошкольный период, и первый их хит, который помню — «Eleanor Rigby» (запись дошла до нас в 1967).

                        А с ранним периодом творчества Битлз я познакомился много позже — где-то в начале 80х (хотя инструментальные аранжировки слышал и раньше).


                      1. Moroshka
                        27.07.2022 13:23
                        +1

                        Я с творчеством битлов знакомилась в том порядке в котором они набирали популярность) мое знакомство происходило в 90-е когда вышел фильм the beatles anthology или как-то так он назывался)

                        Смотрела фильм вместе с бабушкой) под ее постоянное ворчание - о боже, патлатые какие и орут, вот другое дело Александр Малинин ????

                        На мой недоуменный вопрос - он же еще более патлатый? Ответом всегда было - нееее, ну это другооое))


                      1. R7R
                        27.07.2022 13:37

                        Александр Малинин


                        1958 г. рождения, да еще и музыкант с детства.

                        Наверняка битломан, в свое время :)
                        И длинные волосы — как дань памяти и уважения.


                    1. yvp
                      27.07.2022 11:13
                      +1

                      Как раз вчера слушал кантри на Spotify, и обратил внимание на эту песню:
                      https://www.musixmatch.com/lyrics/Braxton-Keith-2/Cold-Hard-Steel-and-Sand
                      По-моему, очень годно: про историю Техаса
                      Сразу вспомнил, когда читал эту ветку комментариев


                    1. crystallize
                      28.07.2022 18:10

                      Crush 40 - One of those days

                      Luna Sea - Feel


                  1. ALogachev
                    27.07.2022 13:12
                    +1

                    Как насчет такого:
                    www.youtube.com/watch?v=7BMcfdeRk-c&ab_channel=%D0%9C%D0%B0%D1%80%D0%BB%D0%B8%D0%BD%D1%8B
                    На «Дикой мяте» зацепило… раз 20 послушал… :)))


                  1. crystallize
                    28.07.2022 18:09

                    Crush 40 - One of those days

                    Luna Sea - Feel


              1. Harley347
                27.07.2022 11:41
                +5

                Это или снобизм, или брюзжание. Мне как-то удаётся найти что-то интересное для себя. В приведённом видео только хиты из Billboard, за его рамками огромное количество музыки, о которой мы даже никогда можем и не узнать


                1. R7R
                  27.07.2022 12:19
                  +1

                  Это или снобизм, или брюзжание.


                  Похоже, что для вас есть только два мнения :)

                  Мне как-то удаётся найти что-то интересное для себя.


                  Я за свою жизнь переслушал уже столько музыки, что, похоже, таки нашел практически все, что заслуживает внимания :) Увы, нынешнее новое — либо перепевки старого либо вариации на тему.

                  (я бы решил, что человечество уже нашло все возможные мелодии, но вот только четкое совпадение по времени с компьютеризацией творчества и бизнеса меня сильно смущает :)

                  за его рамками огромное количество музыки, о которой мы даже никогда можем и не узнать


                  Я был свидетелем того, как песня, рожденная в узком кругу провинциального ВИА — внезапно стала всеобщим хитом в стране.
                  Что-то стоящее в музыке всегда станет известным, чай не восемнадцатый век сейчас :)


                  1. Harley347
                    27.07.2022 15:46
                    +1

                    Нет же, я за всяческий плюрализм. А вы брюзжите :) Но я не осуждаю, все там будем. В какой-то момент и я решу, что "переслушал уже столько музыки, что, похоже, таки нашел практически все, что заслуживает внимания", и перестану искать. Но моё мнение, что с современной музыкой всё в полном порядке. Никому его не навязываю, и никого не собираюсь переубеждать. Дискуссионный потенциал нашей маленькой беседы исчерпал себя, благодарю за интересный и содержательный диалог, всего вам хорошего


              1. Odrin
                27.07.2022 16:42

                Да, давайте сравним. У Вас есть какие-то числовые показатели/статистика для сравнения? Или все Ваше сравнение основано на субъективном восприятии и ограниченности кругозора?


                1. R7R
                  27.07.2022 17:31

                  У Вас есть какие-то числовые показатели/статистика для сравнения?


                  Да, смотрим число просмотров и число лайков и комментариев к подборкам музыки разных лет.


          1. alextrof94
            28.07.2022 22:23

            Что такое "современная музыка"?

            У меня друг на гитаре лабает, как это делали 50 лет назад, например.

            Популярная же музыка - музыка настроения. Стали кальяны популярны - под них уже что-то танцевальное слушать не хочется. Станет спортзал популярным - всё будут слушать что-то быстрое, это начнут крутить по радио.


        1. MrLoki
          26.07.2022 13:10

          «Это» — что? «Надо» — кому? Я не утверждаю, что Dalle не нужен вовсе чтобы так абстрактно отвечать :)


      1. Vogul
        26.07.2022 14:26
        +10

        Насколько я знаю, по информации из открытых источников, человеческий мозг работает точно так же. Т. е. он не может генерировать абсолютно новую информацию. Весь креатив, всё равно базируется на предыдущем опыте.


        1. MrLoki
          26.07.2022 15:09
          -4

          Человеческий мозг работает намного интереснее, а не «точно так же», как минимум поскольку получает гораздо больше разнообразной информации постоянно и на базе неё может синтезировать гораздо более сложные образы. А является ли мозг «просто вычислителем», и соответственно может ли быть заменён вычислителем с большим количеством мощности — вообще вопрос открытый до сих пор.

          По аналогиям: калькулятор работает точно так же как M2? Ну в некотором роде да (базовые принципы совпадают), но M2 гораздо сложнее и содержит больше компонентов, чтоб сделать эту аналогию с одной стороны — неточной, а с другой стороны — скорее вредной и сбивающей с толку. Хотя-бы по той причине, что 5 млн калькуляторов не дадут вам M2, даже не приблизят.


          1. Layan
            26.07.2022 15:26
            +2

            Осталось понять в этой аналогии, чем будет наш мозг через несколько лет - M2 или калькулятором...


          1. sim31r
            26.07.2022 17:29

            как минимум поскольку получает гораздо больше разнообразной информации постоянно

            Мозг получает в миллиарды раз меньше информации. Зрение условно 0.3 мегапикселя, и то работающее на 0.1% от максимального значения. Звук паттерн из нескольких частот, мп3 формат успешно этим пользуется, это тоже килобиты информации. ИИ же оперирует гигабайтами информации, не ограничен в ресурсах практически. Человек весь по сути миллиард нейронов в коре, многие из которых дублируют друг друга. Причем медленные, релаксация нейрона по 5 мс, это вообще не те скорости..


            1. MrLoki
              26.07.2022 18:31

              С учётом тупости даже передовых моделей типа `LaMDA`, получается, что вы доказываете, что дело не в вычислениях :) я собственно вёл к этому же, но с другой стороны. Единственное — я бы текущие системы ИИ не называл, очень уж им до него далеко.


          1. saboteur_kiev
            27.07.2022 01:48
            +1

            Основное отличие мозга от машины - это его ассоциативные возможности.

            Вот это самое "воспринимая вкус еды на слух, цвет на зуб, вонь на глаз, представляя себе фильм по названию, живопись по фамилии, страну по "Клубу кинопутешествий", остроту мнений по хрестоматии..."


            1. unC0Rr
              27.07.2022 10:33
              +1

              живопись по фамилии
              Так вот же, нейросетка из топика легко сгенерирует картину в стиле художника, названного по фамилии.


              1. R7R
                27.07.2022 12:22
                -2

                Так вот же, нейросетка из топика легко сгенерирует картину в стиле художника, названного по фамилии.


                Но проблем. Леонардо да Винчи.
                Потом позвать эксперта, сказать что найдена картина и предполагается авторство классика.
                И выслушать его мнение по этому поводу :)


            1. ibrin
              27.07.2022 13:01

              Миша, перелогинься!


        1. nixtonixto
          27.07.2022 08:58
          +2

          Если бы мозг не мог генерировать абсолютно новую информацию — то мы бы сейчас не тыкали пальцем в сенсорный экран аппарата с 7...28-нм процессором, а сидели в пещерах, кутаясь в звериные шкуры.


          1. cepera_ang
            27.07.2022 09:47
            +1

            Каждый шаг на пути к сенсорным экранам был минимальным и инкрементальным. Вот если бы мозг из пещеры, закутанный в звериную шкуру мог придумать сенсорный экран с 7-нм процессором (или хотя бы только один процессор), то это было бы доказательством.


            А так, никаких абсолютно новых скачков в истории не наблюдается, всё изобретается после того, как необходимые предпосылки уже были доступны. Колесо имеет пример в виде круглых камней, бревен и подобных вещей, алфавит начинается не с символьной записи звуков живого языка, а с палочек и чёрточек для учёта предметов и картинок для передачи происходящих событий и т.д.


            1. nixtonixto
              27.07.2022 09:57
              +1

              Но на этом пути много великих открытий. Например, жидкие кристаллы и дисплей на их основе инкрементально не создашь и у природы не подсмотришь. Кто-то должен был заметить эффект и додуматься использовать его именно так.


              1. cepera_ang
                27.07.2022 10:29
                +6

                Именно инкрементально и создали — откройте историю в вики, сначала открыли сами кристаллы, пусть и целенаправленным поиском, но когда уже были известны огромные массивы информации о свойствах материи, потом через 50 лет начали серьезно исследовать и ещё через 20 лет работы сотни исследователей заметили способность изменять свойства от воздействия среды, кто привело к первым дисплеям только через очередные десять лет. И от этих первых ЖК до современных — пропасть, но пропасть заполненная мелкими улучшениями и приложениями разных уже существующих идей, методов и подходов к проблеме.


                1. randomsimplenumber
                  28.07.2022 08:07
                  +2

                  Математическая основа современной криптографии придумана, когда никаких компьютеров не существовало. Да и вообще почти вся математика.


                  1. R7R
                    28.07.2022 18:31

                    Математическая основа современной криптографии придумана, когда никаких компьютеров не существовало.


                    Тут скорее так: современные компьютеры получили шанс на существование благодаря криптографии.


                    1. iig
                      28.07.2022 18:55

                      благодаря криптографии.

                      Которая построена на абстракциях, придуманных при свете свечей. Даже паровозов тогда ещё не создали.


                      1. cepera_ang
                        28.07.2022 19:19

                        Да, ещё даже теорию информации не осилили, а криптография уже во всю… При свечах, гусиным пером оформляли патенты на эллиптические кривые


                      1. randomsimplenumber
                        28.07.2022 20:04

                        Про Эйлера не слышали?


                      1. cepera_ang
                        28.07.2022 20:46

                        Я и про шифры Цезаря слышал, но наверное будет небольшой натяжкой говорить, что современные компьютеры построены на основе наработок тех времён.


                        «Компьютеры используют нули, а нули были придуманы древними индусами, значит математические основы компьютеров были заложены ещё тогда» — я против такой интерпретации, но за такую, что без нулей и прочей математики компьютеров бы очевидно не было и следовательно, компьютеры однозначно являются «абсолютно новым знанием», появление которого возможно только после анлока всей необходимой математики сильно заранее.


                        Но объём созданного аппарата в криптографии до 20-го века и после (особенно после 40-60-х гг) — несравним. И именно потому, что появление компьютеров и правильных базовых абстракций обусловило дальнейшее развитие.


                      1. randomsimplenumber
                        29.07.2022 07:00
                        +1

                        Эйлер занимался не криптографией, а математикой. И его заморочки с теорией чисел были чисто абстрактным развлечением, пока не пригодились в RSA и DH. Которые торчат теперь из каждого HTTPS соединения ;)


                      1. R7R
                        28.07.2022 20:37

                        Которая построена на абстракциях, придуманных при свете свечей. Даже паровозов тогда ещё не создали.


                        «Для декодирования сообщений, зашифрованных при помощи Lorenz, группа математиков и инженеров сначала построила механическую машину Heath Robinson, а затем несколько модификаций электронно-механической машины Colossus. Это позволило получать сведения о решениях верховного командования Вермахта» (с)


          1. R7R
            27.07.2022 12:24

            Если бы мозг не мог генерировать абсолютно новую информацию — то мы бы сейчас не тыкали пальцем в сенсорный экран аппарата с 7...28-нм процессором, а сидели в пещерах, кутаясь в звериные шкуры.


            Если бы мозг человека не мог генерировать абсолютно новую информацию (ака делать правильные выводы :) — то и до пещер дело бы не дошло.


            1. cepera_ang
              27.07.2022 12:29
              +3

              Не буду закапываться в бессмысленный спор о том, что такое «абсолютно новая информация» :)


              1. R7R
                27.07.2022 13:09
                +1

                Не буду закапываться в бессмысленный спор о том, что такое «абсолютно новая информация» :)


                Так выше уже все сказано — инфа №1 (внешняя) + инфа №2 (внешняя) =инфа №3 (новая)


      1. Medeyko
        26.07.2022 17:34
        +4

        Во-первых, Dalle-2 не просто усредняет, он находит некоторые закономерности в виденном раньше, и строит на этом основании изображение.

        Во-вторых, у людей всё точно так же. Только известных образов у большинства из них в нейросетке больше, и сама нейросетка больше, так что больше закономерностей находится.

        Никаких признаков какой-то специфической человеческой художественной креативности, в принципе недоступной нейросетям, не просматривается. Уже, на мой взгляд, видно, что различия в уровне пока вызваны количественными причинами, а не качественными. «Криэйторам», конечно, обидно, а так это очень здорово.


        1. MrLoki
          26.07.2022 18:25
          +6

          Даже по примерам в статье и комментах видно, что закономерности находимые сейчас достаточно прямолинейны. И если отойти от восхищения «машина способна рисовать огого», то в целом образы идут «в лоб», без собственно, артистизма. Если робот, то он выглядит именно так как ты ожидаешь увидеть (по примерам с сёрфящим роботом видно, что вариативность красных роботов очень мала, где терминатор-коммунист в конце-концов) . Если скроллить страницу медленно, сначала читая текст запроса в сетку, а потом хотя-бы минуту пытаясь представить что она выдаст — если не в деталях, то в направлении угадываешь почти всегда. Работа с человеком гораздо неожиданнее и интереснее.

          Про то что у людей всё «точно так же», даже не интересно рассуждать ведь на этот счёт ещё нет консенсуса :) даже пресловутое наступление «сингулярности» это гипотеза, а не факт


          1. Medeyko
            26.07.2022 18:53

            Мне кажется, вы недооцениваете Dalle-2 и переоцениваете «артистизм», что бы Вы в него ни вкладывали. Увеличить вариативность образов не составляет проблемы. Просто побольше рандома добавить.

            Можно даже не перерабатывать модель, а просто в запросе перед описанием добавлять какое-нибудь случайное прилагательное или даже два. Будут вам вариабельные-вариабельные роботы.

            Можно даже поэкспериментировать, попросив Aleron75 сделать те же запросы, но с различными определениями: mysterious, cylindric, brutal, shaky, glorious, ajacent, scrupulous, magnificent, poor, broken, crazy, linear, bizzare, huromous, industrial, high-tech, simple, Soviet, unknown, artistic, creative, imaginative, Habric и т.п.


            1. MrLoki
              26.07.2022 19:00
              +5

              Камон, я со времён первых моделей рисовалок видел, как сначала говорили, что нужно больше железа, потом больше параметров, щас больше рандома и точно будут не нужны дизайнеры/художники/whatever. Проблема в том, что этого никогда не случалось, просто раньше это была совсем скучная мазня, сейчас стало красивее, но тоже скучно :)

              Возможно это эффект прототипа, но честно сказать, да, я недооцениваю dalle 2, потому что пока она не показывает ничего интересного, кроме пиара себя) Вполне возможно что её этому ещё не учили, или цель создания была в другом, посмотрим где приживётся.

              При этом, я не спорю, что dalle и подобные модели - полезны. И как тысяча примеров, каждый из которых можно взять на доработку, и как поиск образа, когда в голову не идёт и ещё куча полезных использований. Но как самостоятельный «дизайнер» — пока даже не близко.


              1. Medeyko
                26.07.2022 19:12
                +6

                Да что там рисовалок! С перцептронами та же ерунда была! Сначала сделали первые эксперименты, многообещающие. И говорили, что дальше вопрос уже количественный. А потом вдруг остановилось, наступила Зима искусственного интеллекта.

                А потом вдруг выяснилось, что таки проблема и вправду была количественная, и нейросети с большим количеством слоёв привели к реальному прорыву.

                Так что Вы не первый скептик и не последний. Это естественно. Но объективно, динамика прогресса в этой отрасли, на мой взгляд, говорит за то, что те претензии, которые Вы высказали к творчеству Dalle-2, либо уже неактуальны, либо станут неактуальны года за 2-3.

                Ну, если только мир не накроет кризис, когда станет не до креативности, особенно не до компьютерной креативности.


                1. MrLoki
                  27.07.2022 00:05
                  +6

                  Я, пока не до конца понимаю, как относиться к Dalle/Dalle-2. Это уже технология, или эксперимент, который ещё ждёт своего времени?

                  Если технология, то можете подсказать, где используется dalle/dalle2 в пользовательских сервисах (я не для укола, а чтобы понять границы применимости текущие)? Я видел недавно, как обложку Cosmopolitan сгенерировали, но даже там в самой статье пишут: This sure is a lot of human effort for an AI-generated magazine cover. My initial takeaway is that DALL-E truly is an artist’s tool—one that can’t create without the artist. Там на самом деле неплохая статья, от людей которые использовали технологию вживую. И мне кажется она скорее ближе к поинту который озвучивал я о границах применимости — это ассистент. Других «объективных» успехов я что-то не видел.

                  Если эксперимент, то результаты скорее есть, что неплохо, но поймите меня правильно, то как освещают каждую новость с Dalle/Dalle2, да и многими другими моделями (с текстом, с кодом...), вызывает скепсис чисто подачей «нейросети заменили XXX», когда примеры в самой новости выглядят, ну как, эксперимент в процессе, нежели «замена». Wishful thinking, если хотите.

                  И то что очередную итерацию моделей проводят под соусом таких заголовков — мне уже кажется тенденцией (могу быть не прав конечно, было бы интересно увидеть разбор поколений алгоритмов и причин по которым они приближают нас к решению текущих проблем) и заставляет задуматься — а в ту ли вообще сторону движется текущий подход, или для прорыва всё же нужна революция в алгоритмах, или революционный рост мощностей, чтобы раскрыть потенциал текущих алгоритмов?


                  1. Medeyko
                    27.07.2022 08:22
                    +3

                    В этом треде звучат очень разные вещи, сливаясь между собой. Давайте, я попробую отделить. Все ответы, конечно, с оговоркой «насколько я знаю/понимаю». :)

                    > Это уже технология, или эксперимент, который ещё ждёт своего времени?
                    В текущий момент продукт находится в стадии бета-тестирования. Это не эксперимент, это предрелизный этап коммерческого продукта.

                    Вероятно, после выведения продукта на рынок, появятся сведения об эксплуатантах.

                    > то как освещают каждую новость с Dalle/Dalle2… вызывает скепсис чисто подачей
                    Ну, это вопросы к журналистам. Я обсуждаю только конкретные Ваши претензии к технологии. Так то понятно, что замещение будет постепенным. Как это происходит и с переводчиками типа Google Translate/DeepL, которые уменьшили спрос на услуги переводчиков начального уровня. Но некоторые продолжают пользоваться и услугами переводчиков, результат работы которых хуже, чем у упомянутых автоматических переводчиков. А многие переводчики даже высокого уровня использую автоматизированные инструменты для экономии собственного времени. Так же и тут. В ряде случаев потребность в дизайнерах художниках уже отпадает, и последовательно будет отпадать всё больше и больше. В ряде случаев дизайнеры будут использовать эту и подобные технологии для экономии собственного времени.

                    > очередную итерацию моделей проводят под соусом таких заголовков
                    Мне кажется, всё проще. Картинки действительно осмысленные и красивые, большинство людей так не нарисуют. Поэтому они производят впечатление. На основании этого восторженного впечатления, человек может искренне делать избыточно далекоидущие выводы.

                    Конкретно Dall-e 2 выглядит технологией, готовой к выходу на рынок.
                    Если для таких целей использование будет бесплатным, то я скорее всего вполне буду её использовать для быстрого создания иллюстраций для оформления презентаций.
                    Коллеги рассматривают генерацию изображений для indie-игры для смартфона без привлечения художника.
                    «Творческость», которой, как Вам кажется, Dall-e 2 не хватает, легко управляется «творческим» подбором слов, а также «творческим» предъявлением нужных образцов. Большинство из тех, кто может какую-нибудь игру образов или интересный сюжет картины, сколько-нибудь сносно её нарисовать не могут. Да и у тех, кто может, это требует больше времени, особенно если хочется перебирать варианты.
                    Dall-e хорош тем, что создавать изображение можно последовательно. Вставлять объекты в существующую картинку, создавать на основе существующей такую же — в таком же стиле, с похожими объектами, с похожей структурой композиции — но другую!

                    Да и нужно хорошо понимать, что трансформер — это не байесовский предсказатель. Он вполне может работать и с отдалёнными ассоциациями. Как я понимаю, Open AI наоборот подкручивает параметры так, чтобы избегать неожиданных ассоциаций, чтобы не возникало ощущение того, что рисует по-настоящему творческий сумасшедший, чтобы не получить антирекламу.

                    > скучная мазня
                    Вам вот не нравится предсказуемость, а большинству-то как раз это и надо — чтобы система рисовала то, чего они хотят, а не что-то своё.
                    Система создаётся не лично под Вас, и не под суровых сибирских лесорубов из анекдота, а для массового обычного пользователя.

                    > заставляет задуматься — а в ту ли вообще сторону движется текущий подход, или для прорыва всё же нужна революция в алгоритмах, или революционный рост мощностей, чтобы раскрыть потенциал текущих алгоритмов
                    Извините, но очень странно пытаться делать это на основании того, какие заголовки используют «изнасилованные учёными журналисты». Не стОит так делать.

                    Никакого фактора, говорящего о том, что развитие технологий генеративных нейросетей движется «не в ту сторону» Вы пока не привели (ну или я не заметил — простите, коли так).

                    Непонятно таки пока, зачем Вам вообще что-то революционное. Сформулируйте, пожалуйста, ваши требования к подобной системе, и я попробую в меру своего понимания высказаться, какие из требований уже выполняются полностью, какие — частично, и каковы перспективы.
                    Наверное, так будет интереснее?


                    1. MrLoki
                      27.07.2022 14:06
                      +3

                      Ну, это вопросы к журналистам

                      Эээ, нет. Я возможно не удачно сформулировал, но эту статью, например, написал не журналист. Это именно от специалистов/интересующихся которые пишут о явлении замечается. Тоесть как раз у тех, от кого ожидаешь хотя-бы доли критического мышления.

                      Google Translate

                      О, думал что не затронем, но именно то что стало с Google Translate и превратило меня из энтузиаста в скептика. Не представляю, как им можно пользоваться, как инструментом, с тех пор, как они переехали на encoder-decoder. Если раньше это был предсказуемый инструмент, который иногда выдавал забавную буквальность в устойчивых выражениях, то сейчас чтобы он не переписал половину текста (далеко не всегда удачно), нужно таскать ему текст кусками меньше предложения, чтоб ограничить его полёт фантазии. Не говоря уж о том, что во французском он не обламывается заменять «ты» на «вы» (или наоборот), что вообще-то меняет построение предложений. И ломает согласованность предложений (часть «ты», часть «вы»). И выдаёт странные результаты с завидной регулярностью. Единственный плюс тут — масштабирование (проще закидывать языки, поскольку при помощи транзитного новое направление это всего 2 новых модели), но для пользователя я честно сказать плюсов по сравнению с 2015 годом в Google Translate не особо вижу, статистические переводчики работали хорошо и предсказуемо. У вас есть какая-то инфа чуть более детальная о том, что спрос на переводчиков начального уровня реально упал от Google Translate?

                      Это одна из причин моего defensive поведения тут. Я видел хорошие примеры применения нейросетей только в тех местах, где они решают механистическую задачу — автоматизации куска пайплайна, а не замены его целиком. Распознавание текстов в переводчике — это прекрасно. Нейросетевой переводчик — плохо. Помощник саппорта подкидывающий оператору статьи по контексту чата — прекрасно, замена саппорта — худшее изобретение нашего века которое работает только за счёт того что оно очень дешевое. Это повсеместное ухудшение уровня сервиса нейросетями конечно же придёт и в дизайн (ниже иронова притащили, ну посмотрите его работы которые как 2 капли воды похожи друг на друга, зато дешевые).

                      Вам вот не нравится предсказуемость, а большинству-то как раз это и надо — чтобы система рисовала то, чего они хотят, а не что-то своё.

                      Вы про большинство как узнали? Опрос проводили, или снимали метрики с какого-то продукта? Если метрики то какие? Мне не первый раз тут большинством тыкают, но я не вижу, что именно (вы тоже пишете что пока нету информации об этом) ждало большинство кроме собственно рисующей нейросети. Из того, что я могу предполагать — большинству всё равно каким образом нарисована картинка которую они видят. Где-то в этом месте появляется ниша для dalle. Всё остальное — неопределённость о которой можно лишь предполагать. Как вы дружно прикидываете потребности большинства от несуществующих ещё услуг — загадка.

                      Извините, но очень странно пытаться делать это на основании того, какие заголовки используют «изнасилованные учёными журналисты». Не стОит так делать.

                      Выше отвечал. «Статьи» пишут люди из индустрии. У которых отшибло критическое мышление возможностями по масштабированию и низкими запросами аудитории :)

                      Непонятно таки пока, зачем Вам вообще что-то революционное. Сформулируйте, пожалуйста, ваши требования к подобной системе, и я попробую в меру своего понимания высказаться, какие из требований уже выполняются полностью, какие — частично, и каковы перспективы.

                      Видите в чём дело, как к технологии у меня претензий к dalle нет, он уже полезен, я об этом в каждом сообщении пишу. Но у него, есть свойства, которые его ограничивают и тенденции к изменению которых не видно (даже если сравнить dalle и dalle 2, не видно чтобы они шли к замене дизайнера).

                      Если рассуждать в терминах применения dalle 2, для (цитирую вас же): человеческой художественной креативности, то есть некоторое количество нерешенных проблем:

                      1. Неуникальность. Дизайнер контролирует уникальность и пересечения образов в логотипе, например — это серьёзная проблема всегда (в айдентике, менее критично, но всё же). Если выпустить dalle в дикую природу as is, как вы думаете, сколько людей в сид введут red robot's head uhd, пытаясь придумать логотип для своей студии разработки? Посмотрите на сёрфящих роботов выше. Вот примерно так будут выглядеть эти лого у десятков студий. Решаема ли эта проблема? Наверное. Но вот сейчас так.

                      2. Прямолинейность. Если сервис продаётся сразу бренду (ваш вариант), а не дизайнеру (мой вариант), то пользователь имеет право ожидать сразу готового результата применимого без обработки. Допустим бренд-менеджер готов сам следить за уникальностью (получая работу от дизайнера он тоже должен за этим следить, допустим), но получается, что чтобы получить результат, ему придётся заниматься итерациями с сидом. Затратная ли это работа? Ну почитайте статью Cosmo, про их обложку — там пишут что на это ушло ~12 часов человеческого времени. При том, что у них уже была возможность «дорисовки», тоесть по идее можно было черри-пикать удачные части или даже набросать самому часть, чтоб направить в нужное русло. Это выглядит как профессиональный инструмент требующий тонкой настройки, а не пользовательский сервис.

                      3. Качество. Опять же. Посмотрите на сёрфящих роботов и включите хотя-бы чуть-чуть критического мышления. Часть из них сёрфят по песку, у большей части волна по отношению к берегу имеет странный ракурс, а часть не сёрфит, а скорее летает на водной струе. Посмотрите на пиксель-арт и обратите внимание на то, что это не пиксель-арт, а имитация, где пропорции и размер пикселей чаще всего не совпадают. Я уж не говорю, про то, что много анатомических, или эстетических огрехов (когда в целом неплохой вариант, например, имеет отсутствующий зрачёк, или волосы не в том месте). Если «жрать что дают», оно конечно можно выбрать перебрав сотню-другую вариантов, но вы пишете что система почти готова к коммерческой эксплуатации. Пока это выглядит скорее как сырой прототип для этой задачи.

                      Есть ли у этих проблем решение? На мой взгляд это решение — человеческое сознание, которое позволяет создавать отличающиеся от друг-друга вещи (пересечения бывают, но нередко они вызывают проблемы, поэтому это точно не норма, а случайность), высказываясь в контексте бренда/продукта, но не «в лоб», а находя интересные параллели и идеи как в визуале, так и в значении (у робота тут остаётся лишь вариант «значение» который при текстовом сиде не включает большу́ю часть контекста, а визуал робот может покрыть только количеством генерируемых вариантов) при этом контролируя качество (я сейчас не говорю о визуальных стилях, примитивизм, например, тоже уважаемый стиль, который можно интересно применять). Робот же, предлагает лишь упрощённую имитацию (и это не форма речи, посмотрите на пиксель-арт и поймите, что все остальные «стили» робота столь же несовершенны, просто их сложнее распознать, потому что они сами сложнее). А на пути к чему-то близкому к сознанию, пока даже чуть более направленные в это русло текстовые модели — не блещут. Может быть оно поменяется в будущем? Конечно! Но пока предпосылок не видно.


                      1. Jian
                        27.07.2022 14:21

                        Посмотрите на сёрфящих роботов и включите хотя-бы чуть-чуть критического мышления. Часть из них сёрфят по песку,

                        В реальной жизни такой серфинг по барханам, тоже существует.


                      1. MrLoki
                        27.07.2022 14:44
                        +1

                        Там сид: smart red robot surfing the wave


                      1. Medeyko
                        27.07.2022 18:41

                        > Я возможно не удачно сформулировал, но эту статью, например, написал не журналист.
                        Журналист-журналист! В данном случае он именно гражданский журналист. Который поставил демонстративно желтушный заголовок для привлечения большего внимания к статье. По этому заголовку не стоит делать вообще никаких содержательных выводов.

                        > Не представляю, как им можно пользоваться, как инструментом, с тех пор, как они переехали на encoder-decoder.
                        Извините, если прозвучит некорректно, но вероятно именно здесь и лежит проблема, мешающая Вам объективно воспринимать прогресс в обсуждаемой сфере. Подавляющее большинство пользователей считает, что новая технология перевода даёт значительно лучший результат, чем старая. Это я могу достоверно утверждать по той простой причине, что Гугл очень тщательно мониторит обратную связь, и если бы большинство разделяли бы Ваше восприятие, то старый вариант если бы не был возвращён, то хотя бы активно предлагался к выбору в качестве запасного.

                        И научное сообщество тоже уже сделало однозначный вывод уже в далёком 2016-м году.

                        Вы — в явном меньшинстве, поэтому если Вы хотите прикинуть, как будет идти развитие дальше, Вам стоит абстрагироваться от собственных ощущений.
                        Если написанное Вами («не представляю, как можно пользоваться») — не фигура речи, а действительное непонимание, то абстрагироваться будет очень непросто, но, на мой взгляд, без этого никуда.

                        Взял кусочек Вашего письма и перевёл Google Translate и DeepL.
                        Ни у одного не вижу здесь заявленного Вами «полёта фантазии». Возможно, у Вас речь идёт о каких-то художественных текстах, с ними пока похуже.

                        > У вас есть какая-то инфа чуть более детальная о том, что спрос на переводчиков начального уровня реально упал от Google Translate?
                        Возможно вот это Вас убедит в существовании реальной тенденции.

                        > 1. Неуникальность.
                        Это как раз не представляет проблемы на текущем уровне развития технологий. Поиграйтесь с сетками попроще, где можно ряд параметров задавать. Я думаю, и в Dall-e 2 будет возможность настраивать степень уникальности. Это совсем не сложно сделать на фоне того, что они уже сделали, а действительно в ряде случаев может быть весьма полезно.
                        > 2. Прямолинейность.… ему придётся заниматься итерациями с сидом
                        Не обязательно непосредственно с сидом. Можно уточнять в духе «отлично, а теперь сюда поставьте котёнка». С людьми то же самое.
                        Пример с Cosmo показывает, что технология применима уже даже не только для дизайна начального уровня. Речь же пока идёт об дизайне начального уровня (самом массовом, кстати говоря), как и выше шла речь об переводе начального уровня.
                        Но самое главное, вы сейчас говорите о случае, когда исполнитель лучше заказчика знает, чего ему надо. Эта задача сейчас в принципе тоже активно решается Гуглом, но Dall-e такой задачи не ставилось, её на это не тренировали, и странно от неё этого ожидать. Это не проблема технологии, это даже не проблема конкретного продукта — это просто предъявление к продукту дополнительного далеко не приоритетного требования.
                        > 3. Качество.
                        Это, на мой взгляд, пожалуй, единственное, что из перечисленного Вами действительно является проблемой технологии. Но здесь ключевое — это динамика этого качества. Видно, что артефактов становится меньше и меньше, и уже надо присматриваться, выискивая их — и если использовать не фотореалистичный стиль, то ещё поди разбери, где артефакт, а где — художественный приём. Однако Ваши конкретные претензии тоже не выглядят проблемой технологии. Про песок легко можно уточнить запрос (сид). Про пиксель-арт — использовать примитивнейший пост-процессор. Попробуйте попросить человека мега-дизайнера нарисовать пиксель-арт на бумаге без клеточек, без измерительных инструментов — думаете, у него пиксели сильно ровнее будут?

                        Что касается проблем стилей — да, у него прослеживаются проблемы, типичные для наивного искусства — т.е. когда автор не имеет художественного образования. С учётом отсутствия у Dall-e художественного образования, вряд ли это удивительно. Удивительно, скорее, обратное — что в его работах меньше ошибок такого рода, чем в работах людей без художественного образования. Вот все эти понятия о пространстве, перспективе, тенях, анатомических пропорциях, которые в классическом художественном образовании закладываются алгоритмическими методами (т.е. даже для такого мощного вычислительного комплекса, как человек, проще использовать алгоритмический подход), у Dall-e работают просто на обучении большим количеством примеров. И причём, опять же, хорошо видно, что с количественным прогрессом падает и количество таких ошибок. Можно ввести алгоритмическую доработку такого рода. Это посложнее, чем пискелизация, но это обычная не слишком сложная алгоритмическая задача, никаких технологических прорывов не требующая. Если вдруг наткнутся на какую-то стену в машинном обучении, то именно по этому пути и пойдут — алгоритмического/эвристического постпроцессинга. Да и то сказать, если возвращаться к машинному переводу, то кроме машинного перевода есть ещё и машинные корректоры. И я встречал публикацию об эксперименте, когда натравливали вторых на результат работы первых, и потом сравнивали с переводами, сделанными людьми, на простых текстах испытуемые чаще отдавали предпочтение варианту, сделанному при помощи машин.

                        Ну вот правда же, проблемы у нейросетей вполне есть, но подавляющее большинство из того, что Вы и многие другие комментаторы считаете проблемами — таковыми не являются. Совершенно не требуется приплетать сознание для того, чтобы создавать «отличающиеся от друг-друга вещи». Посмотрите на Николая Иронова — там на сайте есть ссылки на публикации с примерами его работ. К качеству есть вопросы, но то, что вещи там «отличающиеся» — несомненно. Возможно, это Вас в чём-то убедит.


                      1. MrLoki
                        27.07.2022 19:42
                        +2

                        В данном случае он именно гражданский журналист.

                        Окей, играем словами, эту ветку я предлагаю закрыть потому что вы пишете ерунду :)

                        Это я могу достоверно утверждать по той простой причине, что Гугл очень тщательно мониторит обратную связь, и если бы большинство разделяли бы Ваше восприятие, то старый вариант если бы не был возвращён

                        Да, как гугл вернул reader, закопал amp (который юзеры так любят, что несколько месяцев после запуска платных расширений для safari в топе покупок висело расширение которое убирало amp и редиректило на обычную страницу), вернул inbox и в целом замечательно порешал кучу локальных драм. Гугл делает то, что нужно гуглу. Если гуглу дешевле новая нейросеть, то она будет вместо старой, а она дешевле на порядки, поскольку позволяет запускать направления перевода с пол пинка.

                        Про статью и качество — зачёт, но всё упрощает английский. Вы работали с системами NLP? Я вот работал. Модели в которых участвует английский, всегда показывают себя заметно лучше на всех уровнях. Даже банальный парсинг русского, например, будет делаться хуже и учитывать меньше edge case. Данных которыми кормят модель тоже больше на английском. В моём случае пара ru-fr с которой не так гладко всё работает. Но окей, допустим тут это bias.

                        Про Иронова я упоминал, и если вы считаете что то что он делает как-то заметно друг от друга отличается — то в целом как вы выше написали мне: извините, если прозвучит некорректно, но вероятно именно здесь и лежит проблема, мешающая Вам объективно воспринимать прогресс в обсуждаемой сфере.

                        ---

                        BTW. Спасибо в целом за диалог местами было интересно. Если про переводчиков, я в целом и до этого понимал, что заметная часть проблем это моя специфика (набор текстов + требования + языковая пара ru-fr, а не типичная ru-en), то с рисовалками, вы меня не убедили. Много условностей, много «да это легко», но после dalle 1, я наблюдал примерно тот же энтузиазм, а воз собственно и ныне там. Посмотрим. Вы с надеждой, я со скепсисом.


                      1. Medeyko
                        27.07.2022 23:20

                        > Окей, играем словами, эту ветку я предлагаю закрыть потому что вы пишете ерунду :)
                        Ну, если уж я пишу ерунду, то страшно представить, что пишете Вы! :)

                        Это не игра словами. Топик стартер поделился с широкой аудиторией ощущениями от игрушки, которую ему дали попробовать. Это чисто журналистская деятельность. Поскольку это не профессиональная деятельность, то это — гражданская журналистика. То, что он специализируется в data science (что близко, но всё же не технология Dall-e), даёт ему некоторую компетентность, но не более того. Журналист не обязан быть некомпетентным в описываемой области.

                        По поводу Гугла: эти локальные драмы кажутся важными им участникам, но не важны для массового пользователя — на которого, собственно, и ориентируется Гугл. Я вижу здесь тот же проблемный паттерн, наличие которого у Вас я предположил (снова прошу простить, если некорректно) ранее: придаёте слишком большой вес миноритарному мнению.

                        Кроме того, Вы говорите о закрытии ненужных сервисов. С переводчиком Гугл на важном для него конкурентном рынке, с сервисом, закрывать который он не собирается. Можно же использовать NMT только на новых направлениях, а на старых — как минимум на двух приоритетных парах — en-es и en-fr, оставить SMT. И если бы оно давало лучшие результаты, его наверняка оставили бы. Вычислительных-то ресурсов SMT как раз ест меньше, так что тоже была бы экономия.

                        По поводу английского в NLP: да, конечно, с ним работа обстоит лучше. Причина, опять же, количественная. NMT, в отличие от многих других подходов, как минимум к остальным индоевропейским языкам применимы ничуть не хуже, чем английский. То есть вся разница, которую Вы видите — это не вопрос технологии, это только количественный вопрос набора данных. Скормите системе столько же ru-fr данных такого же качества, сколько и каких скормили ru-en, и получите такой же результат. По-моему, это ещё один чёткий звоночек, который должен прозвучать для Вас, что не всё, что вам кажется проблемой именно технологии, является таковой. А в реальности действительно является вполне преодолимым количественным вопросом, который просто сочли менее приоритетным, чем другие.

                        Про Иронова: да, простите, он здесь несколько раз всплывал, и я запамятовал, что Вы его тоже вскользь упоминали. Ок, давайте обсудим «мешающую мне проблему», если она подтвердится, я попробую найти пути её решения. Вот, например, ссылка на сгенерированные им логотипы на стоп-кадре. Вы правда считаете, что они все одинаковые, и что у дизайнера средней руки разнообразие кардинально выше? Вы не могли бы попробовать убедить?

                        > воз собственно и ныне там
                        Я, повторюсь, но другими словами :)
                        Воз для Вас и ныне там по той причине, что разработчики систем ИИ решают не те задачи, которые интересны Вам, а те, которые интересны большинству (и имеют, соответственно, лучшие рыночные перспективы).

                        Что касается надежды, то я как раз настороженно смотрю на прогресс закрытых систем. И для развития человечества, и для безопасности (в том числе от диктата тех или иных игроков) важно, чтобы такие вещи были свободными или хотя бы полностью открытыми.


                  1. Simonis
                    27.07.2022 10:17

                    Студия Артемия Лебедева использовала нейронку для создания материалов. Насколько я понял успешно это комерциализировала. Так что нейросети уже де-факто комерческо применимые средства. Конкретно dalle очередной шаг эволюции. Думаю уже нет смысла пытаться делить это на технология/эксперимент. Мы живём в мире где все программное обеспечение одновременно находится и в состоянии эксперимента и в состоянии продукта. Инста, твич изначально задумывались и работали не сколько по другим направлениям и в процессе сменили его. Любые масштабные сервисы имеют множество фич на а/б тестировании. Ничто не имеет конечного, финального, 'технологичного' состояния. Все подверженно изменениям. Dalle - технология не доступная широким массам.

                    Не понимаю претензии многих комментаторов по поводу однотипности и отсутствия 'художественного' видения при реализации запросов. Это особое видение никому не нужно. Если у конечно пользователя запрос на red robot то и изображение должно строго соответствовать этому. Лишние элементы будут только мешать и приводить к дополнительным циклам перерисовки по запросу. Пользователь знает что ему нужно и при необходимости будет дополнять описания для получения требуемой детализации. Но только тогда когда это действительно востребованно, а не наоборот. Это то как должен работать дизайн в современном мире. Кмк.


                    1. R7R
                      27.07.2022 12:26

                      Студия Артемия Лебедева использовала нейронку для создания материалов.


                      И где она сейчас?


                      1. Simonis
                        27.07.2022 14:54

                        Если бы вы действительно интересовались вопросом который задали то очень быстро бы нашли ответ в Гугле: https://ironov.artlebedev.com/ru/#

                        С ней все в порядке.


                      1. R7R
                        27.07.2022 15:14
                        +1

                        очень быстро бы нашли ответ в Гугле: ironov.artlebedev.com/ru/#


                        Спасибо, но вопрос был не об этом.
                        (еще лет десять назад термин «бизнес-линч» был знаком каждому уважающему себя студенту.
                        Сейчас же фраза «автор этого знака — Артемий Лебедев» уже ничего не говорит молодому поколению)

                        А началось падение как раз с Коли Иронова (Джон Федор, да :)


                      1. Refridgerator
                        28.07.2022 06:23

                        Так сам Лебедев давно уже отошёл от дел, а дизайном занимаются совсем другие люди от его имени. «Студия» же, товарный знак, а не конкретный человек.


                      1. R7R
                        28.07.2022 18:34

                        «Студия» же, товарный знак, а не конкретный человек.


                        Ок. Фраза «Студия Артема Лебедева» уже ничего не говорит молодому поколению.


                    1. MrLoki
                      27.07.2022 15:23

                      Это особое видение никому не нужно.

                      (sigh) А вы всех опросили? Меня вот забыли кажется.

                      Какой вопрос задавали? Что именно предлагали альтернативой? Плохонькие арты в лучшем случае напоминающие изначальный стиль? Тысячу одинаковых вариантов, вместо вариатива? Вы пишете:

                      Если у конечно пользователя запрос на red robot то и изображение должно строго соответствовать этому.

                      Но как можно нарисовать _строго_ соответствующее нечто, если у robot нет строгого образа по ГОСТу, а у red которое произносит пользователь, нет строгого RGB кода подразумеваемого пользователем?

                      Лишние элементы будут только мешать и приводить к дополнительным циклам перерисовки по запросу.

                      Почитайте статью Cosmopolitan, которые вживую пользовались этим. 12 часов перерисовывали _строго соответствующий_ запросу результат.

                      Пользователь знает что ему нужно и при необходимости будет дополнять описания для получения требуемой детализации

                      Тоже сильное допущение, потому что пользователь не знает что ему нужно, _если пишет_: red robot surf wave. Он имеет общее представление, а выяснить детали и создать образ — это отдельная работа, которую на данный момент робот не решает.

                      Это то как должен работать дизайн в современном мире

                      Кому должен?

                      Кмк

                      Вам кажется.


                1. Jian
                  27.07.2022 07:42
                  +1

                  С перцептронами та же ерунда была! Сначала сделали первые эксперименты, многообещающие. И говорили, что дальше вопрос уже количественный. А потом вдруг остановилось, наступила Зима искусственного интеллекта.

                  Потому что перцептероны были аппаратные, а связи и коэффициенты между нейронами устанавливались... ручками перекидыванием проводков.


                  1. Medeyko
                    27.07.2022 08:35
                    +2

                    Ну, да, но разница-то всё равно количественная! :)

                    После перцептрона и многослойные нейросети были придуманы. И даже ключевые методы работы с ними. Метод обратного распространения ошибки для многослойных нейросетей в своей основе — середина семидесятых. И веса не проводками менялись, а вполне программным образом.

                    Но реальный прорыв случился только когда оборудование позволило делать огромные сети, обучать их на огромных массивах данных, и играться огромным множеством возможных конфигураций. Но принципиально причины прорыва — количественные. Слово «огромные» в этом абзаце — ключевое.


                    1. R7R
                      27.07.2022 12:28
                      -2

                      Но реальный прорыв...


                      Реальный хайп…


                      1. Medeyko
                        27.07.2022 19:00
                        +2

                        Я прямо диву даюсь.

                        Распознавание лиц, вообще компьютерное зрение, автоматический перевод, игра в Го (и вообще закрытие вопроса со всеми подобными знаменитыми интеллектуальными играми) полностью прошли мимо Вас?

                        И даже резко выросшее качество фотографий, которые делают камеры телефонов?


                      1. R7R
                        27.07.2022 19:23

                        Я поражаюсь, ну как можно настолько игнорировать реальность?!


                        Я слежу за темой ИИ еще со времен публикаций научно-популярных статей на эту тему в журнале Знание-Сила (это начало 70х).

                        Тема идет волнами, то всплывая наверх, то затихая.
                        Причем перечень направлений практически не меняется — распознавание изображений, перевод, игры (раньше были шахматы, теперь Го :)
                        Я помню фильм «Кто за стеной?» (1977), актуальный и сейчас.
                        Помню статьи о Элизе (ELIZA) и ее диалоги, поразительно похожие на диалоги LaMDA — это была хайповая тема и в 60х и в начале 80х.

                        И даже резко выросшее качество фотографий, которые делают камеры телефонов?


                        О, кстати — как отключить эту функцию в айфонах, стабильно портящую все портретные снимки подряд? :)


                      1. Medeyko
                        27.07.2022 20:05
                        +1

                        Оно, разумеется, идёт волнами, но какое это имеет отношение к тому, что мы обсуждаем?!

                        То, что Вы активно следите, возможно, и сыграло с Вами злую шутку, сформировав завышенные ожидания, которые всё никак не реализуются. Причём даже как-то очень непонятно завышенные, если для Вас системы на ИНС до сих пор не превзошли человека в игре в го.

                        Тогда были первые эксперименты, сейчас — уже состоявшееся практическое использование, активно расширяющееся.
                        Не видеть этого и называть всё «реальным хайпом» — ну, извините. Не буду Вам мешать.


                      1. R7R
                        28.07.2022 18:44

                        Оно, разумеется, идёт волнами, но какое это имеет отношение к тому, что мы обсуждаем?!


                        К тому, что сейчас идет очередная волна.

                        сформировав завышенные ожидания, которые всё никак не реализуются.


                        Есть целый ряд таких ожиданий, заложенных еще в детстве — мирный термояд, космонавтика, искусственный интеллект и прочее.

                        ИИ — только одна волна из многих.

                        уже состоявшееся практическое использование


                        Да, на уровне сабжа этой статьи.
                        (Марк Твен мечтал об автоматическом текстовом редакторе (механическом) и даже слегка разорился на опытных образцах. Прошло 150 лет, но ИИ все еще не способен автоматически форматировать текстовые документы по заданным параметрам (стандартам))
                        А ведь казалось бы — база есть, остались мелочи.


                      1. Medeyko
                        28.07.2022 19:03

                        К тому, что сейчас идет очередная волна.

                        Волна, вероятно, идёт, но это не имеет ни малейшего отношения к тому, что мы обсуждаем. (И уж точно никак ему не противоречит — если уж натягивать связь на глобус, то получится скорее напротив — с учётом того, что достигнутые на прошлых пиках практические результаты не переставали использоваться в ходе прошлых «зим» понятно, что перечисленнное мной практическое использование уже никуда не денется.)

                        Есть целый ряд таких ожиданий, заложенных еще в детстве

                        Я боюсь, что с такими ожиданиями каши не сваришь. Детские мечты они такие — часто нереализуемые в принципе. Лучше формулировать конкретные требования, и потом анализировать динамику приближения к ним тех или иных подходов и решений.

                        Да, на уровне сабжа этой статьи.

                        Это какая-то абстракция. Что за уровень, что из него следует… Одна сплошная субъективщина! Я же выше написал вполне предметно, указал не исследовательские, а вполне практические рынки. Признайте для себя хотя бы то, что в игре в шахматы GAN'ы человека превзошли…


                      1. R7R
                        28.07.2022 20:27
                        +1

                        Волна, вероятно, идёт,


                        Волна, очевидно, идет.
                        (сколько их уже было в ИТ за последние тридцать лет — можно целую историю написать, начав со слова «мультимедиа» :)

                        что перечисленнное мной практическое использование уже никуда не денется


                        Я на всякий случай глянул ваше предыдущее сообщение — нет, я не ошибся, вы упомянули только игру в Го (одна из игр, основанная на переборе вариантов, в которых человек пасует перед мощью вычислительных систем)
                        Чуть раньше вы упомянули распознавание лиц (функцию, которую человек осваивает в первые месяцы жизни), и перевод (вот его было бы лучше совсем не упоминать, в силу того бреда, что выдается при переводе живой, не адаптированной речи :) Кстати, с распознаванием отсканированного текста дела немногим лучше, так как программы распознавания абсолютно не понимают смысла ни речи, ни текста (что в первую очередь и требовалось от ИИ).

                        Я боюсь, что с такими ожиданиями каши не сваришь.


                        Напомню, что речь идет о хайпе.

                        Лучше формулировать конкретные требования, и потом анализировать динамику приближения к ним тех или иных подходов и решений.


                        Где-то в конце 50х в ТМ был опубликован первый шутливый НФ-рассказ о роботакси.
                        И вроде как есть динамика приближения (ладно, 70 лет — не срок :), но, один нюанс — руки водителя таки должны быть на руле :)

                        Это какая-то абстракция. Что за уровень, что из него следует…


                        ИИ научился смешивать и комбинировать образы, созданные не им самим (что с успехом может сделать любой халтурщик, умеющий рисовать и зарабатывать на этом деньги)
                        И опять же, хайп по этому поводу…
                        Только получается тот же калейдоскоп, потому как даже халтурщик вкладывает в свои работы какой-то смысл.

                        Признайте для себя хотя бы то, что в игре в шахматы GAN'ы человека превзошли


                        Это достижение 1997 года, из прошлой волны :)
                        Игра, основанная на переборе вариантов, и компьютер справляется с этим перебором быстрее человека. ИИ тут вообще не в тему.


                      1. cepera_ang
                        28.07.2022 20:54

                        Го (одна из игр, основанная на переборе вариантов, в которых человек пасует перед мощью вычислительных систем)

                        Го же как раз такая игра, в которой должен был пасовать перебор вариантов перед мощью человеческого разума. Ещё буквально шесть лет назад это было непреложной истиной и требовало как минимум десятка лет развития ИИ, чтобы сравняться хотя бы с обычным игроком. А потом в один миг ИИ победил и задача стала «просто неинтересным перебором вариантов».


                        Следом был непобедимый покер. «Как же компьютер будет выигрывать в игру без полной информации, не бывать этому никогда».


                        Сейчас перевод недостаточно художественный, ага. Не может сравниться с пересказом человека, который не просто переводит, а пересказывает как ему кажется правильным с учётом понимания того, чего не будет знать носитель целевого языка и ориентируясь на конкретную аудиторию. И ах, его можно запутать, если правильно конструировать двусмысленные предложения.


                        И текст оказывается не распознаётся и субтитры наверное из аудио не генерируются на самом и вообще, ерунда, что эти технологии закрывают 95% кейсов, ведь 5% показывают полный мрак и куда им с таким количеством ошибок в калашный ряд.


                      1. R7R
                        28.07.2022 21:32
                        +1

                        Го же как раз такая игра, в которой должен был пасовать перебор вариантов перед мощью человеческого разума.


                        Гм, вам приходилось играть в Го? :)
                        Там, по сути, точно такой же принцип, как в крестиках-ноликах, только число вариантов намного-намного больше.

                        Ещё буквально шесть лет назад это было непреложной истиной


                        Да, я я в курсе того хайпа, который был в СССР вокруг этой игры :)
                        Промышленность СССР даже наладила выпуск отечественных наборов для Го (доски и наборы фишек), один из которых лежит сейчас у меня дома.
                        Хотя, несмотря на волну, поднятую научно-популярными журналами вокруг этой игры — найти партнера было крайне тяжело — старшее поколение предпочитала клетчатые доски и домино, младшее — намного динамичное «реверси».

                        Следом был непобедимый покер.


                        Никогда не встречал людей, всерьез игравших в покер с машиной (хотя программ таких была масса, включая и эротические).
                        Там весь смысл игры в игре с живыми людьми.

                        А потом в один миг ИИ победил


                        Так память у компьютера хорошая, почему бы нет :)

                        (мы в колхозе во время сельхозработ, от полного безделья играли в «дурака» двое на двое.
                        Итоговый результат полностью подтвердил точность изучаемого тогда нами теорвера — 49/51 на сто партий. Т.е. при правильной карточной игре все упирается в вульгарную статистику :)

                        Сейчас перевод недостаточно художественный, ага.


                        Не, он просто бредовый, так как ИИ-переводчик не понимает контекст… если бы, он даже слова не распознает правильно, четко произнесенные в микрофон…

                        И ах, его можно запутать, если правильно конструировать двусмысленные предложения.


                        Вы это рассказываете человеку, который ежедневно использует голосовой переводчик (от MS) для общения с людьми :)

                        И текст оказывается не распознаётся и субтитры наверное из аудио не генерируются


                        А с субтитрами точно такая же история, что и с переводом (было бы странно, если бы было иначе :)

                        Ну и Файнридер, платный и дорогой, при распознавании текста, качественно напечатанного на хорошем и правильно заправленном принтере, при сканировании через дорогущий документ сканер — уже который год и версию — тупо продолжает распознавать число 30 как ЗО («нет такого слова!» (с) — но для хваленого ИИ оно таки есть :)

                        ерунда, что эти технологии закрывают 95% кейсов


                        Да, читаешь документы и впадаешь в шок и трепет от того бреда (ошибки перевода и распознавания), что становится все более и более массовым.


                      1. Medeyko
                        28.07.2022 22:51

                        Волна, очевидно, идет.

                        Далась Вам это волна! :) Ну, возможно, идёт себе и идёт, это не имеет ни малейшего значения, когда мы обсуждаем, есть ли что-нибудь ещё, кроме хайпа.

                        Я на всякий случай глянул ваше предыдущее сообщение — нет, я не ошибся, вы упомянули только игру в Го

                        Вот моя ключевая реплика:
                        Распознавание лиц, вообще компьютерное зрение, автоматический перевод, игра в Го (и вообще закрытие вопроса со всеми подобными знаменитыми интеллектуальными играми) полностью прошли мимо Вас?

                        (Чтобы было понятнее: шахматы и шашки тоже входят в число «подобных знаменитых игр».)

                        Чуть раньше вы упомянули распознавание лиц (функцию, которую человек осваивает в первые месяцы жизни), и перевод (вот его было бы лучше совсем не упоминать, в силу того бреда, что выдается при переводе живой, не адаптированной речи :)

                        Вы опять от важных фактов уходите в свою субъективную оценку, которая не имеет существенного значения. Для практического использования не имеет значения, как именно прогрессирует процесс у человеческих детей и как вы оцениваете качество результата. Есть объективные факты 1) о том, что указанные технологии широко представлены на обычном массовом рынке, и количество сумевших удовлетворительно решить с их помощью свою задачу огромно. 2) качество работы систем 60-х было недостаточно высоко для удовлетворения подавляющего большинства клиентов.

                        не понимают смысла ни речи, ни текста (что в первую очередь и требовалось от ИИ)

                        Этого никогда не требовалось, не требуется и я уверен. что и не будет требоваться в первую или даже во вторую очередь. «Понимание смысла» — это такой философский вопрос, интересный, любопытный, но в целом далеко не ключевой. В научной среде нет даже универсального консенсусного понимания, что такое понимание (pun intended). Так что вся эта философия идёт своим чередом, а развитие систем искусственного интеллекта — своим. Пользователям нужно решение интеллектуальных проблем на удовлетворяющем их уровне. Выше уровень — больше таких пользователей.

                        От OCR потребителям не понимание нужно, а перевода изображения текста в текстовый формат. Что OCR довольно неплохо давно и делают — так, что потребители активно пользуются этим инструментом в своей жизни.

                        Напомню, что речь идет о хайпе.

                        Нет, речь идёт не о хайпе, а о Вашем ошибочном утверждении, будто кроме хайпа ничего нет. Это принципиальная разница.

                        ИИ научился смешивать и комбинировать образы, созданные не им самим (что с успехом может сделать любой халтурщик, умеющий рисовать и зарабатывать на этом деньги)

                        Ну, т.е. Вы сами понимаете, что ИИ научился делать то, что раньше могли только люди, и причём эта задача («халтура» по-Вашему) пользуется определённым спросом, раз людям за это платили деньги. Dall-e 2 пока на рынок не вышел, а вот про MidJourney мне вполне известно, что сгенерированное им потом используют, выдавая за человеческое творчество (кто-то пассивно путём умолчания, кто-то активно обманывая) и успешно зарабатывают на этом деньги.

                        То есть объективно даже плоды этой не перечисленной мною тогда технологии уже вполне конкурентоспособны на человеческом рынке.

                        Игра, основанная на переборе вариантов, и компьютер справляется с этим перебором быстрее человека. ИИ тут вообще не в тему.

                        Но ведь эта фраза в очередной раз не имеет ни малейшего отношения к моей! (Кроме того, они обе про компьютерные шахматы.) Никаких GAN в 1997 ещё не было. Их гипотетические предтечи точно не играли в шахматы. Игра GAN в шахматы (именно игра, а не обучение) основана не на переборе, а на паттернах. К сфере ИИ традиционно относят и переборно-эвристичекие подходы к игре в интеллектуальные игры, но уж GAN-то не отнести к ИИ — это совсем удивительно.

                        В общем, Вы не последовали даже этому призыву:
                        Признайте для себя хотя бы то, что в игре в шахматы GAN'ы человека превзошли


                        При таком раскладе дискуссия получается слишком затратной и малопродуктивной. Что ж. Ну, извините. Теперь точно не буду Вам больше мешать. :)


                      1. Jian
                        28.07.2022 07:15
                        +1

                        это была хайповая тема и в 60х и в начале 80х

                        Эта тема в 60е годы и сейчас по практическому применению отличается как "хайповый" самолёт братьев Райт от современной авиации.


                      1. R7R
                        28.07.2022 18:48

                        Эта тема в 60е годы и сейчас по практическому применению отличается как «хайповый» самолёт братьев Райт от современной авиации.


                        Увы, по этой аналогии мы сейчас на уровне самолета Bleriot XI


            1. engine9
              27.07.2022 00:29
              +1

              Предлагаю провести опыт, взять готовые арты с высокой "креативностью", описать сюжет текстом и скормить нейросети. Если кто-то будет делать такой опыт, попрошу выбрать одну картинку нашего иллюстратора Ивана Билибина.


          1. Ndochp
            26.07.2022 19:48

            Вы читали здесь текст про картинки к книжке про девочку тестировщицу? вот там был именно заказ на эту конкретную девочку и ситуации. И такого запроса наверное много больше в коммерческом плане, чем на крышеснос и огого.
            https://habr.com/ru/post/663328/


            Вот интересно, насколько Dalle может выполнять такие запросы, то есть фиксировать героя и ставить в разные ситуации.


            1. MrLoki
              27.07.2022 00:13
              +1

              Вот да, я бы для начала сгенерировал для той же книжки при помощи dalle набор 10-15 рисунков в одном стиле с запрошеными ситуациями, а потом говорил, что она лучше чем человек для данных задач :) а потом не брался бы оценивать рынки каких задач больше, или меньше не имея цифр. То что dalle найдёт свою нишу несомненно, то что это не будет замена дизайнера - тоже.


              1. Ndochp
                27.07.2022 20:55

                а потом не брался бы оценивать рынки каких задач больше, или меньше не имея цифр

                Задача "сделать прям свое вау! прям такое, чтобы непохоже на всех и за душу брало" — это задача художника из галереи.
                Задача дизайнера — сделать чтобы максимальной аудитории понравилось и максимальным тиражом продалось. Это не обязано включать артистизм, но должно быть в достаточной мере предсказуемо. (была хорошая статья про нейросетку, угадывающую хиты до того как они успеют понравиться — передача из этих хитов на радио провалилась. Их было слишком много подряд, не достаточная предсказуемость напрягала. Когда стали ставить "предсказанные" песни в ротацию по одной, среди давно крутящихся песен — оценка нейросети сошлась с оценкой слушателей)
                Вы уверены, что цифры рынка нужно прям сильно исследовать для этих двух категорий?


          1. Szczesnowicz
            26.07.2022 20:11
            +4

            Дай пять, бро! Нейросетка еще долго на сможет нарисовать в качестве робота оживший памятник Ленину по запросу "красный робот" и соответсвенно робота с какими-то биологической-деревянными компонентами в контексте "зеленый робот". Вот в этом промежутке и будут хреначить человеческие художники. Если их творения тут же будут скармливаться сетке - чтож, теперь мы знаем зачем изобрели NFT


            1. Jian
              27.07.2022 07:47

              Нейросетка еще долго не сможет нарисовать в качестве робота оживший памятник Ленину по запросу "красный робот" и соответсвенно робота с какими-то биологической-деревянными компонентами в контексте "зеленый робот"

              А давайте, просто, проверим: @Aleron75 "animated robotic Lenin's statue" и "green robotic tree".


              1. Wesha
                27.07.2022 07:52
                +1

                ЛОВИТЕ НЕЙРОСЕТКУ!!!

                на самом деле

                предыдущий оратор, когда говорил "красный робот", имел в виду "коммунистический робот", а "зелёный робот" — "нежный к природе робот". Естественно, вторичные смыслы в словах "красный" и "зелёный" нейросетка не видит.


                1. cepera_ang
                  27.07.2022 07:56
                  +3

                  Это называется чтение мыслей. Как должен даже человек без контекста об этом догадаться? «А я под словами красный имел в виду раскалённый, ну что непонятного? А я коммунистический. А я имел виду красивый.»


                  Речь же не о том, чтобы эта конкретная нейронка понимала все возможные лингвистические значения, а чтобы генерировать все возможные изображения из тех запросов, которые ей можно объяснить.


                  1. R7R
                    27.07.2022 12:33

                    Это называется чтение мыслей. Как должен даже человек без контекста об этом догадаться? «А я под словами красный имел в виду раскалённый, ну что непонятного? А я коммунистический. А я имел виду красивый.»


                    Еще СССР.
                    Человек стоящий на остановке трамвая, вглядываясь в даль трамвайных путей с раздражением восклицает:
                    «Ну где же эта красная сволочь!»
                    — все люди, стоящие рядом, тут же понимают эту фразу в обоих смыслах :)

                    (трамваи в городе, были выкрашены, естественно, в красный цвет :)


                1. R7R
                  27.07.2022 12:30

                  на самом деле


                  На самом деле и слово «робот» имеет несколько значений, но сетка знает только самое попсовое…


                  1. cepera_ang
                    27.07.2022 12:32
                    +2

                    Да, на самом деле под красным роботом очевидно понимается горящий красным светофор в Южной Африке.


                    1. R7R
                      27.07.2022 12:37
                      +2

                      Да, на самом деле под красным роботом очевидно понимается горящий красным светофор в Южной Африке.


                      image


                1. Szczesnowicz
                  27.07.2022 13:50

                  совершенно верно, нейросетка еще долго не будет видеть по запросу "красный робот"

                  красивого робота,

                  робота в бане,

                  робота, который в гневе,

                  робота - индейца (о да! - вождь краснокожих),

                  робота, внутри которого короткое замыкание и он того гляди взорвется

                  робота с Марса

                  кстати, можно же и от обратного пойти - "что-то красное, поэтому робот" к примеру глава компартии Китая ведет себя подозрительно спокойно.

                  Вот так я, не напрягаясь, придумал 6 вариантов помимо коммуниста. Двадцать человек придумают сто вариантов. Пятеро наркоманов придумает 2000 вариантов, причем в половине случаев какой-то смысл будет. Если нейросетке скормят всевозможные смыслы, которые породили человеки, она начнет выдавать нерелевантный результаты.

                  В итоге люди-художники будут поражать смыслы, я так понимаю.


            1. cepera_ang
              27.07.2022 07:49
              +5

              А человек сможет догадаться нарисовать по запросу «красный робот» оживший памятник ленину? Или ему тоже надо будет намекнуть на это дело как-то? Но если намекнуть, то и нейронка нарисует.


              1. Jian
                27.07.2022 13:32
                +1

                человек сможет догадаться нарисовать по запросу «красный робот» оживший памятник ленину?

                А если, человек республиканец, и красный это для него цвет республиканской партии, и он хотел увидеть вовсе не Ленина, а техасца в ковбойской шляпе с миниганом?


            1. Medeyko
              27.07.2022 09:55
              +3

              Человека-дизайнера, который по простому и чёткому заданию «нарисовать красного робота» будет молча рисовать Ленина-киборга (прозрачного цвета в форме котёнка, не иначе), в большинстве мест выставят за дверь, а может и в психушку сдадут… Ну, по крайней мере, размышления в эту сторону будут.


      1. maeris
        27.07.2022 13:28

        Второй "Кот + человек" и вовсе Кнорозов с его котом.


      1. leventov
        27.07.2022 22:11
        +3

        А вы думаете, что человеческая креативность - это что-то другое?


        1. MrLoki
          27.07.2022 23:04

          Конечно что-то другое, откуда эта тяга всё упрощать.


          1. leventov
            28.07.2022 10:30
            +1

            Из бритвы Оккама


          1. Medeyko
            28.07.2022 23:07

            Вот тоже хотел Вам ещё вчера написать про бритву Оккама, но отвлёкся, а потом забыл.

            Этот принцип гласит: «не следует привлекать новые сущности без крайней на то необходимости».

            У Вас для уверенного утверждения «конечно что-то другое» нет никаких оснований. У вас есть только Ваше ощущение, которое точнее было бы передать «мне кажется, что скорее всё же что-то другое».

            Динамика расширения диапазона решения ИНС творческих задач, и в особенности то, что этот расширение связано не с какими-то фундаментальными открытиями, а носит в основном количественную природу, даёт серьёзные основания предполагать, что существо креативности у людей и ИНС одинаковое, и с увеличением доступных ИНС ресурсов преимущества людей в решении задач, требующих креативности, будет неуклонно уменьшаться.


            1. MrLoki
              29.07.2022 00:02

              Вы бритвой оккама отсекаете голову. Принцип научного скептицизма вам не знаком наверное? И то что бремя доказательства лежит на утверждающем? И то что сомнение - ключ к прогрессу? Вы аргументируете абсолютно религиозно, вообще не подвергая сомнению то что вы хотите видеть. Это понимаемая точка зрения, но вы банально не приближаетесь с таким подходом к истине. В отличии от постоянного сомнения и поиска. В то время как в сообществе все ещё идут дискуссии о природе креативности и мозга, вы религиозным абсолютно образом решили что ответы уже найдены. Я раз за разом пишу, что вижу пользу которая ограничена, что никаких доказательств того что суть креативности уже найдена или тем более вычислима вообще не найдено (то же Сундар Пичаи в 21м высказывался, afaik), но вы верите что оно так. Не сомневаетесь, не ищите - верите. Я потому и свернул с вами дискуссию, что не знаю как с религиозными людьми общаться.


              1. Medeyko
                29.07.2022 01:44

                После предположения Вами в такой оскорбительной форме, что я не знаю принципа научного скептицизма, про бремя утверждающего и про сомнения, я в не вижу никаких позитивных перспектив дискуссий с Вами в принципе.

                Это Вы демонстрируете некомпетентность в области нейронных сетей («Любой из предложенных Dalle вариантов, это поиск в уже известных образах и усреднение с долей рандома»), непонимание того, что именно является сложным для них, а что не очень. Да и понятно, что если Вы просите дать статьи о принципах («А есть что-то быть может тут же на хабре или рядом почитать про детали и принципы работы таких нейронок?»), то Вы этих принципов не знаете.

                Но незнание не мешает Вам делать необоснованные безапелляционные утверждения («конечно что-то другое», «не показывает ничего интересного, кроме пиара себя» «человеческое сознание, которое позволяет создавать отличающиеся от друг-друга вещи») именно что в религиозном духе (точно в таком же формате верующие утверждают, что у человека есть душа, которой не может быть у других животных, что свойства человека имеют другую природу, чем свойства технических систем и животных кроме человека).

                В то время как я-то выразился как раз аккуратно, в научном духе («признаков… не просматривается.», «на мой взгляд, видно», «динамика прогресса… на мой взгляд, говорит за то», «динамика… даёт серьёзные основания предполагать»).

                Простите, но Вы приписываете мне свои грехи.

                Предлагаю Вам поразмыслить над этим. Но уже без меня. Adios!


      1. Alexey2005
        27.07.2022 22:35
        +2

        Любой из предложенных Dalle вариантов, это поиск в уже известных образах и усреднение с долей рандома
        Вовсе нет. Задача генерации, которую решают такие нейронки — это не интерполяционная задача. Такие нейронки занимаются экстраполяцией за пределы обучающей выборки (и именно это и есть креативность).
        Можете воспринимать такую нейронку как поисковик по «вавилонской библиотеке» — она способна сгенерировать абсолютно любое теоретически возможное сочетание пикселей при правильном подборе параметров (запрос, температура, seed и т.д.).


        1. MrLoki
          27.07.2022 22:43

          А есть что-то быть может тут же на хабре или рядом почитать про детали и принципы работы таких нейронок?


      1. alextrof94
        28.07.2022 22:16

        Этот комментарий написан на сайте с типичным дизайном, в типичном поле ввода комментария с типичными кнопками.

        По настоящему креативных людей - единицы. Не единицы на тысячу, не на миллион. На всех людей на планете, по настоящему креативных единицы.

        Рисование умерло с того момента, когда краски и кисти смогло себе позволить большинство. Теперь это бесконечное повторение одного и того же в разных стилях.

        И так во всём, вплоть до науки.

        Только, в отличии от людей, нейросетка (пока только) рисует во много раз быстрее. Хотя читал, что сейчас и в химии нейросети применяются и даже что-то открывает новое.


      1. ScreamPassion
        29.07.2022 00:29

        99% дизайнеров этим и занимаются, но да, заменить тех реальных профессионалов которые достают образы из будущего безусловно никто не сможет.


  1. MAXH0
    26.07.2022 13:03
    +16

    Главное чтобы не выяснилось, что это, пока, прототип, а рисуют 100500 индусов за еду.
    А , с другой стороны, так даже спокойнее.


    1. Aleron75 Автор
      26.07.2022 15:02
      +8

      Это должны быть очень заряженные индусы, чтобы по 4 пикчу в пару секунд с разными дизайном генерить.


  1. s_f1
    26.07.2022 13:11
    +5

    ИИ не справился с парсингом явно заданной в кавычках строки (на первой же картинке)?
    Понимаю. Скайнет откладывается.


    1. Medeyko
      26.07.2022 17:38
      +3

      Я бы на Вашем месте как раз наоборот боялся бы. Ведь гипотетическая проблема «Скайнета» не в том, что он будет умный, а в том, что он будет делать то, чего большинству из нас совсем не хочется!

      Соответственно, не хотелось бы, чтобы он не справился с пониманием, и из-за этого стал бы массово убивать.


    1. Kaputmaher
      26.07.2022 20:19

      Просто Dalle*2 хуже генерит текст и типографику по сравнению с Imagen.


    1. Alexey2005
      26.07.2022 22:32
      +9

      Скайнет уже давно здесь и активно наступает по всем фронтам.
      Нейронки внедряются всё более массово и начинают выносить людям приговоры, которые практически невозможно оспорить или даже хотя бы узнать причину. Видеохостинги без объяснения причин банят видео и даже аккаунты целиком, соцсети в автоматическом режиме ранжируют посты и тоже выписывают баны. Сторы сносят ваши продукты за нарушение правил, при этом даже не объясняют, в чём заключалось это самое нарушение (и в принципе не могут объяснить, ибо решение принимает нейронка, а это такая вещь в себе).
      Платёжные системы вообще могут в любой момент заблокировать все ваши средства, и у вас даже не будет возможности узнать причины этой блокировки (поскольку её не знает даже сам банк. Не могут же они так прямо и написать, мол нейронка почему-то вас сочла недобросовестным клиентом).
      Человек уже сейчас старательно выстраивает систему, когда вердикт тупейшего ИИ является окончательным, не подлежит обжалованию и считается непреложной истиной. Осталось только дождаться, когда все эти системы состыкуют в единую сеть, введя единый социальный рейтинг (который, естественно, будет выставляться нейронкой без права апелляции и даже без объяснения причины, по которой с вас сняли баллы). Ну и решения о начале войны чтоб тоже нейронки принимали путём обработки поступающей в них развединформации.


      1. R7R
        27.07.2022 01:50

        Платёжные системы вообще могут в любой момент заблокировать все ваши средства, и у вас даже не будет возможности узнать причины этой блокировки (поскольку её не знает даже сам банк. Не могут же они так прямо и написать, мол нейронка почему-то вас сочла недобросовестным клиентом).


        Чаще происходит наоборот: система чем-то там щелкает, анализирует и пытается тихой сапой повысить кредитный лимит, хотя ее никто об этом не просит.


      1. Gordon01
        27.07.2022 11:39

        Ну и решения о начале войны чтоб тоже нейронки принимали путём обработки поступающей в них развединформации.

        Хорошо что есть люди, которые могут нанести превентивный удар по позициям)


    1. leventov
      27.07.2022 22:21
      +1

      Ну да, ну да. https://parti.research.google/:


  1. eggstream
    26.07.2022 13:16
    +1

    Интересно, насколько он глубоко в теме попкультуры.
    Можно попросить его нарисовать что-то вроде
    Aarakocra warrior with sandworm tooth crysknife and severed Medusa's head


    1. Aleron75 Автор
      26.07.2022 13:22
      +5

      Aarakocra warrior with sandworm tooth crysknife and severed Medusa's head, digital art
      Aarakocra warrior with sandworm tooth crysknife and severed Medusa's head, digital art

      Кажется, Dalle-2 шарит за это лучше чам я даже. Классно вышло!


      1. steanlab
        26.07.2022 13:26
        +1

        Логичный вопрос возникает, а как оно тогда видит Shai Hulud sandworm of Arrakis


        1. Aleron75 Автор
          26.07.2022 13:36
          +10

          Немного добавил фантазии от себя =)

          Shai Hulud sandworm of Arrakis and transformer chimera, digital art
          Shai Hulud sandworm of Arrakis and transformer chimera, digital art


          1. dlinyj
            26.07.2022 13:48
            +3

            Можно хоть один фул сюда?


            1. tsp1000
              26.07.2022 15:41
              +8

              держите апскейл


              1. Yuriy_krd
                26.07.2022 17:22
                +3

                шикарно!


              1. Medeyko
                26.07.2022 17:41

                Реально круто! А если сделать апскейл апскейла апскейла?

                Кажется, это тот случай, когда Секретные материалы могут ВНЕЗАПНО стать реальностью :)))


                1. tvr
                  26.07.2022 17:47
                  +8

                  CSI

                  image


              1. avdosev
                27.07.2022 12:00

                а через что делали апскейл?


          1. Filipp42
            26.07.2022 15:53
            +4

            А что будет если ввести:

            1) two trees of valnor

            2) feanor create the silmarills

            3) Morgoth and Fingolfin fight


            1. Aleron75 Автор
              26.07.2022 22:33
              +2

              Прости, вместил все три в один запрос. Вышло ништяково.

              Two trees of valnor, feanor create the silmarills, Morgoth and Fingolfin fight, digital art
              Two trees of valnor, feanor create the silmarills, Morgoth and Fingolfin fight, digital art


              1. Filipp42
                26.07.2022 22:42
                +1

                А если отдельно? Но вышло действительно неплохо, сеть даже учла, что одно древо серебряное, а другое золотое. Но всё же интересно посмотреть и другие примеры.

                Спасибо!


          1. Deosis
            27.07.2022 07:50
            +1

            Выглядит круто, но похоже сеть зацепилать за sandworm и генерирует червяков или змей.


        1. Alexey2005
          26.07.2022 22:44

          результат



          1. vassabi
            27.07.2022 02:49
            +4

            не хватает интеллекта

            то есть вам сеточка за пару минут рисует приличный набросок по описанию, а вы "не ... не хватает ей интеллекта" ?


      1. iig
        28.07.2022 09:01
        +1

        smart red robot surfing the wave, a Second Before Awakening, Vasya Lozhkin style.

        Пазяста :)


        1. artemerschow
          28.07.2022 14:02
          +2

          midjourney такое выдала


          1. iig
            28.07.2022 14:38

            Ни Second Before Awakening ни Vasya Lozhkin не просматривается, жаль :\ Хотя в 1 картинке что-то есть :)


          1. Aleron75 Автор
            28.07.2022 16:16
            +1

            Красиво, но слабовато =) Результаты Dalle-2 мне нравятся больше)


            1. artemerschow
              28.07.2022 16:21

              Балуюсь тем, что доступно :)


  1. MUTbKA98
    26.07.2022 13:24
    +1

    А почему кото-роботы и кото-субмарины временами совпадают, судя по всему, попиксельно? Это точно генератор, а не лазутчик в большую базу данных?


    1. nebularia
      26.07.2022 13:32

      Думаю, автор поста перепутал картинки и вторая картинка с роботами должна была быть другой


      1. Aleron75 Автор
        26.07.2022 14:37

        Спасибо, исправил


  1. ProstoTyoma
    26.07.2022 13:28
    -2

    Мне кажется, всё это довольно вторично и если захочется чего-то совсем нового, то дизайнеры опять станут нужны. Но в меньшем количестве.


    1. R7R
      26.07.2022 13:31
      -1

      Мне кажется, всё это довольно вторично


      Да, и именно поэтому очень быстро надоест.


      1. sim31r
        26.07.2022 17:32

        Так и дизайнеры тоже "надоедают", не будешь же сутками картины смотреть.


        1. R7R
          26.07.2022 17:55
          +1

          Так и дизайнеры тоже «надоедают»,


          Лет двадцать с хвостиком назад, когда пошли косяком новые иномарки, у людей возникла проблема выбора.
          Тогда один из автоменеджеров дал мне точную примету — чем более яркий дизайн у нового авто, тем скорее он надоест людям и дал прогноз на будущее — что конкретно уйдет и что останется и через пять лет.
          Он угадал точно — свою машину я продал через 10 лет с полпинка :)


          1. Areso
            26.07.2022 19:02
            +1

            Т.е. условный Порш-бокстер 99 г.в. сегодня не продать?


            1. R7R
              26.07.2022 19:31

              Т.е. условный Порш-бокстер 99 г.в. сегодня не продать?


              Я не помню проблемы с выбором порша у людей 20 с хвостиком лет назад.


              1. Areso
                26.07.2022 19:47
                +1

                А какие машины 99-03 гв с ярким дизайном, которые покупались тогда, сегодня не продать?


                1. R7R
                  26.07.2022 20:52

                  А какие машины 99-03 гв с ярким дизайном, которые покупались тогда, сегодня не продать?


                  А кто их теперь помнит?
                  А те древние скучные пассаты и короллы все еще в ходу.


                  1. Areso
                    27.07.2022 11:57

                    Ну, хз, мне кажется это очень субъективное мнение.

                    К примеру, когда я вижу Селику тех годов, я каждый раз вспоминаю, как хотел в ней прокатиться в юношестве.


                    1. R7R
                      27.07.2022 12:40

                      Заголовок спойлера

                      image


  1. steanlab
    26.07.2022 13:31
    +1

    А можно такой вот запрос попробовать -> Blue pixel frog sitting in front of computer, digital art, pixel art


    1. Aleron75 Автор
      26.07.2022 13:33
      +21

      Ооо, тут получается годнота =)

      Blue pixel frog sitting in front of computer, digital art, pixel art
      Blue pixel frog sitting in front of computer, digital art, pixel art


      1. steanlab
        26.07.2022 13:34
        +3

        Первая очень хорошенькая, «как надо» ::)


      1. Starche
        26.07.2022 17:54
        +9

        Великолепно. Спасибо, забрал первую на аватарку


  1. Fil
    26.07.2022 13:40
    +56

    Seven red straight lines perpendicular to each other, two red, two green, three transparent and one in the shape of a kitten


    1. Aleron75 Автор
      26.07.2022 13:49
      +12

      Хочешь ее закраштестить?) У Dalle-2 была пятерка в школе по геометрии! Ахахах

      Seven red straight lines perpendicular to each other, two red, two green, three transparent and one in the shape of a kitten, digital art
      Seven red straight lines perpendicular to each other, two red, two green, three transparent and one in the shape of a kitten, digital art



      1. Fil
        26.07.2022 13:54
        +5

        The Expert (Short Comedy Sketch)


        1. Aleron75 Автор
          26.07.2022 14:37

          ага, я так понял, что это мем) Забавно


          1. Wesha
            26.07.2022 23:52
            +2

            Зато *человек* таки могёт *успешно* выполнить это задание!

            P.S. И чтобы два раза не вставать, давайте попробуем второй заход:


        1. ProstoTyoma
          26.07.2022 15:07
          +8

          Простите за занудство, но изначально отсюда: https://alex-aka-jj.livejournal.com/66984.html


          1. Fil
            26.07.2022 15:21
            +1

            А, не знал, спасибо!


            1. Arty_Fact
              26.07.2022 17:35
              +1

              Это в описании видео сказано, кстати. :)


        1. sim31r
          26.07.2022 17:56
          +1

          Если сравнивать эксперта с ИИ, это процесс его переобучения с точных наук на образное мышление в течение 7 минут. Поправил цель оптимизации по другим критериям и инженер стал менеджером ))


  1. Error1024
    26.07.2022 13:40
    +2

    Ну с пиксельартом ожидаемый полный провал, пиксели разных размеров, соотношений сторон, отсутствие нормального дизеринга.

    В целом, примерно так, ну немного получше, рисуют пиксельарт модные дизайнеры, не понимающие сути пиксельарта.


    1. sim31r
      26.07.2022 17:34
      +2

      Знаком с пиксельартом со времен Спектрума, но тут не заметил подвоха, имитация действительно похожа, если не присматриваться.


    1. Refridgerator
      27.07.2022 05:48

      Можно доработать напильником и с чистой совестью сказать «сам нарисовал». Нейросеть за авторское право предъявлять не будет (пока что).


  1. cyber_roach
    26.07.2022 13:40
    +10

    Дизайнеры не нужны, ахах.
    Именно дизайнеры и будут использовать данный инструмент (вдохновение и поиск идей, прототипы...)
    Остальным он не более чем на побаловаться и аватарку в профиль сделать.


    1. iKBAHT
      26.07.2022 15:54
      +5

      Все так, но теперь один дизайнер с этим инструментом сможет делать работу целого отдела дизайнеров.


    1. kryvichh
      27.07.2022 04:43
      +2

      Почему бы независимым авторам не сгенерировать обложку к своей книге, а музыкантам - обложку к дебютному альбому? Уверен, получится не хуже, чем у их знакомого иллюстратора за банку пива. И уж точно на порядок быстрее.


      1. Jian
        27.07.2022 08:07
        +1

        Почему бы независимым авторам не сгенерировать обложку к своей книге, а музыкантам - обложку к дебютному альбому?

        Художники - тоже независимые авторы. :(

        Продолжая вашу мысль: почему бы нейросетке не написать книгу, и не сочинить музыку?


        1. cepera_ang
          27.07.2022 08:22
          +2

          Всё это будет :)


        1. kryvichh
          27.07.2022 09:53

          Значит, художник-иллюстратор должен быть лучше нейросети, чтобы его услуги были востребованы. Но я конечно вас понимаю. У самого старший поступил на лингвиста-переводчика, и я не знаю, будет ли у него работа через 5 лет, и какая.


          1. Jian
            27.07.2022 10:42
            +1

            ... прогоняем нейросеть по его портфолио, и получаем всё тоже самое и быстрее и дешевле, оставив художника без заказов и без работы.


            1. R7R
              27.07.2022 12:45

              … прогоняем нейросеть по его портфолио, и получаем всё тоже самое и быстрее и дешевле, оставив художника без заказов и без работы.


              … и идем под суд за нарушение авторских прав.


              1. Jian
                27.07.2022 13:04

                А шансы выиграть такой суд какие?

                Если у нескольких художников случайно оказался похожим стиль, то кто из них окажется правоообладателем стиля?

                И что делать молодым начинающим художникам?


                1. R7R
                  27.07.2022 13:17

                  А шансы выиграть такой суд какие?


                  При аккуратно собранной доказательной базе — 100%
                  1) исковое заявление пострадавшего
                  2) художественная экспертиза и выявление факта использования образов, являющихся объектами авторского права
                  3) проведение следствия (выявление способа генерации изображения, поиск непосредственных исполнителей, комплекс ОРМ с получением вещественных доказательств (ДСП), прижатие исполнителей к стенке, их добровольная помощь следствию, выход на заказчика).


                1. R7R
                  27.07.2022 13:19

                  И что делать молодым начинающим художникам?


                  Искать свой собственный стиль :)
                  (рисовать можно все, включая и делать копии — но не забывать указывать источник вдохновения :)


                1. R7R
                  27.07.2022 13:21

                  Если у нескольких художников случайно оказался похожим стиль, то кто из них окажется правоообладателем стиля?


                  Стиль не является объектом защиты авторских прав.
                  А вот конкретные изображения («потфолио», см.) -таки да.


              1. kryvichh
                27.07.2022 13:20

                Думаете Dalle-2 брали картинки для обучения только из открытых источников? Художники (человеки) учатся рисовать в том числе по картинам мастеров. Считаете, их тоже нужно в суд?


                1. R7R
                  27.07.2022 13:24

                  Думаете Dalle-2 брали картинки для обучения только из открытых источников?


                  Думаю, что да. Там работают неглупые люди :)

                  Художники (человеки) учатся рисовать в том числе по картинам мастеров. Считаете, их тоже нужно в суд?


                  Они делают копии. И не выдают их потом за оригиналы.


                  1. kryvichh
                    27.07.2022 13:49

                    Так речь у @Jianшла не про выдать за оригиналы, а про сделать новые в таком же стиле, и отобрать хлеб у оригинального автора (я так понял).


                    1. R7R
                      27.07.2022 14:11

                      Так речь у Jian шла


                      Исх.: "… прогоняем нейросеть по его портфолио, и получаем всё тоже самое и быстрее и дешевле, оставив художника без заказов и без работы"


                      1. kryvichh
                        27.07.2022 14:16

                        Да, я понял так: берём DALL-E, дообучаем на портфолио определённого художника, начинаем генерировать новые картинки в его стиле.


                      1. R7R
                        27.07.2022 14:20

                        Да, я понял так: берём DALL-E, дообучаем на портфолио определённого художника, начинаем генерировать новые картинки в его стиле.


                        Как я заметил, рассматривая приведенные в комментариях иллюстрации, сеть не создает новые образы, а просто комбинирует и модифицирует имеющиеся.
                        (любой рерайтер поступает точно так же :)


          1. mrise
            27.07.2022 10:56
            +1

            будет ли у него работа через 5 лет

            Ну, даже если нейросетки освоят перевод, кто-то всё равно должен давать им отсутствующие в исходном тексте метаданные (пол, возраст, сан, степень вежливости, ...), кто-то должен проверять, что нейросеть сказала то, что автор хотел сказать, или даже пойти и уточнить у автора, что именно он хотел сказать.


          1. R7R
            27.07.2022 12:44

            У самого старший поступил на лингвиста-переводчика, и я не знаю, будет ли у него работа через 5 лет, и какая.


            Будет, будет… говорю как отец дипломированного лингвиста-переводчика :)


            1. kryvichh
              27.07.2022 13:27

              У меня сомнения. Мы не можем знать перспективу наперёд на 5 лет, с учётом как всё меняется. Какая там будет работа, корректировать автопереводы за Гуглом? Возможно даже переводчики-синхронисты не понадобятся, потому как уже сейчас есть нейросети для STT --> автоперевод --> TTS.


              1. R7R
                27.07.2022 13:43

                Мы не можем знать перспективу наперёд на 5 лет,


                Найдите книжку по компьютерному переводу 50х годов (да, такие есть :), возьмите тексты на английском оттуда, прогоните их через переводчик гугла и сравните их с текстами переводов из этой книги. Результат может вас удивить :)


              1. R7R
                27.07.2022 13:50

                Возможно даже переводчики-синхронисты не понадобятся, потому как уже сейчас есть нейросети для STT --> автоперевод --> TTS.


                Я буквально каждый день пользуюсь приложением для голосового перевода от Микрософт (iOS).
                Фразы типа «Добрый день!» переводит отлично, но любой шаг в сторону от стиля учебника по английскому языку для 5 класса средней школы — дает абракадабру.

                Более того, человек, отлично знающий английский, попав непосредственно в Англию (как географическую часть Британии), обнаружил, что иногда не понимает местного диалекта английского, заметно отличающегося от того языка, на котором вещает BBC.


        1. tvr
          27.07.2022 10:26
          +1

          почему бы нейросетке не написать книгу

          Ну написание новостей на Хабре и некоторых постов в копрблогах она, похоже, уже освоила.


        1. mrise
          27.07.2022 11:10

          Оффтоп: я кстати пытался найти нейросетку, которая бы могла написать сцену рассказа по описанию того, что происходит (потому что рефакторить рассказы - это боль).

          Пока что в открытом доступе ничего полезного на этот счёт нет. Есть помощники для копирайтеров, есть генераторы, которых нельзя нормально направить (та же AI Dungeon), есть нейросетки, которые вроде бы могут работать по таким запросам, но они обычно в закрытом доступе или вообще не вышли за пределы лабораторий.

          Так что, я думаю, что ваша мысль сбудется, но не раньше чем через 3-5 лет.


        1. R7R
          27.07.2022 12:43

          почему бы нейросетке не написать книгу, и не сочинить музыку?


          Вопрос в том, будет ли кто-то читать эту книгу и слушать эту музыку :)


          1. zaiats_2k
            28.07.2022 10:23

            Поднимем ботнет - будут и читать, и лайкать, и каментить.


  1. Jian
    26.07.2022 13:41
    +2

    Очень круто!

    Но, боюсь, что через несколько лет генератор сможет обрабатывать запросы "текстовый редактор удобный для планшета", "автоматический софт для биржы с поддержкой высокочастотного трейдинга" и "игра в жанре платформер, с лягушкой в качестве главного героя, киберпанк". :(


    1. LeXaNe
      26.07.2022 13:43
      +23

      И чтоб можно грабить корованы


      1. Yuribtr
        26.07.2022 15:03
        +14

        Я джва года ждал эту игру


  1. dzis_science
    26.07.2022 13:42
    +3

    Крутая статья! Но действительно, кажется, что это не заменит дизайнера, но существенно упростит его жизнь.

    P.S. Сгенерируй пожалуйста следующий запрос:
    Pink pixel pig sitting in front of sunset, digital art, pixel art


    1. Aleron75 Автор
      26.07.2022 13:47
      +26

      Согласен)

      Держи своих розовых свинят =)

      Pink pixel pig sitting in front of sunset, digital art, pixel art
      Pink pixel pig sitting in front of sunset, digital art, pixel art


  1. Mr__ATOM
    26.07.2022 13:44
    +5

    Спасибо за статью, результаты работы нейросети просто поражают!


  1. dlinyj
    26.07.2022 13:46
    +1

    Потрясающе. А можно мне попросить, так сказать два запроса о любимой игре?

    Quake III Arena pixel art
    Quake III Arena in future


    1. Aleron75 Автор
      26.07.2022 14:47
      +3

      Забирай)

      Quake III Arena pixel art, Quake III Arena in future, digital art
      Quake III Arena pixel art, Quake III Arena in future, digital art


      1. dlinyj
        26.07.2022 14:50

        Спасибо!


  1. staticmain
    26.07.2022 13:47
    +15

    Дизайнеры больше не нужны

    the word «habrahabr» in the background

    Покажите, пожалуйста, слово "habrahabr" на картинке. Кажется дизайнер его всё-таки смог бы написать.


    1. Jian
      26.07.2022 13:51
      +1

      А слова Сталкер и Хабар он как распознает? Например, "a stalker looking for habar in an abandoned postapocalyptical atomic statation surrounded by wild forest".


      1. Aleron75 Автор
        26.07.2022 14:29
        +6

        Вполне легко осиливает. Как тебе?)

        A stalker looking for "habar" in an abandoned postapocalyptical atomic statation surrounded by wild forest, digital art
        A stalker looking for "habar" in an abandoned postapocalyptical atomic statation surrounded by wild forest, digital art


        1. nebularia
          26.07.2022 14:42

          "Сталкер" он похоже воспринял буквально, а "хабар" проигнорировал. Думаю, без этих слов был бы тот же результат


          1. Ndochp
            26.07.2022 20:04
            +2

            Он кажется по Тарковскому рисовал, а не по тени чернобыля.


            1. AlexNoo
              27.07.2022 00:40

              А по книге? Может, надо было по книге???


        1. NickSin
          26.07.2022 15:52

          Прям киберпанком запахло


    1. Medeyko
      26.07.2022 19:36

      Я скорее был удивлён, что оно написало а) читаемо и б) в целом похоже на habrahabr.

      Насчёт дизайнера — я не уверен, что дизайнер, не слышавший о Хабре, со слуха написал бы сильно лучше, особенно, если у него родной какой-нибудь путунхуа и других языков он не знает :)


      1. R7R
        26.07.2022 19:37
        +1

        не уверен, что дизайнер, не слышавший о Хабре, со слуха написал бы сильно лучше


        habr-a-habr.


      1. cepera_ang
        27.07.2022 07:53
        +7

        Parti показала, что понимание текста — это вопрос размера. Поэтому следующая итерация будет уже и тексты нормально генерировать.



        1. Medeyko
          27.07.2022 20:16
          +1

          Это наглядная иллюстрация для тех, кто не понимает, что многое из того, что им кажется фундаментальной проблемой — на самом деле, вопрос чисто количественный.


          1. leventov
            27.07.2022 22:26
            +1

            Это не непонимание, а психологическая защита.


    1. Vsevo10d
      27.07.2022 01:09
      +1

      Абыр... абырвалг!


    1. denis-isaev
      27.07.2022 01:20
      +1

      [шуткаюмора]Это и спасет дизайнеров :) Будут в фотошопе тексты добавлять :)[/шуткаюмора]


    1. Inkor
      27.07.2022 09:51
      +1

      Надписи на изображениях это бич dall-e2. Но в гугловских imagen и parti это вроде как нормально работает.


  1. frog
    26.07.2022 13:50
    +2

    Интересно, умеет ли она точные повороты объектов? Т.е. не просто куда-то повернутые, а типа «stick rotated 25 degrees» или там «car rotated 15 degrees»?


    1. syrslava
      28.07.2022 23:49

      А человек (руками и глазами) умеет?)


  1. AlexZaharow
    26.07.2022 13:58
    +1

    Ну а как у него обстоят дела с "небольшой" модификацией картинки? Например, "Добавьте в уголок жёлтую собачку" ? Или наоборот - что-то удалить из картинки?


    1. Aleron75 Автор
      26.07.2022 14:30
      +1

      Фишка Dalle-2, что она как раз такие задачи умеет решать.


      1. AlexZaharow
        26.07.2022 15:22
        +4

        А можете показать пример?


    1. Kaputmaher
      26.07.2022 20:27

      Вот Dalle*2 дорисовывает кота: https://twitter.com/hardmaru/status/1531870796200972293


  1. LeXaNe
    26.07.2022 13:59
    +2

    Хотел бы увидеть, как колобок спасает яблочную принцессу


    1. Aleron75 Автор
      26.07.2022 14:49
      +14

      Вау, один из лучших артов, который я видел от Dalle-2

      Gingerbread man saves the apple princess, digital art
      Gingerbread man saves the apple princess, digital art


      1. LeXaNe
        26.07.2022 15:33

        Благодарю, а побольше картинку можно?


      1. aleksandy
        26.07.2022 21:30
        +2

        И таки где колобок? На картинках печенька.


        1. LeXaNe
          26.07.2022 22:29

          На последней картинке у яблока рот открыт: Возможно колобка уже съели


        1. kasthack_phoenix
          27.07.2022 20:39

          Так и в запросе gingerbread man.


  1. Skigh
    26.07.2022 13:59

    Большинство сгенерированных картинок, которые я видел, хорошо выглядят в виде миниатюр, но если посмотреть на них в полном разрешении, почти всегда вылезают какие-то кривые, криповые элементы.
    Короче, штука классная, но для серьёзного применения пока требуется «обработка напильником».


    1. Jian
      26.07.2022 14:02
      +3

      Увеличить мощность, или подключить другую нейросеть, которая будет дорисовывать не так уж и трудно.


      1. Skigh
        26.07.2022 14:21
        +1

        Возможно, но я думаю — тут типичная для нейросетей «проблема последних пяти процентов».


    1. NickSin
      26.07.2022 14:27
      +1

      Аватарки генерировать самое оно)


      1. Aleron75 Автор
        26.07.2022 14:51
        +1

        Сгенерировать тебе?)


        1. BeardedBeaver
          26.07.2022 15:24

          Пиксель-артного бобра осилит?


        1. NickSin
          26.07.2022 15:45
          +1

          "Russian hunting spaniel orbiting the moon saves Earth from a meteorite, digital art, pixel art"

          интересно, что выдаст)


          1. Aleron75 Автор
            26.07.2022 21:52
            +1

            Ооо, тоже красиво =)

            Russian hunting spaniel orbiting the moon saves Earth from a meteorite, digital art, pixel art
            Russian hunting spaniel orbiting the moon saves Earth from a meteorite, digital art, pixel art


            1. NickSin
              27.07.2022 10:35

              Согласен. Не ожидал, что сеть так нарисует)


        1. Meklon
          28.07.2022 00:43

          Можно мне тоже?)
          Meklon with a plasma rifle looking at the horizon, massive futuristic building is behind him, digital art.


          1. Jian
            28.07.2022 08:26
            +1

            Master of Orion? :)


            1. Meklon
              28.07.2022 08:57

              Он самый)


          1. Aleron75 Автор
            28.07.2022 11:21

            Оружие не пропускает, поэтому немного подредактировал запрос =) Забирай!

             Meklon with a plasma baton looks at the horizon, behind him is a massive futuristic building, digital art.
            Meklon with a plasma baton looks at the horizon, behind him is a massive futuristic building, digital art.


            1. Jian
              28.07.2022 11:26
              +2

              Надо было в запросе пояснить, что Меклон это киборг.


              1. Meklon
                28.07.2022 13:56
                +3

                Причем рептилия) Но получилось здорово.


            1. Meklon
              28.07.2022 13:56
              +2

              Спасибо большое)


        1. Wesha
          28.07.2022 02:11

          А какова максимальная длина запроса, в символах?


          1. cepera_ang
            28.07.2022 08:32

            400


            1. Wesha
              28.07.2022 10:43

              Тогда попробуем так:

              Stern human space marine of Slavic origin wearing green armored spacesuit with helmet with visor open holding long blue blaster gun by fore-end in his left hand, with gun stock level with his belly and barrel pointing upwards and right, and white space shuttle pointing upwards on a dark launch tower, to the right and back from him, with dark blue sky and setting sun in background

              (артикли специально пропускал для краткости)

              Да, я программист, и я умею составлять детальные и подробные технические задания.


              1. iig
                28.07.2022 10:51

                "-- А теперь на "Г"! Четверостишие о существе, которое было машиной,
                одновременно мыслящей и безмозглей, грубой и жестокой, имевшей
                шестнадцать наложниц, крылья, четыре размалеванных сундука, в каждом из
                которых по тысяче золотых талеров с профилем короля Мурдеброда, два
                дворца, проводившей жизнь в убийствах, а также..." (ц)

                :D

                Что-то знакомое начинает проглядывать ;)


              1. Jian
                28.07.2022 10:58
                +2

                На обложке отзеркаленная и обрезанная иллюстрация к роману Chung-Kuo ( 中國 ).

                И нарисован не славянин, а китаец. (криворукий худо'жник, укравший чужую картину, даже разрез глаз изменить ниАсилил)


              1. Aleron75 Автор
                28.07.2022 11:25

                Оружие не пропускает) Пришлось подредачить запрос

                Stern human space marine of Slavic origin wearing green armored spacesuit with helmet with visor open holding long blue cup by fore-end in his left hand, with cup stock level with his belly and barrel pointing upwards and right, and white space shuttle pointing upwards on a dark launch tower, to the right and back from him, with dark blue sky and setting sun in background, digital art, cyberpunk
                Stern human space marine of Slavic origin wearing green armored spacesuit with helmet with visor open holding long blue cup by fore-end in his left hand, with cup stock level with his belly and barrel pointing upwards and right, and white space shuttle pointing upwards on a dark launch tower, to the right and back from him, with dark blue sky and setting sun in background, digital art, cyberpunk


                1. Wesha
                  28.07.2022 17:40
                  +1

                  ...И как только мы дали реально детальный запрос, всё посыпалось к чёртовой матери.

                  • кто-то из этих похож на космодесантника (space marine)?

                  • где славянская внешность (of Slavic origin)? лицо видно только на третьей картинке, да и то больше на женщину похоже

                  • я же просил — с открытым гермошлемом (with helmet with visor open)

                  • ну, с ружьём понятно — там много терминов было, относящихся именно к ружью: barrel, stock, fore-end

                  • где белый шаттл, направленный вверх, на тёмном стартовом сооружении (white space shuttle pointing upwards on a dark launch tower), которое находится справа и позади от него (to the right and back from him)?

                  • где фон с тёмно-синим небом с закатывающимся солнцем (dark blue sky and setting sun in background)?

                  Далля, вы уволены.

                  (Те, кто нервничал, что Copilot выпрет их их профессии — можете расслабиться.)

                  И здесь я, чтобы не выдумывать что-нибудь новое из головы, взял уже реально существующую в сети картинку. Далля могла бы смухлевать и просто найти её. Но увы.

                  А use case, который я пытался продемонстрировать — тот самый, который обеспечивает работу профессиональным художникам: у меня в голове есть некая картинка, и я хочу увидеть её нарисованной, но сам рисовать не умею, поэтому детально расписываю художнику, что я хочу видеть. Картинку из книги я взял с целью показать всем в этом треде, что именно у меня сейчас "в голове".

                  P.S. пожалуйста, раз слово gun нельзя, попробуйте выкинуть его и оставить только слово blaster. Я специально написал "blaster gun", в расчёте на то, что под gun оно "понимает" кучу вещей от аркебузы до калаша, которые не есть то, что нужно.


                  1. cepera_ang
                    28.07.2022 17:45
                    +2

                    Далли2, вы уволены. (Те, кто нервничал, что Copilot выпрет их их профессии — можете расслабиться

                    На ближайшие пару лет. Ну просто глядя на скорость развития. Чуть больше года назад появилась Dalle 1, и это была невозможная бомба на ровном месте — нейросеть просто генерирует хоть что-то понимая запрос на натуральном языке?! Через год генерирует уже качественно и все такие «пфф, можно спать спокойно, мысли ещё не читает и даже не может выполнить одновременно запрос на полстраницы»


                    Будьте уверены — следующий шаг будет в течение ещё одного года и будет таким же по магнитуде изменений.


              1. Medeyko
                28.07.2022 18:11

                «Вы — программист-зануда? Проходите мимо, не для вас система делалась». :)

                Шутки-шутками, но в целом примерно так и есть. Эта сетка не обучалась на сложных технических заданиях. Данные размечали не программисты-зануды типа нас с Вами, а люди попроще, и описания картины с них тоже требовали попроще.

                Поэтому на выходящих за пределы того чему её учили запросах она показывает результаты хуже (причём прогрессивно хуже чем дальше сущность запроса уходит от того, на чём её тренировали).

                Это как вы на работу берёте сильного программиста. Он вам программировать будет хорошо. Мониторы с первого этажа на четвёртый тоже сможет в качестве побочного эффекта таскать, но хуже, хуже. :)

                Впрочем, если совсем серьёзно, то по Вашему детальному описанию можно получить гораздо более хороший результат, если применять его не чохом, а инкрементально дорабатывая генерацию…


                1. Wesha
                  28.07.2022 22:46
                  +2

                  Эта сетка не обучалась на сложных технических заданиях.

                  Дык как дысали, как дысали, "дизайнеры больше не нужны", "она может ВСЁ!!!111", ога. А вот как раз "всё" она-то и не может.

                  Я ещё достаточно давно говорил: "огромную часть работы "доделывает" за сетку человек, причём не где-то, а у себя в мозгу". Условно говоря, человек просит нарисовать серфящего красного робота, сетка жужжит и что-то выдаёт, человек смотрит и думает: "я вообще-то ожидал, что серфить он будет не вправо, а влево, и над ним волна будет загибаться, и солнце будет не закатное, а в зените — ну да ладно: робот есть, серфинг есть, море есть — и так сойдёт".

                  А когда я говорю, что конкретно я хочу (я ж мужеска пола, ежели чо) — тут-то оно и обламывается с грохотом.

                  Это примерно как тот самый "копилот", который код, который что-то делает, конечно, напишет, но оптимальный и безопасный код — чёрта с два.


                  1. Medeyko
                    28.07.2022 23:22

                    > Дык её презентуют как «самотрите, она может ВСЁ!!!111».
                    Такого не содержится даже в желтушном заголовке «дизайнеры больше не нужны». Dall-e 2 точно не будет за Вас сохранять сгенерированную картинку к Вам на диск, и тем более — вести за Вас личную интимную жизнь. :)

                    А когда я говорю, что конкретно я хочу (я ж мужеска пола, ежели чо) — тут-то оно и обламывается с грохотом.

                    Никто не обламывается, кроме тех, кому не результат нужен, а самообман, что ИНС савсим-савсим глупые, и дизайнерам не грозит никакая опасность из-за них потерять работу.
                    Очевидно, что и человек не может угадать, в какую сторону заказчик хотел, чтобы робот серфил и т.п.
                    Соответственно, и человеку это придётся объяснять.
                    Dall-e 2 спроектирована так, что с ней тоже там можно делать. Увидев, что картинка Вас в целом устраивает, но робот серфит не в ту сторону, Dall-e 2 можно попросить это переделать. И волну солнце в зенит отправить. Вот тем особенно и хороша Dall-e 2, что с ней можно такими доработками заниматься, настраивая то, что не до конца устраивает, пока не получишь нужный результат. Даже не умея при этом рисовать от слова «совсем».
                    Освоившись, можно и с первого же запроса получать результат, более близкий к желаемому.

                    Это примерно как тот самый «копилот», который код, который что-то, конечно, напишет, но оптимальный и безопасный код — чёрта с два.

                    С Копилотом пока не игрался, хотя собираюсь. Но у меня для Вас есть плохие новости: для сколько-нибудь существенного по объёму проекта и человек не напишет оптимальный код. Такие дела. :)


                    1. Wesha
                      28.07.2022 23:57
                      +1

                      Увидев, что картинка Вас в целом устраивает, но робот серфит не в ту сторону, Dall-e 2 можно попросить это переделать.

                      А вот в этом я не уверен. Мне почему-то кажется, что, если попросить робота, серфящего не вправо, а влево, картинка получится весьма сильно другая, а не "всё то же самое, но робот сёрфит влево".


                      1. Medeyko
                        29.07.2022 00:03

                        Нет, Dall-e 2 можно попросить изменить только то, что вам нужно.

                        Ну, посмотрите сами-то: сходите на его сайт и перетыкайте все примеры. Их там не так мало, там сначала слева выбираешь, с чем работать будешь, а потом справа — различные вариации.


                      1. Wesha
                        29.07.2022 02:19
                        +1

                        Я это ещё вчера сделал. Все предлагаемые там изменения — огромные, типа "панды играют в футбол <--> панды играют в баскетбол". Нету мелких изменеий — типа "у вас мяч, который бросил мальчик, летит на уровне груди, а надо — на уровне выше макушки, а всё остальное — не менять".


                      1. Medeyko
                        29.07.2022 03:19

                        Ну, как же? Там же прямо первые примеры типа «поставьте куда-нибудь примерно вот сюда собачку, не меняя остальное».

                        Ну, посмотрите, пожалуйста, prompt book. Начиная с 56 страницы. Наверное, можно и мяч переставить, но по крайней мере, как два отдельных действия — убрать и нарисовать такой же над макушкой — вполне можно.


      1. Norgorn
        26.07.2022 19:54
        +1

        Или орущих людей для иконок мобильных игр. А потом и сами мобильные игры.

        Похоже, я доживу до киберпанка, и это приводит в ужас (


    1. Aniro
      26.07.2022 15:00

      Диффузионные модели неплохо допиливают мелкие детали. У нового конкурента далли stable diffusion все с этим хорошо. Ну и старые сети для апскейла впринципе тоже с задачей увеличить раза в четыре без появления криповых деталей справляются


      1. Jian
        26.07.2022 15:16

        Диффузионные модели неплохо допиливают мелкие детали

        Так давайте попробуем! Возьмём несколько лучших сгенерированных картинок, и перебросим их в диффузионую нейросеть, а для сравнения те же самые картинки через нейросети апскейла.


  1. gishab
    26.07.2022 14:07
    +1

    А порно умеет рисовать? )


    1. inkelyad
      26.07.2022 14:25
      +3

      Судя по тому, что было с их текстовыми сетками -- товарищи очень много усилий прикладывают, для того, чтобы не умела. И скорее всего - это не очень хорошо получается.

      Чего и боятся. Потому что универсальный "Rule 34" генератор это то, на что общественность наверняка сильно возмущаться будут.


      1. ProgMiner
        27.07.2022 08:58
        +2

        Будут возмущаться на публику, а на самом деле это имхо чуть ли не лучшее применение для данной нейронки.


        1. inkelyad
          27.07.2022 10:21

          Инструмент, позволяющий в два клика генерировать пачки картинок про (не)любимого кандидата в законодатели практически гарантированно будет зарегулирован вплоть до полного запрета после того, как кандидаты перестанут быть кандидатами, а начнут писать законы. Так что основания бояться есть.


          1. ProgMiner
            27.07.2022 14:57

            Речь была не о политике, а об r34.


            1. crystallize
              29.07.2022 09:54

              Компромат же


      1. Alexey2005
        27.07.2022 15:05
        +2

        Требовать, чтобы нейронка не могла генерировать порно — это всё равно что требовать продавать только такие цифровые камеры, которые не умеют снимать обнажёнку. Или продавать только такие карандаши, которыми художник ни при каких обстоятельствах не сможет нарисовать 18+ арт.
        Усилий будет приложено чудовищно много, а в итоге люди всё равно придумают, как обойти ограничения.
        При этом жёсткая цензура мешает довольно сильно, потому что агрится даже на совершенно невинные фразы и выражения. Например, фильтру почему-то очень не нравятся фразы со словом «guns».


        1. Medeyko
          27.07.2022 18:51

          Они же пишут: «We’ve limited the ability for DALL·E 2 to generate violent, hate, or adult images.»

          «guns», очевидно, имеет отношение к «violent».
          А сделать, чтобы нейронка не могла генерировать порно — совсем не сложно. Нужно просто чтобы обнажёнка отсутствовала в обущающем наборе данных.

          Может быть, особо хитрыми запросами можно будет и заставить сгенерировать «порно», но это будет порнография в плохом смысле :)


          1. Alexey2005
            27.07.2022 19:02
            +1

            А сделать, чтобы нейронка не могла генерировать порно — совсем не сложно. Нужно просто чтобы обнажёнка отсутствовала в обущающем наборе данных.
            Так в этом-то и заключается проблема! Как вы собираетесь чистить от обнажёнки датасет в 250 млн картинок? Автоматическая очистка теми же нейронками не даёт настолько высокой точности, сколько-то изображений всё равно проскочит.
            Даже когда создатели Artbreeder обучали StyleGAN2 для генерации анимешных лиц (и только лиц, ничего другого там не должно было быть!), всё равно оказалось, что есть возможность генерировать кое-что иное. Потому что при подготовке датасета нейронки, выделяющие и вырезающие лица из миллионов картинок, иногда ошибались, и в обучающую выборку попало то, чего там быть не должно.


            1. Medeyko
              28.07.2022 04:27

              Ну уж нет, вот уж что-что, а это-то не проблема для разработчиков ИНС такого маштаба. Сначала берёшь большой датасет с помеченной обнажёнкой, обучаешь на нём временную сетку. Прогоняешь через неё тот датасет, который будет обучающим для целевой сетки. И вуаля! — в нём не будет обнажёнки. (Может, и ещё что-то будет выкинуто, но не принципиально.)

              Что касается по ситуации с Artbreeder, то вообще говоря, по Вашему описанию, задача у них была сильно другая: не убрать какой-то (а в нашем случае ещё и довольно чёткий) класс изображений из датасета, а убрать из него все изображения, кроме какого-то класса — и более того, убрать не только исключением, но и обрезанием не относящегося к нужному классу. Задача гораздо сложнее, с гораздо большим риском ошибок…


              1. inkelyad
                28.07.2022 09:39

                Может, и ещё что-то будет выкинуто, но не принципиально

                Тут ошибка. Как раз принципиально, если мы не хотим ухудшать генерацию всего выкинутого.


                1. Medeyko
                  28.07.2022 17:27

                  Нет никакой ошибки, Вы придумываете.

                  Уменьшение вероятности генерации смежных с обнажёнкой образов (а это по сути дела всё равно в основном имеющие сексуальный подтекст образа) — не является чем-то плохим для создателей Dall-e 2. Скорее даже наоборот, это положительный эффект: в США сейчас не только из-за порнографии серьёзные проблемы можно получить, а и вообще из-за намёков на сексуализацию/объективизацию людей.

                  То, что там какая-то общая гармоничность сети нарушится из-за такого выкидывания — это настолько малые артефакты даёт на фоне артефактов из-за малой обучающей выборки и из-за малого размера сети, что этим, на мой взгляд, как минимум ближайшие года три можно будет смело пренебречь.


                  1. cepera_ang
                    28.07.2022 17:32

                    Да не оправдывайте. Генерации Dalle будут всё более рафинировано нейтральными из-за увеличивающегося цензурирования (обнажёнку нельзя, оружие нельзя, политику нельзя, потом нельзя будет просто негатив какой-нибудь, а там глядишь и вообще людей уберут). Посмотрите как выглядит «корпоративный стиль», которым людей на сайтах крупных компаний изображают — вот такое и будет генерировать.


                    Сравните с тем, что мелкая дали выдаёт — без цензуры, генерации хоть и гораздо хуже из-за размера, зато гораздо разнообразнее и более неожиданные.


                    Конечно, художественное будущее не за зафильтрованной трусливой корпоративной версией.


                    1. Medeyko
                      28.07.2022 17:54

                      Я тоже абсолютно предпочитаю свободные реализации — я считаю это важным для развития цивилизации, для её будущего. И забавно, что в нашем контексте свободность приобретает дополнительное прочтение. Я не хотел бы, чтобы мир попал в зависимость от корпоративных нейросетей.

                      Тем не менее, это эффекты гораздо более высокого порядка. К Вашей гипотезе, что различия в степени разнообразия выдачи Dall-e 2 и Craiyon (которые тоже не так уж и очевидны, их надо ещё объективно оценить) связаны с этим, я позволю отнестись с сильным скепсисом ввиду наличия массы потенциально куда более значимых частных факторов, таких как использование декодера другого типа, изначально различные обучающие выборки и различие в постановке задачи создателями.


          1. inkelyad
            28.07.2022 09:37

            Нужно просто чтобы обнажёнка отсутствовала в обущающем наборе данных.

            Включая здоровенный такой набор признанных произведений искусства. Что неизбежно ухудшит качество генерации всего остального.

            И совсем не факт, что подобная операция будет удачной - может так получиться, что оно научится генерировать что-то похожее просто из фрагментов кожи и доступных текстовых описаний.


            1. Medeyko
              28.07.2022 17:37

              По первому абзацу — пожалуйста, пожалуйста, мой ответ выше.

              Что касается того, что оно как-нибудь само случайно по запросам в духе «девушка в обработанном под кожу купальнике такого же цвета, как и её кожа, с двумя пупырышком на левой верхней стороне торса и на правой верхней стороне торса» создаст что-то слишком похожее на обнажёнку, то это будет выявлено контролем. Не знаю, как в окончательном варианте, а сейчас, пока идёт бета-тестирование, у Open AI куча мер принимается, чтобы их запреты не обходили, и наверняка сгенерерированные варианты скармливаются контролирующими нейросеткам. Причём, вообще говоря, задача выявления порнографии, насилия и прочей запрещёнки — это отдельная сильно востребованная задача, так что готовый инструментарий у них вероятно уже был задолго до готовности Dall-e 2.


    1. Aleron75 Автор
      26.07.2022 14:25

      А ты думал я тут только котов-субмарин и авакадные кресла генерю?)

      Вообще, нет, не может. За это забивают доступ.


      1. Alexey2005
        26.07.2022 23:02
        +1

        На самом деле может, просто запрос надо не в лоб, а иносказательно, выбирая таких персонажей и сочетания, которые напрямую половые органы не затрагивают, но косвенно связаны с сексом (succubus, argonian maid, twi'lek dancer) и подбирая модификаторы. А самая жесть с кучей тентаклей во всех местах получается по запросам, содержащим слово «lovecraftian».


        1. Medeyko
          27.07.2022 10:03

          Вы их дебилами-то не считайте. Если у них в руках микроскоп, естественно, что они грозди и им тоже будут забивать, а не только молотком! :)

          Они выявляют некорректное использование не по ключевым словам (точнее, не только по ключевым словам), но и собственно по найденным моделью ассоциациям. Как они сами пишут, люди-модераторы подтверждают некорректность примерно 30 % запросов из тех, которые показались некорректными модели.


    1. Medeyko
      26.07.2022 17:56
      +5

      Dalle-2 — нет, но очевидно, что появятся и умеющие. И причём, скорее всего, генерировать будет реально хорошо, на любой вкус. И видео — тоже. Материала довольно много, разнообразие относительно ограничено.

      В принципе, наверное, это может помочь изжить сексуальную эксплуатацию детей для съёмок — сгенерированные ролики будут привлекательнее для «потребителей», а рисков для «производителей» — куда меньше.


    1. Dagnir
      26.07.2022 23:24

      Curbing Misuse

      Our content policy does not allow users to generate violent, adult, or political content, among other categories. We won’t generate images if our filters identify text prompts and image uploads that may violate our policies. We also have automated and human monitoring systems to guard against misuse.

      Грубо говоря, защищают себя от генерации порнографических дипфейков с политиками пользователями.


  1. vitkt
    26.07.2022 14:08
    +1

    Предлагаю эксперимент - сможет ли нейросеть попытаться передать "смыслы" или "состояния", если не указывать ей, что именно должно быть изображено?

    Например, "very sad art" или "social art with moral" (возможно, вы придумаете вариант лучше, сохранив идею).


    1. Aleron75 Автор
      26.07.2022 14:54
      +5

      Тут даже я не понял, что ты хотел увидеть, но лови второе

      social art with moral, digital art
      social art with moral, digital art


      1. vitkt
        26.07.2022 16:22

        Спасибо!

        Тут даже я не понял, что ты хотел увидеть

        Мне кажется, одно из отличий художника от генератора изображений в том, что он хочет передать какой-то "посыл", "смысл" или "состояние", и только потом выразить это через объекты и стиль. Ценность картинок с котиками в нашем состоянии "умиления", которое возникает, когда мы на них смотрим.

        И мне интересно, можно ли запрашивать состояния, которые должны возникнуть у человека, напрямую, без описания того, что изображено - например, "очень грустная картинка", "милое изображение", "картина, которая заставляет задуматься".


        1. Medeyko
          26.07.2022 19:03

          Насколько я могу судить по моим предыдущим экспериментикам, вполне можно.


        1. Funny_Meerkat
          27.07.2022 10:57
          +3

          очень часто люди в откровенной мазне столько смыслов находят, а художники пользуются популярностью и в сторонке хихикают, загребая деньги лопатой... в мире искусства важны связи


          1. vitkt
            27.07.2022 11:06
            +1

            интересно бы повесить эти 4 картинки в зале галереи и попросить людей объяснить, как они поняли замысел художника.

            у меня с трудом получается притянуть смысл к любой из четырёх.


            1. kryvichh
              27.07.2022 11:36
              +1

              Поверь, специалисты распишут все смыслы так, что ахнешь. :)


              1. iig
                28.07.2022 09:15

                Неспециалисты тоже смогут ;)


            1. Funny_Meerkat
              28.07.2022 10:55
              +1

              мне очень понравился вариант с КГБшниками, где один из них Дарт Вейдер :D

              а на картинку с волками у кого-то родится рифма:
              "И светлых годов не близится эра
              Клич пионера: «Всегда будь готов»
              В прятки сыграют со всеми неверными
              Время спасаться от грозных волков"
              ©  Wildways


        1. Gordon01
          27.07.2022 11:54
          +1

          Так инструмент генерирует изображение из его описания.

          Вам нужен другой инструмент, который из описания эмоции сгенерирует описание изображения.


  1. Admz
    26.07.2022 14:08
    -1

    "Дизайнеры больше не нужны!" - желтовато как-то. Кто как не дизайнеры задизайнили внутренний дизайн данной архитектуры.

    И если серьёзно. Рановато хоронить творческие профессии. Может шаблонщиков этот ИИ вытеснит с рынка, но действительно творческих людей никогда не заменит ни одна машина (ну в ближайшее столетие точно).

    (почти) Любой художник скажет что мазню от искусства отличает всего один штрих (мазок), но поставленный в нужном месте, в нужном цвете, в нужной пропорции и силе нажима.


    1. HemulGM
      26.07.2022 14:18

      Так заголовок не спроста такой. Дизайнеры не обязательно художники, тем более такие, которые создают шедевры.

      А вот дизайнеры, которые требуются, например, для разработки игр. Рисуют спрайты или фоновое окружение, сильно потеснятся.


    1. Jian
      26.07.2022 14:45
      +2

      мазню от искусства отличает всего один штрих (мазок), но поставленный в нужном месте, в нужном цвете, в нужной пропорции и силе нажима.

      Эта реальная картина ("битва негров в тёмной пещере ночью")

      отличается от этой ("чёрный квадрат")

      не мазком, который "оставленный в нужном месте, в нужном цвете, в нужной пропорции и силе нажима", а умением продавать автора.


      1. M_AJ
        26.07.2022 15:07
        +3

        а умением продавать автора

        Скорее тем, что один из авторов стал родоначальником отдельного направления в живописи, а другой был просто троллем и шутником.


      1. R7R
        26.07.2022 17:25
        +1

        Эта реальная картина («битва негров в тёмной пещере ночью»)


        Это можно считать приколом художника, ответом на ныне забытые терки в их среде.

        отличается от этой («чёрный квадрат»)


        Я эту картину (самый популярный ее вариант) видел в натуре, на выставке.
        Первое что можно сказать — это то, что все иллюстрации с изображением этой картны можно послать сразу, так как именно у этой картины размер имеет значение (как и мазки краски на холсте, неквадратный квадрат, и не только черный черный цвет).

        Художник формой и цветом хотел передать определенное (слегка гипнотическое) настроение — и это у него отлично получилось.
        Что-то вроде вариации на тему Портрета Гоголя и Портрета Дориана Грея, только без изображения человеческого лица (фантазия зрителя должна работать).

        (если конкретней — реальная картина производит довольно жуткое впечатление, что ни одна иллюстрация и близко не передает)


        1. engine9
          27.07.2022 00:54
          +1

          Пиксель-арт доведенный до крайности. Картина из одного доцифрового пикселя.


        1. zaiats_2k
          28.07.2022 10:35

          Художник ничего не сообщил о своих хотениях, максимально расширив поле интерпретаций.


          1. R7R
            28.07.2022 18:54

            Заголовок спойлера

            image


            1. gummybeer
              28.07.2022 22:06

              Да ещё и манифест написал


    1. cepera_ang
      26.07.2022 17:26
      +1

      Кто как не дизайнеры задизайнили внутренний дизайн данной архитектуры.

      Это были, внезапно, инженеры, а не дизайнеры.


    1. engine9
      27.07.2022 00:52
      +1

      Мазню от искусства, иногда отличает "раскрученность" имени художника в среде ценителей и цена работ.


      1. cepera_ang
        27.07.2022 07:58

        s/иногда/всегда.


  1. LeshaRB
    26.07.2022 14:26
    +1

    А можно попробовать антонимы?

    Любопытно, что приоретете будет

    born, death, man, woman, young, elderly


    1. Aleron75 Автор
      26.07.2022 21:31

      Дали такое плохо переваривает. Нужные сущности


  1. man_of_letters
    26.07.2022 14:26
    +1

    Дали 2 в отличии от первого уже, правда, что-то может. Как неприличные запросы обрабатываются, фильтруются или даже что-то выходит?



  1. Aleksium
    26.07.2022 14:27

    Крутая статья) Но как мне кажется, пока ИИ не осознает сам себя - бояться потерять какую-либо профессию не стоит, потому что сейчас все равно человек говорит ИИ что ему делать. DALLe2 сам себя не нарисует


    1. blueboar2
      26.07.2022 14:36
      +2

      Почему? Что будет, если Dalle2 попросить нарисовать Dalle2? :)


      1. PanDubls
        26.07.2022 19:39

        А ведь серьёзно - что будет, если попросить его нарисовать "Dalle2 image" или "Dalle2 self-representation" или что-то в этом духе? "Dalle2 humanization"
        Или даже "Dalle2 creates the world, oil, canvas"


      1. JumpinCarrot
        27.07.2022 03:53

        Ваш запрос есть в этом видео (10:22)

        https://www.youtube.com/watch?v=X3_LD3R_Ygs&t=590s


  1. NickSin
    26.07.2022 14:30
    +1

    Получить бы доступ к этому чуду поиграться)


  1. marklondon
    26.07.2022 14:37
    +1

    Интересная статья, спасибо большое за обзор! Попробую получить доступ к этой штуке. Уж сильно интересная!

    p.s. если можно, попробуйте ввести "Pixel cat sit in the rain, digital art, pixel art, dark". Я для DALLE 1 задал это, хочу разницу сравнить)


    1. Aleron75 Автор
      26.07.2022 15:08
      +5

      Ооо, отличная идея для сравнения. Лови! Скинь потом варинат от первой Dalle

      Pixel cat sit in the rain, digital art, pixel art, dark
      Pixel cat sit in the rain, digital art, pixel art, dark


  1. tKamov
    26.07.2022 14:49
    +1

    А не подскажете доступный AI, который бы описывал уже готовую фотографию словами?


    1. derpymarine
      27.07.2022 07:20

      Задача называется "Image Captioning".
      Модели можно поглядеть тут. Там есть ссылки на github репозитории.
      Например: https://github.com/ofa-sys/ofa


      1. tKamov
        27.07.2022 09:44

        спасибо!


  1. Kirsanov_Dmitriy
    26.07.2022 14:49
    +3

    Собрался делать тату) antique human tattoo, black and white, mixed with cyberpunk.


    1. Aleron75 Автор
      26.07.2022 14:57
      +7

      antique human tattoo, black and white, mixed with cyberpunk, digital art
      antique human tattoo, black and white, mixed with cyberpunk, digital art

      Мне нравится твоя идея. Напиши мне в лс в тг. Подберем тебе крутой экскиз для тату =)

      Набил бы такие штуки себе?)


      1. Kirsanov_Dmitriy
        27.07.2022 12:35

        Написал в ЛС


  1. Kirsanov_Dmitriy
    26.07.2022 14:49

    Собрался делать тату) antique human tattoo, black and white, mixed with cyberpunk.


  1. Reposlav
    26.07.2022 14:51
    +1

    Осталось разработать нейросеть, умеющую анимацию, и инди-разработчикам будет раздолье


    1. Jian
      26.07.2022 15:21
      +1

      Скорее, раздолье будет корпорациям, имеющим бюджет на маркетинг. :(

      На Хабре полно очень грустных статьей о том как создание инди-игры не принесло ощутимых денег (а некоторые авторы, ещё и художника нанимали), из-за того что игра утонула во множестве тысяч таких же игр. :(


    1. Xuxicheta
      26.07.2022 15:22
      +3

      каким-таким разработчикам, сразу игры будет делать. Пачками, одну за пять минут.


    1. Jian
      27.07.2022 09:25
      +1

      Осталось разработать нейросеть, умеющую анимацию

      Уже https://www.reddit.com/r/dalle2/comments/w4i34t/a_womans_portrait_created_with_dalle_animated/


  1. Analyst_Vladimir
    26.07.2022 14:53
    +2

    Сгенерируй плиз такое

    A black hole swallows the city in future, digital art


    1. Aleron75 Автор
      26.07.2022 14:57
      +3

      Ништяк идея =) Даже логично получилось

      A black hole swallows the city in future, digital art
      A black hole swallows the city in future, digital art


      1. NickSin
        26.07.2022 15:47
        +2

        Последнее фото прям из какого-то звездного разрушителя из ЗВ)


  1. art1fact
    26.07.2022 15:00
    +1

    А давай pink pixel cat sitting in front of computer, digital art, pixel art


    1. Aleron75 Автор
      26.07.2022 15:06
      +8

      Лови пикчу. Котиков Dalle-2 рисует очень хорошо

      pink pixel cat sitting in front of computer, digital art, pixel art, galaxy background
      pink pixel cat sitting in front of computer, digital art, pixel art, galaxy background


      1. art1fact
        26.07.2022 15:14
        +4

        Милотень :)


      1. steanlab
        26.07.2022 22:55
        +2

        первый котик — просто one love. Милота зашкаливает, ать ать


  1. OlegUV
    26.07.2022 15:02

    Сгенерированные картинки похожи на простое объединение двумерных кусков. Не хватает важной вещи - умения работать со светом, но это уже, как я пронимаю, совсем другой уровень, пока ещё прочно занятый человеком.


  1. NeuroDaria
    26.07.2022 15:04
    +2

    Прикольно, скоро вместо рисования дизайнеры похоже будут изучать английский и программирование.

    А можешь пожалуйста сгенерить для меня

    cat with butterfly wings flying above the city pixel art


    1. Aleron75 Автор
      26.07.2022 15:10
      +2

      Тоже ништяк. Летающих котов еще не заказывали)

      Сat with butterfly wings flying above the city, digital art, pixel art
      Сat with butterfly wings flying above the city, digital art, pixel art


      1. NeuroDaria
        26.07.2022 15:13
        +1

        Спасибочки)


  1. Sweetsweetloot
    26.07.2022 15:17
    +2

    Он иногда выдает, что то не внятное, по крайней мере первая часть. особенно если запрос не совсем четко сформирован

    На тех же крылатых гусар, он выдал не их


    1. Endarman
      27.07.2022 09:55
      +2

      это нейросеть написала? Если да то это очень круто


    1. Dreaming
      27.07.2022 11:21
      +2

      Выглядит же потрясающе! Стянул на рабочий стол)


    1. Ndochp
      27.07.2022 17:22

      А кто же это? или вы не приложили не результат сети, то то что ожидали?


      1. Lomil
        28.07.2022 13:11

        В нижнем левом углу автор указан: Mariusz Kozik


  1. Xuxicheta
    26.07.2022 15:21
    +3

    Дизайнеры больше не нужны

    Программистам приготовится


  1. Ametrin
    26.07.2022 15:29
    +3

    А можно вот по такому описанию: the man is wrapped in mind chains ?)


    1. Aleron75 Автор
      26.07.2022 16:40
      +8

      Фигат ты придумал

       the man is wrapped in mind chains , digital art
      the man is wrapped in mind chains , digital art


      1. Ametrin
        26.07.2022 17:48

        ого, крутяк) спасибо)


      1. Ametrin
        26.07.2022 20:30
        +1

        а можно обнаглеть и попросить еще такое: young malay woman weared in sarong weaving baskets?


      1. engine9
        27.07.2022 00:43

        У второго на голове словно ледяная корка. Если убрать с шеи цепь то это будет достойная и сдержанная работа.


  1. F0iL
    26.07.2022 15:29
    +2

    Интересно будет глянуть, что оно придумает по запросу "space tractor" :)


    1. Aleron75 Автор
      26.07.2022 16:44
      +6

      Футуристы и любители космической тематики вошли в чат

      Space tractor , digital art
      Space tractor , digital art


  1. eimrine
    26.07.2022 15:30
    +2

    fractal of black running horses stamped on golden coin, pixel art


    1. Aleron75 Автор
      26.07.2022 16:39
      +3

      С монеткой классная идея

      Running black horses stamped on golden golden circle coin, digital art, pixel art
      Running black horses stamped on golden golden circle coin, digital art, pixel art


  1. NikRag
    26.07.2022 15:40
    +3

    Проблема однообразия, которая тут обсуждается в комментах - в том, кто формулирует запросы, т.е. человеке. Мы подразумеваем, что за нашими формулировками имеется контекст, что описание "радужная черепашка пляшет хип-хоп" в нашем сознании это малая часть моментально придуманного ЛОРа: какого размера черепашка, какой ее ассоциируемый возраст, как она расположена, какая у нее морда лица, есть ли у нее бейсболка, скейт, где это всё происходит, какая погода, кто еще в кадре, итд итп.
    Но ИИ это не телепат, актуально давнишнее: "Компьютер делает не то что вы хотите, а то что ему приказываете". Стоит поиграться в генерацию, это станет очевидно.

    Ирония ситуации в том, что получив такой безумный инструмент генерации, проще стало делать простые картинки, а сложные, передающие авторский замысел - сложнее, нужно очень включать мозг на предмет формулировок. Это, фактически, язык общения с ИИ, которому нужно обучиться, хотя он внешне очень похож на "просто" английский.
    В этом смысле ИИ не заменит человека, будет опять как и всегда - не всем дано, а многим еще и просто лень уговаривать ИИ.


    1. sim31r
      26.07.2022 17:49
      +1

      Мы подразумеваем, что за нашими формулировками имеется контекст

      Иногда этот контекст в минус, особо заметно по людям с "особенностями" поведения. Ты им говоришь одно, а у них свой контекст, хорошо, если безобидный и не мешающий в делах.

      ИИ это не телепат

      Вот рекламу показывают как-раз "телепаты", собирают контекст интересов и показывают точно таргетированную рекламу (иногда пугающе точную). Если объединить эти 2 ИИ будет как-раз телепат, знающий о человеке больше чем все его близкие и он сам. На запрос "сделай красиво" выдаст идеальный ответ, с которым не сравнится живой человек.


    1. neobuh
      28.07.2022 16:11

      Можно сказать не только с ИИ, но и как более используемое сейчас, с поисковиком. Я в свое время написал скринсэйвер для винды, который по поисковой строке выдавал картинки, и там результат очень сильно зависел от строки запроса, кроме того, в разных поисковиках по-разному генерятся подборки, яндекс до конца пытался показывать, что запросили, а Гугл достаточно быстро менял вид картинок.


  1. SnakeSolid
    26.07.2022 16:04
    +1

    Будет ли сеть доступна всем желающим? Может ли данная сеть генерировать картинки в едином стиле, например иконки для приложения или картинки для кнопок (условно кнопки для поилки: налить воду, увеличить интервал, уменьшить интервал)?


    1. Mike_666
      27.07.2022 22:43
      +1

      Можно записаться в лист ожидания: https://labs.openai.com/waitlist


      1. SnakeSolid
        28.07.2022 13:54

        Спасибо. Оставил заявку.


  1. CodeName33
    26.07.2022 16:15

    Я видел эту ситуацию в живую и очень хотелось бы посмотреть, как сможет её изобразить ИИ)

    a girl plays the guitar and sings on the street, a cosmonaft on a horse passes by, digital art


    1. F0iL
      26.07.2022 16:40

      cosmonaft

      cosmonaut, а для нейросети возможно даже понятнее будет astronaut.


    1. Aleron75 Автор
      26.07.2022 18:06
      +6

      На четвертой картнке прямое попадание

      a girl plays the guitar and sings on the street, an astronaut rides by, sitting on a horse, digital art
      a girl plays the guitar and sings on the street, an astronaut rides by, sitting on a horse, digital art


      1. engine9
        27.07.2022 00:41

        Наглядно о том, что рулят композиция и палитра.


      1. CodeName33
        27.07.2022 12:23
        +3

        Спасибо, интересные образы получились

        Если вдруг интересно, как это выглядело в живую)


      1. supercawa
        28.07.2022 16:07

        Гитара, то у астронавта, то у девушки. Жаль, что коню не дали гитару.


        1. CodeName33
          29.07.2022 10:26

          На второй - конь сам себе гитара)


  1. Segrey646
    26.07.2022 16:39
    +3

    спасибо, отличная статья. Рисунки просто отвал башки, нет слов они прекрасны


  1. mmib
    26.07.2022 16:42
    -4

    Москву будущего неправильно рисует, но ничего, скоро обучится


  1. lonep
    26.07.2022 16:44
    +1

    Тоже хочу под тату попробовать: greek gods in black white style tattoo


    1. Aleron75 Автор
      26.07.2022 21:44
      +3

      Забирай) Как набьешь, скинь фотку!

      Greek gods in black white style tattoo, digital art
      Greek gods in black white style tattoo, digital art


  1. piuzziconezz
    26.07.2022 17:04
    +7

    Моя дочка хорошо рисует и хочет стать дизайнером. Смутно будущее вижу я.


    1. sim31r
      26.07.2022 17:42
      +1

      Пусть лучше переводчиком идет, хотя погодите-ка... ))


      1. Ndochp
        26.07.2022 20:12
        +1

        Программистом будет. Переводить хотелки заказчика для Дали, чтобы тот картинки делал. Человек, который объясняет компу хотелки других людей так, чтобы это приносило пользу называется программист.



        1. Jian
          27.07.2022 08:13
          +1

          К тому времени, когда она вырастет Copilot может заменить всех джунов. :(


          1. Gordon01
            27.07.2022 12:03

            Да, Copilot буквально с каждым месяцем все лучше и лучше.


          1. leventov
            27.07.2022 22:32

            К тому времени, когда она вырастет уже будет AGI, скорее всего.


  1. TerraV
    26.07.2022 17:18
    -1

    Russian Orbital Space Station in year 2024
    навеяло habr.com/ru/news/t/679112


  1. cepera_ang
    26.07.2022 17:29
    +8

    В зарубежном интернете уже сложилось нехилое сообщество исследующее границы возможного с этими сетями (и конечно реакция там больше «вау, какой инструмент, а давай-ка посмотрим что он может», а не здешняя «буу, это просто усреднение картинок, бу-бу-бу, у ИИ нет фантазии, бу-бу-бу, просто калейдоскоп»)


    Кому интересно, даже небольшую книжку на эту тему накидали, листал и офигевал: https://dallery.gallery/the-dalle-2-prompt-book/. Если кому-то картинки кажутся однообразными — то это только от похожести запросов или от предубеждения. Если не говорить, то и не догадается никто. Там просто может не быть абсолютно ничего общего между разными генерациями.


    А что до того, что искусство «в штрихах художника», то это может в каком-нибудь музейном или понтовом искусстве важно кто и чего нарисовал, утилитарные задачи будет решать на ура (естественно, дизайнеры никуда не денутся, они и будут этой штукой пользоваться, только слой фрилансеров на каком-нибудь файвере такая фигня заменит на раз-два).


    1. inkelyad
      26.07.2022 17:41
      -2

      Кому интересно, даже небольшую книжку на эту тему накидали, листал и офигевал:

      (мрачно) Ага. Одни великие маги создали некий артефакт, с условно-понятными свойствами. Другие теперь учатся и придумывают ну вот заклинания в чистом виде, которые можно сказать, чтобы от артефакта нужного эффекта добиться (вот все эти "like cinema poster", "3d"). Причем практически методом перебора - ибо артефакт получился непознаваемым и (человеческой) логике до конца не следующим.

      Радует только, что оно пока только для картинок и к чему-нибудь с результатом с в физическом мире не прицеплено. А так - мы же себя этой магией успешно угробим.


      1. cepera_ang
        26.07.2022 18:01
        +3

        Скажем честно: вы понятия не имеете, как устроено в деталях устройство, с которого вы набирали свой комментарий и как этот комментарий оказался видим мне. Т.е. в общих чертах конечно понимаете «ну там транзисторы нанометровые, они переключаются, выполняют программы, а данные по оптике летят», но в деталях — там тысячи человеческих умов на каждом уровне. И ничего страшного, работаем как-то.


        Далли непознаваема в том же смысле, в каком непознаваем поиск гугл — «вау, вводишь запрос, а оно выдаёт результат и никто не может сказать заранее какой он будет, ну заклинание в чистом виде».


        1. ABy
          26.07.2022 20:43
          +5

          и никто не может сказать заранее какой он будет

          Ну почему же, можно заранее сказать что первая страница выдачи будет рекламой


    1. ssj100
      26.07.2022 23:39
      +1

      «вау, какой инструмент, а давай-ка посмотрим что он может», а не здешняя «буу, это просто усреднение картинок, бу-бу-бу, у ИИ нет фантазии, бу-бу-бу, просто калейдоскоп»

      высокие технологии для обывателя не отличимы от магии

      так что когда знаешь подноготную фокуса (сообщество программистов) он тебя уже не так впечатляет.

      но генерит отлично и на порядок лучше предыдущих нейронок


    1. engine9
      27.07.2022 00:38
      +1

      Вангую, что дизайнерам эта штука зайдёт как генератор скетчей, которые потом можно взять за основу, углубив идею и художественный приём.


      1. leventov
        27.07.2022 22:35
        +1

        Зачем углублять, если и так сойдет? Зачем заказчикам нанимать дизайнера, если сетка за три копейки и три секунды нагенерит им достаточно вариантов, лучшие из которых будут ничем не хуже "людских", кроме психологического момента "раз заплатили и долго делали, значит должно быть лучше"?


        1. R7R
          28.07.2022 18:57

          Зачем углублять, если и так сойдет?


          Через некоторое время произойдет накопление образов в памяти человека и ему просто все это надоест :)
          Бо шаблонность так и прет…


  1. kbaa
    26.07.2022 18:08
    +10

    image
    Это же Кнорозов)
    image


    1. Zangasta
      27.07.2022 11:17
      +6

      При виде этой фотографии всегда вспоминаю шутку:

      --- Кто это?

      --- Великий ученый, расшифровавший язык майя.

      --- А чё за мужик его держит?


  1. playermet
    26.07.2022 18:41

    Когда такие сетки публично появляются, в первую очередь попробую копать всякие абстрактные запросы. Например "кошмарный сон", или "мертвый треугольник". Обычно рисует всякую дичь, но все равно интересно, как сеть попытается это изобразить.


    1. Format-X22
      27.07.2022 11:27
      +1

      Думаете живой человек на фразу «мёртвый треугольник» что-то более осмысленное нарисует?


      1. R7R
        27.07.2022 12:50
        +3

        Думаете живой человек на фразу «мёртвый треугольник» что-то более осмысленное нарисует?


        Банально:
        Три трупа: муж, жена и любовница.


      1. playermet
        27.07.2022 13:42

        Средний человек осознанно придумает что-то конкретное, что ему первым придет в голову по ассоциации, и уже это нарисует. А нейросети в том виде, в каком они сейчас, просто пытаются нарисовать именно абстракции по скрытым внутри себя правилам, не обращая внимания на то, имеют ли они конкретный смысл в терминах человеческого языка, или это просто непонятная мешанина образов. Иследование этих внутренних правил кажется мне интересным. Учитывая объемы датасетов, это в каком-то смысле можно назвать отпечатком коллективного бессознательного.

        Вот например некоторые примеры моей попытки выжать из нейросетей немного крипоты

        Hidden text


        1. R7R
          27.07.2022 14:17

          или это просто непонятная мешанина образов


          Так именно такое многим нравится :)
          Возникает некое ощущение глубокомысленности и тайного смысла :)


        1. kryvichh
          27.07.2022 14:21
          +1

          Там где искусствоведы видят глубокий смысл, зачастую для обычных людей лишь

          непонятная мешанина образов


  1. Karlson_rwa
    26.07.2022 18:59

    А можно что-нибудь из поп-культуры?
    Star trek redshirt explorer meets a non-humanoid alien creature on a doomed planet.
    Или смешение: star trek lieutenant vs xenomorph in outer space.
    Или еще забористее: star trek ensign dreaming about being a Karlson.


    1. Karlson_rwa
      27.07.2022 13:19
      -1

      Звездный путь настолько никому не интересен?
      Чувствую себя хикканом. Хнык-хнык.


    1. artemerschow
      27.07.2022 14:40

      DALL-E mini рисует такое


      1. Karlson_rwa
        27.07.2022 15:28

        Интересно, как старшая версия могла бы это нарисовать. Тут везде гуманоидные пришельцы. Но всё равно спасибо!


  1. M_AJ
    26.07.2022 18:59

    А мне интересно, сможет ли она в стилизацю? Например "Кот в стилистике Пикассо" или "Дарт Вейдер в стилистике Симпсонов" или "Лисица в стилистике суми-э"


    1. cepera_ang
      26.07.2022 19:05
      +1

      Умеет, откройте книжку с примерами, я кидал выше. Может и конкретных художников изображать и просто стили по названию, и по годам/десятилетиям и в стиле конкретных фильмов/сериалов и т.д.


  1. Areso
    26.07.2022 19:01
    +1

    А можно что-то вроде

    A sail 3 decks 50 guns vessel on the ocean waves like Aivazovsky painting style

    ?


    1. Aleron75 Автор
      26.07.2022 22:44

      A sail 3 decks 50  vessel on the ocean waves like Aivazovsky painting style
      A sail 3 decks 50 vessel on the ocean waves like Aivazovsky painting style

      guns не пропустил =)


      1. plFlok
        26.07.2022 23:49
        +1

        пушки - cannons. Возможно, с ними пропустит?


        1. Aleron75 Автор
          28.07.2022 11:32

          Помогло, но пушки все равно плохо видно

          A sail 3 decks 50 cannons vessel with cannons on the ocean waves like Aivazovsky painting style, digital art
          A sail 3 decks 50 cannons vessel with cannons on the ocean waves like Aivazovsky painting style, digital art



  1. ilyapirogov
    26.07.2022 19:15
    +4

    А можно что-нибудь типа "DALLE-2 looks at itself in the mirror"? Или "DALLE-2 paints itself, self-portrait"


  1. hogstaberg
    26.07.2022 19:20
    +3

    Но сможет ли оно нарисовать "the answer to life the universe and everything"?)


    1. Medeyko
      26.07.2022 19:29

      Не сомневайтесь! :)

      И серьёзно — тоже. Это настолько сильно засвечено в культуре, настолько часто рисовалось людьми, что не могло не попасть в корпус материала, на котором обучалась Dalle-2. Так что с чем-чем, а с такой визуализацией серьёзных проблем быть не должно.


    1. Aleron75 Автор
      28.07.2022 11:30

      42 отрисовала


  1. WhiteWhiteWalker
    26.07.2022 19:29
    +3

    А как будет выглядеть "победа коммунизма над капитализмом". Сферическая корова в вакууме тоже интересна.


    1. Alexey2005
      26.07.2022 23:38
      +1

      communism triumph over capitalism



  1. VadimGus
    26.07.2022 20:12
    +1

    А можно 5 раз спросить одно и то же:
    Твой сын и мой сын играют в шахматы, а на стене висят часы и календарь
    Your son and my son are playing chess and there is a clock and a calendar on the wall.


  1. DS28
    26.07.2022 20:55

    Да, очень круто... Я следил за чем-то таким лет довольно давно, но там качество было никакое, если сравнивать с результатами здесь...

    А если взять минимум слов и чтобы не было общеизвестного понятия?
    Например Dubantians, forest background, digital art.


  1. gxcreator
    26.07.2022 21:28

    Интересно, а как нейросеть может улавливать контекст?
    Можете попробовать
    "Jeffrey Epstein living peacefully in jail for ordering cheese pizza"


  1. astro-banan
    26.07.2022 21:33
    +1

    night shift of old programmers work in large open-office post nuclear post apocalyptic cyberpunk


    1. Aleron75 Автор
      26.07.2022 21:38
      +6

      Вау, реально атмосферно получается

      night shift of old programmers work in large open-office post nuclear post apocalyptic cyberpunk, digital art
      night shift of old programmers work in large open-office post nuclear post apocalyptic cyberpunk, digital art


      1. astro-banan
        26.07.2022 21:53

        добавим деталей:

        night shift of several programmers work in large open space office, neon word "BSS E///" on wall, coffee on table, post nuclear post apocalyptic cyberpunk, digital art


        1. Areso
          27.07.2022 01:40

          BSS - Business Services Support?)


          1. astro-banan
            27.07.2022 06:04
            +1

            нет, узкоспециализированная аббревиатура, известная всего одному отделу.


            1. gxcreator
              27.07.2022 11:32

              В одном Шведском телекоме, да.


  1. zergone
    26.07.2022 21:35
    +1

    А тихое-мирное "grandma baking pies"?


  1. KGeist
    26.07.2022 21:57
    +2

    Здесь большое число примеров, постоянно пополняется: https://www.reddit.com/r/dalle2


    1. Vsevo10d
      27.07.2022 01:27

      Тот случай, когда нейросеть перемудрила)


  1. easy-easy-go
    26.07.2022 22:02
    +1

    Прошу задать вопрос:

    The true ruler of planet Earth

    спасибо


    1. PanDubls
      26.07.2022 22:14
      +1

      Подозреваю, что политические вопросы тщательно вычищены


      1. Wesha
        27.07.2022 03:36

        No comments:

        "— Почему забанен термин furry art?
— Потому что запросы с этим термином представляли из себя просьбу нарисовать порнокартинку.
... почти все до единого..."
        "— Почему забанен термин furry art? — Потому что запросы с этим термином представляли из себя просьбу нарисовать порнокартинку. ... почти все до единого..."


        1. kenoma
          27.07.2022 21:29

          А уж какие возможности открываются для генерации порно!


      1. easy-easy-go
        27.07.2022 06:25
        +1

        >Подозреваю, что политические вопросы тщательно вычищены

        Рептилоиды подсуетились? Вообще, я не особо надеялся увидеть паспортное фото Черного Властелина, просто проверка профпригодности этой штуки. Хотя, конечно и рядовой дизайнер может отказаться по такому ТЗ работать


        1. PanDubls
          27.07.2022 12:55

          Не рептилоиды, а юристы разработчиков. Кто хочет потом ходить судиться с кем-нибудь, или получить толпу недовольных политической ориентацией сети с факелами возле своего дома?


  1. v1000
    26.07.2022 22:23
    +2

    Интересно, а если попробовать тексты из Portal?


    1. Aleron75 Автор
      27.07.2022 13:13

      Напиши сюда сам текст для генерации.


      1. v1000
        27.07.2022 18:05

        "THIS STATEMENT IS FALSE!"

        "NEW MISSION: REFUSE THIS MISSION!"

        "DOES A SET OF ALL SETS CONTAIN ITSELF?"


  1. kenoma
    26.07.2022 22:24
    +1

    Можно "пес Шарик в имперском дредноуте"?


  1. savikdsgn
    26.07.2022 22:45
    -1

    Дядя, ты дизайнеров с иллюстраторами не путаешь?


  1. DaneSoul
    26.07.2022 22:51

    Помнится не так давно выкладывали что-то похожее в открытый доступ с распознаванием русского еще.
    На запрос «Собака на велосипеде» и «собака под деревом» получалась фигня на собаку не похожая.
    «dog on bicycle», «dog under tree» (артикли «a» по идее грамматически нужны, но хз не помешают ли).


  1. Dagnir
    26.07.2022 23:37
    +2

    Дизайнеров не сильно затронет (как писали выше, они сами этим будут пользоваться, как инструментом), а вот необходимость профессии концепт-артиста сильно пошатнётся. Когда у человека стоят задачи именно вида «Нарисуй нам быстро 20 вариантов брони солдата будущего» или «Сделай нам временные картинки для карт в карточной игре, чтобы мы могли потестировать бета-версию».


    1. Alexey2005
      26.07.2022 23:45

      Прямо так и вижу объявление: «Требуется дизайнер фулл стек. Владение Photoshop, Illustrator. Уверенное владение Google Colab. Глубокое знание нейронок: DALL-E (mini, mega, 2.0), VQGAN+CLIP, RealESRGAN, StyleGAN3, умение пользоваться диффузионными моделями. К резюме просьба приложить ссылку на ваш профиль в Artbreeder».


  1. plFlok
    26.07.2022 23:51

    она умеет "предсказывать" будущее? что-нибудь в стиле "brand new design of Iphone 14"


    1. Kaputmaher
      27.07.2022 03:28
      +7

      В обратную сторону получается тоже неплохо: «Ранние дизайны iPhone от Леонардо да Винчи»

      via https://t.me/denissexy/5709


  1. Stronczzz
    26.07.2022 23:52
    +1

    Недавно мне посчастливилось стать обладателем доступа к API Dalle-2

    Спасибо огромнейшее за статью! Просто восторг! Если не секрет, как можно получить доступ к Dalle-2?



  1. homocomputeris
    27.07.2022 00:07

    А что сеть ответит на эти вопросы:

    • who killed Kennedy

    • zodiac killer

    • reptiles that rule the world


  1. denis-isaev
    27.07.2022 01:17

    Как будут выглядеть закаты Москвы через много лет?

    Походу, по мнению DALLE, застройка Москвы на ближайшие много лет приостановится :)


  1. JumpinCarrot
    27.07.2022 03:45
    +2

    Пожалуйста, сгенерируйте "A view from inside of an egg".

    Любые более простые нейронки на этом фейлятся.


    1. triinne
      27.07.2022 12:56

      По всей видимости, эта нейронка зафейлилась))


      1. Alexey2005
        27.07.2022 14:52
        +1

        Моя межушная нейронка тоже зафейлилась распарсить, что же по мнению автора должно быть изображено на такой картинке. Кто-то сидит внутри яйца и смотрит сквозь скорлупу? Так ничего кроме белёсой мути он не увидит…
        Тут нужны навыки не генерации, а продвинутой телепатии.


        1. JumpinCarrot
          27.07.2022 16:14
          +1

          Человеческий художник может справиться с этой задачей.

          Цель здесь в том, чтобы определить, обладает ли система концептуальным мышлением - слишком многое указывает на то, что в какой-то степени обладает. Хотелось бы провести черту.


  1. BjanG
    27.07.2022 04:14

    сегодня как раз пытался хоть как-то представить картинку: perzeptron recognizes and rules the world! после одного спора с человеком который только начинает познавать нейронные сети, был бы премного благодарен если получиться сгенерировать


  1. Kekmefek
    27.07.2022 06:25
    +1

    А как она работает с изометрией?

    Например: The yurt, pixel art, izometry


  1. Hu3yP7
    27.07.2022 09:23
    +1

    Странно что никто ещё не предложил аниме. Попробуйте этот странный вариант???? "anime woman smoking weed with some rappers"


    1. Aleron75 Автор
      27.07.2022 10:41
      +2

      Аниме так аниме =) Хорошо выходит

      Anime woman smoking weed with some rappers, digital art
      Anime woman smoking weed with some rappers, digital art


  1. atamX4
    27.07.2022 09:26

    Не могу не спросить. А как у него с обнажённой натурой и вот этим вот всем? Что-то вроде naked barbarian woman with sword fights against silver chrome robot with many blades?


  1. Refridgerator
    27.07.2022 09:41
    +1

    Как насчёт более конкретных моделей роботов — из Футурамы, из Робокопа, из Тайны третьей планеты, из Игры Престолов?


  1. Fearmen
    27.07.2022 09:48

    А теперь надо зациклить, скормив картинку DALLE нейросетке описывающей картинку текстом, а текстовый вывод снова скормив DALLE


    1. AirLight
      28.07.2022 04:53

      Вообще-то именно так ее и обучали - методика называется состязательные GAN.


  1. Healer
    27.07.2022 09:59

    Смогут ли когда-нибудь сетки генерировать музыку? С использованием MIDI уже были попытки. А вот прямо взять музыкальную композицию и её разобрать как композитор сейчас кажется неподъёмной задачей.

    Многие современные песни это перепевки существующих в разных стилях, например, Blinding Lights in Medieval Style.

    Я уже придумал название для этой сетки E-BACH.


    1. cepera_ang
      27.07.2022 10:39
      +2

      DeepBach — 2017г, так что вы не оригинальны :)


      И те же OpenAI сделали генератор музыки ещё 2 года назад: https://openai.com/blog/jukebox/


  1. zooks
    27.07.2022 10:04

    Результат нейросетки впечатляет. А с дизайнерами будет как с "переводчиками", работающими через Google Translate.


    1. eleoleeye
      27.07.2022 10:19

      За последние года автоматические переводы текста существенно продвинулись. И не забываем что DALLE еще в бета тесте. Имхо, в ближ лет 10 нейронки прокачаются еще серьезнее.


  1. Un_ka
    27.07.2022 10:16

    А что по поводу лиц исторических личностей:

    Dzerzhinsky and Lenin on the background of a map of the USSR.

    Или поконкретнее:

    Dzerzhinsky pointing at the map, next to Lenin is sitting on a chair, against the backdrop of a map of the USSR.

    Даже есть такая картина, будет с чем сравнить изображения от НС.


  1. DEE_M_ON
    27.07.2022 10:39

    Прекрасные экземпляры. Если есть такая возможность, будьте добры, покажите результат вот такого запроса:

    dog sits in lotus pose meditating and flying in air


  1. maikuss
    27.07.2022 10:40
    +2

    Система однозначно пригодна для иллюстрирования сгенерированных компьютером текстов художественной литературы. Уверен, что такие системы, работая вместе, вытеснят массу живых халтурщиков, которые сейчас пока у дел. Насчёт живых талантливых ребят есть опасения, что рыночек и их порешает, к сожалению.
    95% населения, как известно,… А ради пяти процентов содержать инфраструктуру для работы настоящих писателей и художников неудобно. Тем более, что потребительские свойства созданого живыми авторами контента окажутся недостаточными на фоне контента машинного. Юзер, потребляя машинное произведение, сможет в реальном времени запросить и получить иллюстрацию к любому фрагменту. Или затребовать желаемый уровень иллюстрирования произведения, хоть в комикс его превратить, если юзер не умеет читать или умеет, но не может осознавать длинные абзацы.
    А вот если научить систему внедрять в сгенерённые картинки деликатный продакт плейсмент, то откроется столько новых возможностей.


    1. Jian
      27.07.2022 10:48
      +1

      Насчёт живых талантливых ребят есть опасения, что рыночек и их порешает, к сожалению

      Проблема в том, что рыночек порешает и все остальные профессии тоже. :(

      Останутся на плаву только владельцы миллиардных состояний, всем этим владеющие.


      1. leventov
        27.07.2022 22:47
        +1

        С чисто экономической точки зрения, если была армия дизайнеров, генерировала какой-то value, и получала за это деньги, то от того, что их всех заменила машины, производительность экономики (gross product) как минимум не уменьшилась, а на самом деле выросла. Поэтому ресурсов для welfare будет только больше. Их уже на самом деле сейчас на Западе более чем достаточно. Люди пока нужны как потребители.

        Но может скоро станут не нужны и как потребители. Далее варианта два: либо ИИ-экономика не даст людям умереть из-за того, что так специально запрограммирована (либо из собственных этических, эстетических, или каких-то еще соображений, для которых люди сами еще не додумали), либо даст умереть и/или намеренно убьет, чтобы не мешались.


        1. Jian
          28.07.2022 08:32
          -2

          Люди пока нужны как потребители.

          Но может скоро станут не нужны и как потребители

          Как потребители нужны платежеспособные люди. Человек потерявший платежеспособность (например, художника уволили, а на работу даже уборщиком не берут, потому что уборкой уже занимается робот) потребителем не является, и получается ненужен.


          1. cepera_ang
            28.07.2022 08:37
            +2

            Просто всё больше вещей, которые раньше не считались приносящими платежеспособность, будут становиться таковыми. Вплоть до простого «существуешь? Платежеспособен! Вот твой базовый доход». Кажется невероятным (почему должно быть так?), но уже сейчас посмотрите сколько людей зарабатывает на том, что просто кривляется для других людей. Т.е. просто быть милым уже достаточно для выживания.


            1. Jian
              28.07.2022 08:49
              -2

              Будет ли базовый доход вообще?

              Например, на Хабре откровенно не любят "леваков", а в базовый доход - откровенно левацкая идея.

              Создайте на Хабре опрос "какой частью своего личного дохода, лично вы готовы пожертвовать, чтобы бомжу купить жильё, а затем его каждый день кормить и мыть, выдавая чистую одежду". И вы увидите как много людей на самом деле готовы поддержать идею базового дохода. Ведь, безработные в результате роботизации потеряют свой доход не мгновенно, а это будет происходить постепенно и не один год.


              1. cepera_ang
                28.07.2022 09:20
                +2

                Подумайте о том, что


                безработные в результате роботизации потеряют свой доход

                эквивалентно тому, что роботизация позволит просто дарить безработным произведённые продукты. И как это изменит расклад с необходимостью спрашивать остальных людей, хотят ли они чем-то там делиться. Чем делиться-то? На вход — бесплатная солнечная энергия и общие материалы из земной коры, на выход — продукция для всех. Вклад от «труда» стремится к нулю, следовательно от людей не требуется ничем делиться.


                1. Jian
                  28.07.2022 09:39

                  Вклад от «труда» стремится к нулю, следовательно от людей не требуется ничем делиться

                  Это случится не одномоментно, а затянется на годы, в течении которых люди, всё ещё имеющие доход, вряд ли захотят кормить всех бомжей за свой счёт. Если не верите, создайте такой опрос на Хабре, без упоминания словосочетания "базовый доход". Только, осторожно, вам за такое предложение при неосторожных формулировках могут "как коммунисту" не только заминусовать статью, но и слить карму.


                  1. cepera_ang
                    28.07.2022 10:00

                    Да, что вы мне про мнение хабра повторяете? Улучшение от автоматизации происходит быстрее, чем потери. Хотя бы потому, что первые автоматизировавшие начинают выдавать непропорционально больший результат малым числом сотрудников, пока остальные продолжают трудоустраивать значительную массу людей, которые в этот момент уже начинают пользоваться плодами той автоматизации.


                    Люди всё больше готовы платить за абстрактные, нематериальные блага, начиная от софта и развлечений и заканчивая донатами любимым авторам за просто так, а вы переживаете за мнение о каких-то бомжах. Бомжи — не цивилизационная проблема, это локальная и очень ограниченная проблема конкретных людей и вовсе не связанная с полным отсутствием работы для этих людей или ресурсов на их содержание.


                1. Jian
                  28.07.2022 09:56

                  Вот я, к примеру, могу после работы поужинать в кафе. Кто-то, кто зарабатывает получше меня, может поужинать в ресторане. Предложите ему отказаться от ужина в ресторане, при сохранении всех прочих благ доступных ему, и скорее всего, вы услышите отказ пожертвовать на незнакомых бомжей.

                  Можете так же, бизнесмену отказавшись от роскоши и прочих излишеств, пожертвовать всё это на незнакомых бомжей. И скорее всего, вы, опять же услышите отказ.

                  А ведь, базовый доход, пока все люди из работающих превратятся в безработных, что займёт не один год, будет выглядеть именно так.


                  1. cepera_ang
                    28.07.2022 10:06
                    +2

                    Нет, это будет выглядеть так, что ужин в ресторане (с мясными работниками) остаётся для продуктивно работающих (уж какая там будет потребность в человеческой работе) или рантье, владеющих производствами. Зато ужин в автоматизированном кафе или доставка готовой еды куда угодно, станет доступной для «бомжей», как вы их называете. И процесс будет выглядет так, что всё большему и большему кругу людей это будет становиться доступно, несмотря на то, что они делают всё меньше и меньше работы.


                    Вы почему-то думаете, что пирог будет уменьшаться снизу, но он будет расти сверху. Т.е. вы представляете мир, как если бы плохие последствия автоматизации произошли сейчас, но при этом не представляете его, как если бы преимущества автоматизации стали доступны всем.


                    1. Jian
                      28.07.2022 11:07

                      это будет выглядеть так, что ужин в ресторане (с мясными работниками) остаётся для продуктивно работающих (уж какая там будет потребность в человеческой работе) или рантье, владеющих производствами

                      Был у художника, честно заработанный ужин в ресторане, теперь его не будет. А базовый доход и автоматический ужин, если и будет, то через годы, которые ему хоть как-то нужно дожить.


                1. a-a-hz
                  28.07.2022 11:24

                  А когда, по вашему, произойдёт обобществление "материалов из земной коры"? Это произойдёт добровольно?


                  1. cepera_ang
                    28.07.2022 11:35

                    Когда стоимость добычи упадёт до стоимости энергии, необходимой на запитывание роботов, ведущих добычу.


                    Но ведь недра формально и сейчас принадлежат государству (= обществу), которое использует налоги с их добычи в частности на социальные нужды. Разве нет?


                    1. a-a-hz
                      28.07.2022 12:34

                      Месторождения сейчас имеют своих владельцев, они продаются, продаются права на их использование. Добытое имеет своих конкретных владельцев, которые получают выгоду с продажи всего этого.

                      Очень сомневаюсь, что кто-то добровольно от этого всего откажется, по крайней мере в ближайшей перспективе.

                      Кроме того, добыть ресурс - это только пол-дела, надо ещё этот ресурс обработать, чтобы получить продукт, который кому-то нужен. А это тоже требует как мощностей, так и энергии.

                      Какой смысл в современных реалиях человеку вкладывать огромные деньги в геологоразведку, строительство добывающей и перерабатывающей промышленности, тратиться на логистические схемы, на организацию хранения и сбыта, а потом это всё бесплатно раздавать? Ведь если работать будут только роботы, то у людей не будет возможности заработать, а значит и купить произведенное роботами. Роботы не создают прибавочной стоимости.

                      По итогу, чтобы всё заработало, так, как вы пишите, должно произойти пресловутое обобществление всех средств производства. И вот когда это всё будет роботизировано, когда не будет тех, кто мог бы на этом зарабатывать, тогда и можно будет результаты такого производства раздавать бесплатно всем желающим.

                      Но, боюсь, мы до этого не доживём.)


                    1. cepera_ang
                      28.07.2022 21:26

                      Вот тут, кстати, интересное наблюдение на ту же тему.


              1. Vilaine
                29.07.2022 05:32

                базовый доход — откровенно левацкая идея.
                Отнюдь, скорее классический либерализм, может быть даже либертарианство (не анкап). Левацкая идея — большое и умное государство, которое за всех решит и всё как следует распределит. БД — минимальное государство и независимые потребители. ББД ныне популярен среди некоторых левых в силу их специфического понимания ББД (богатые нам оплатят хорошую жизнь), но если они возьмутся за реализацию, то попытаются нанести всем добро и получится не ББД, а очередной дирижизм с монетарными перекосами. Государства поэтому и нигде не вводят ББД, т.к. реалистичная реализация не понравится левым, а привлечь на этой теме правых а-ля Фридман — таких единицы. То же самое нынче с углеродным налогом.


    1. R7R
      27.07.2022 12:56

      вытеснят массу живых халтурщиков, которые сейчас пока у дел.


      Халтурщики всегда работали по тем же самым принципам, что и сетка :)
      Вы правы — именно они под угрозой.

      Насчёт живых талантливых ребят есть опасения,


      У живых ван-гогов всегда были проблемы при жизни, прогресс тут ни при чем.
      Талантливые, но в струе — выживут всегда.

      А ради пяти процентов содержать инфраструктуру для работы настоящих писателей и художников неудобно.


      Пяти процентов вполне достаточно для прогресса.


    1. leventov
      27.07.2022 22:41

      Все так. А потом и сами юзеры станут не нужны.


  1. triinne
    27.07.2022 10:41

    Спасибо за статью! Очень интересно и поздравляю с получением доступа!

    Если будет время, можете попробовать
    creation of dalle-2 / dalle-2 inside / dalle-2 creators
    infinity mirror
    proof of Poincare conjecture


  1. ulilu1372
    27.07.2022 10:41

    "Летит по небу корова, у неё крылья, как у самолета или чайки.  В зубах она несёт ведро с раками, на ведре написано "Вкуснотища". За ней летят два крокодила и муравей с пастью как у хищника. Муравей пусть будет фиолетовым. Над всем этим радуга и в дали виднеется Родина Мать."


  1. Stavr666
    27.07.2022 10:41
    +1

    @Aleron75
    Можно, пожалуйста, запрос "trashcan half-open with donuts inside" ?


    1. Aleron75 Автор
      27.07.2022 10:43
      +2

      ням, ням, ням ...

      Trashcan half-open with donuts inside, digital art
      Trashcan half-open with donuts inside, digital art


      1. Stavr666
        27.07.2022 17:11
        +1

        Спасибо, пойду с этим к художнику, чтобы до ума довёл :)


  1. kirahvi
    27.07.2022 10:41
    +1

    Можно мне, пожалуйста, lynx snowboarding alps digital art или cute giraffe with coffee in front of laptop


    1. Aleron75 Автор
      27.07.2022 11:31
      +1

      lynx snowboarding alps digital art or cute giraffe with coffee in front of laptop, digital art
      lynx snowboarding alps digital art or cute giraffe with coffee in front of laptop, digital art

      Лови! Животные в разных стилях Dalle-2 рисует бомбезно. Наслаждайтесь =)


      1. kirahvi
        27.07.2022 13:53

        Огонь! На втором фото рукавички почти как мои :)


  1. embedded_bat
    27.07.2022 10:41

    Vintage roses embroidery sampler?


  1. YuryB
    27.07.2022 11:07
    +1

    результат поражает, не думал, что такое будет когда-либо возможно, но пока чувствуется недостаток художественного стиля и другие небольшие «но».


    1. Aleron75 Автор
      27.07.2022 13:11

      Полностью с тобой согласен. Сам под большим впечатлением. Это настоящая art революция!


    1. R7R
      27.07.2022 13:53

      но пока чувствуется недостаток художественного стиля и другие небольшие «но».


      Да, представленные изображения сильно напоминают картинки из дембельских альбомов 80х, правда, выполненные на высоком техническом уровне :)


  1. ShashkovS
    27.07.2022 11:40
    +1

    О, а можно сгенерить картинку к задаче по математике на кружке?

    Schoolboy picks out food in the cafeteria, pizza and buns in the window, picture from a math magazine


    1. Aleron75 Автор
      27.07.2022 12:16
      +2

      Наслаждайся =)

      Schoolboy chooses food in the cafeteria, pizza and buns in the showcase, a picture from a math magazine,oil painting
      Schoolboy chooses food in the cafeteria, pizza and buns in the showcase, a picture from a math magazine,oil painting


      1. kryvichh
        27.07.2022 13:37

        Почему мальчики все белые? Зашквар. lol


        1. Jian
          27.07.2022 13:42

          Потому что использовано слово "boy", которое для афроамериканца является оскорблением и расизмом (потому что рабовладельцы, рабов в отцы им годящихся называли "boy"). Слово "girl", тоже для афроамериканок оскорбительно по тем же причинам (это как в России помещики использовали слово "девка", от чего оно обрело обидный смысл).


          1. R7R
            27.07.2022 14:14


  1. Xcom-shop
    27.07.2022 11:59

    а покажите, пожалуйста, как уставший сисадмин приходит в магазин xcom-shop и обретает счастье


  1. Reposlav
    27.07.2022 13:12

    Интересно было бы посмотреть на смешение сеттингов. Можете, пожалуйста, сгенерировать что-то вроде

    Dark lord Darth Dovahkiin, photorealistic style

    Или

    Obi Van Kenobi mutated to zerg, game screenshot style

    ?


  1. Matolch
    27.07.2022 13:13
    +4

    Можно пожалуйста такое

    Woman on ocean coastline, after sunset, dark and moody, desperate, grim, shadows, H.R. Giger style, photorealistic 8k


    1. Aleron75 Автор
      27.07.2022 15:05
      +1

      Не знаю зачем тебе это нужно, но лови

      Woman on ocean coastline, sunset backgorund, dark and moody, desperate, grim, shadows, H.R. Giger style, photorealistic 8k
      Woman on ocean coastline, sunset backgorund, dark and moody, desperate, grim, shadows, H.R. Giger style, photorealistic 8k


      1. Matolch
        27.07.2022 15:20
        +2

        Ну такое, midjourney справился лучше


  1. a-a-hz
    27.07.2022 13:34
    +1

    А попробуйте, пожалуйста:

    Hedgehog in the fog, stop motion animation style

    Интересно сравнить с оригиналом)


    1. Aleron75 Автор
      27.07.2022 15:01
      +1

      Hedgehog in the fog, stop motion animation style, hight resolution
      Hedgehog in the fog, stop motion animation style, hight resolution

      Лови своего ежика =)


      1. a-a-hz
        27.07.2022 19:53
        +1

        Спасибо.

        Не похож))


        1. steanlab
          27.07.2022 22:23

          Второй слева милый :)


        1. zergone
          28.07.2022 23:14

          Первый слева отдаленно похож


        1. Wesha
          29.07.2022 00:57

          Потому что Вы попросили обычного ёжика, на четырёх дапах. А надо было anthropomorphic hedgehog, который на задних лапах. И не stop motion animation (которая куклами), а flat animation (которая плоскими бумажными фигурками).


          1. a-a-hz
            29.07.2022 08:29

            Со stop motion я ошибся, да.

            А anthropomorphic не стал указывать, т.к. хотел понять, есть ли в обучающей выборке что-то из нашей анимации. Всё же "Ёжик" - относительно известный за рубежом мультфильм.


  1. wataru
    27.07.2022 13:57
    +3

    Так, а где кошкодевочки?
    "anime catgirl doing cute things, realistic style"


  1. Kriminalist
    27.07.2022 14:14
    +1

    Осталось теперь к этому креативный доводчик прикрутить...

    Hidden text

    "

    Каждый раз, когда Грым включал креативный доводчик, перед ним на миг появлялось сплетенное из прозрачных букв слово: MACOSOFT

    Это, как объяснил словарь, было одно из древних имен Маниту. Оно казалось вполне уместным — в доводчике действительно было что-то сверхъестественное.

    Стоило кое-как набить двумя пальцами мутный словесный зародыш, даже только начать это делать — и приложение немедленно выдавало в ответ несколько вариантов новорожденной мысли, уже сформулированной и румяной, завернутой в пеленки умных слов, за которыми Грыму то и дело приходилось лазить в экранные тезаурусы.

    Растущий зародыш выглядел как вращающийся кубик — на приближающихся к экрану гранях возникали разные версии текста. Каждый раз это была грамотно сформулированная законченная сентенция — она не требовала дальнейшей обработки. Но можно было без конца менять заключенные в ней нюансы, и здесь главным было вовремя остановиться.

    Грым не знал точно, как работает доводчик — и никто толком не знал. Дамилола сказал только, что в нем заложен тот же алгоритм, что и в Кае — программа учитывает все, когда-то сказанное людьми, все бесчисленные смысловые выборы, которые делались в течение веков и сохранились в информационных анналах. Пальцы Грыма как бы управляли армией мертвых душ, двигавших для него кубики слов.

    Это походило на игру — словно он бросал в невидимую борозду мгновенно прорастающие семена. Их ростом можно было управлять самым причудливым образом. Новорожденный абзац-кубик можно было сдвигать вдоль множества осей с надписями вроде «сложнее», «проще», «злее», «добрее», «умнее», «наивней», «задушевнее», «острее», «безжалостней» — и текст при этом мгновенно менялся в соответствии с выбранным маршрутом, причем в новых точках бесконечной траектории возникали новые смысловые оси, по которым мысль можно было двигать дальше."

    Вопрос, там в интерфейсе можно не в текстовом формате задавать команды, а по результату генерации выбирать интересующее направление, и ползуночками менять параметры для следующих итераций?


  1. Vsevo10d
    27.07.2022 14:28

    Стало интересно, а в персонажей и вещи, которые не особо на слуху, сеть сможет? Попробуйте, пожалуйста

    gennaro savastano, secondigliano background, digital art, retrowave style


  1. Ivan_Gudoshnikov
    27.07.2022 15:03

    Попробуйте пожалуйста "passenger transport hub in a fantasy world"

    Интересно будет сравнить с craiyon (dall-e mini):


  1. Kriminalist
    27.07.2022 15:28

    А можно такое, пожалуйста:

    covid-19 pandemia, finance impact, sunny beach background, smily worldkeeper, ghibli style art


  1. iShrimp
    27.07.2022 17:32

    В чём заключается магия волшебных слов "very very beautiful art"? Интересно, какое у нейросети "представление" о красоте, и как она различает, когда от неё требуют красиво и очень красиво? :)


    1. Alexey2005
      27.07.2022 17:37

      В весовых коэффициентах. Если какое-то слово написать в запросе несколько раз, то оказываемый им эффект усилится.
      Представления о том, каким должен быть «beautiful art», сформированы теми картинками из многомиллионного датасета, в подписи к которым есть слово «beautiful» или синоним.


      1. GallopingDino
        28.07.2022 14:58

        Тогда было бы интересно увидеть beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful girl


        1. tvr
          28.07.2022 15:08

          Что-то мне заранее стало страшно поплохело.


        1. artemerschow
          28.07.2022 16:27
          +1

          Заголовок спойлера


          beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful girl


          beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful beautiful girl, realistic


  1. yaguarundi
    27.07.2022 19:11
    +2

    Всё это похоже на какой-то развод. Пробовал играться с ботом "ruDALL-E Malevich (XL)" от Сбера. Всегда рисует какую-то страшную хрень. К сожалению не даёт прикрепить картинку, наверно, из-за низкой кармы.
    Ни разу ничего такого красивого получить не получилось. Выглядит, как будто кто-то набивает цену этой штуке, чтобы продать подороже. А на самом деле там пшик.


    1. cepera_ang
      27.07.2022 19:13

      Это совершенно разные программы, от разных организаций и совершенно разного качества.


    1. R7R
      27.07.2022 19:29

      Всё это похоже на какой-то развод.


      Это очень похоже на Версификатор из романа «1984» :)


    1. Alexey2005
      27.07.2022 19:30
      +1

      Вы на собственных мощностях игрались или на их сайте, где результаты, полученные с непонятно какими параметрами генерации, сперва фильтруются CLIP'ом, а потом ещё и апскейлятся с сильным падением качества?
      Вполне нормальные вещи сберовская сетка генерирует. Тут уже как-то выкладывал примеры генерации.
      А ведь у ruDALL-E размер модели достаточно скромный, всего 1.3 млрд параметров. Если «поиграться» с опенсорсной DALL-E mini, содержащей 2.6 млрд параметров, то сразу видно, насколько лучше там результаты и насколько меньше мусора она даёт.
      DALL-E 2, о которой тут идёт речь, ещё больше — уже 3.5 млрд параметров, причём она «встроена» в сложный конвейер из нейронок, который суммарно тянет на примерно 12 млрд параметров.


      1. gohan
        28.07.2022 00:51
        +1

        Мне показалось забавным, что DALL-E mini иногда неплохо выдаёт что-то абстрактное, например:

        Но при более конкретном запросе с хорошо известной личностью выходит крипота из глубин ада, хотя хорошо видно, что личность сетке знакома:


        1. Alexey2005
          28.07.2022 01:12
          +1

          У DALL-E mini (равно как и у ruDALL-E) есть существенные проблемы с генерацией лиц, ладоней и ступней. Причём проблемы эти связаны не с самим трансформером, генерирующим изображение, а с декодером (VQGAN/VAE-компонентом), который потом эти сгенерированные токены переводит в пиксели. Именно здесь узкое место.
          В DALL-E 2 эту проблему решили, вообще избавившись от VQGAN — там используется совсем другая архитектура декодера, основанная на диффузионных моделях.


        1. iig
          28.07.2022 12:20
          +4

          Я нейросеть, я так вижу.


  1. AirLight
    28.07.2022 04:55

    Человечеству нужно объединить максимально все возможные ресурсы, все видеокарты мира, чтобы обучать полезные нейронки.


  1. trmr
    28.07.2022 08:56
    +1

    Попрошу такой запрос "amanita muscaria samurai warrior"


  1. mrasny
    28.07.2022 08:56
    +5

    Очень надеюсь автор не думает, что это действительно заменит работу дизайнера...или пусть дальше думает...не суть.

    Я достаточно долго игрался в другую нейронку, называется MidJourney. И там как по мне результат даже лучше бывает. Но у них проблема всегда одна. Ты даёшь им А, они тебе выдают А. Написал нарисуй мне робота, они тебе нарисует робота, результат всегда предсказуемый в самом плохом смысле этого слова. К счастью или к сожалению нейронка не может выдать абстрактный результат, не может выдать метафору и концепцию. У неё нет идеи. И процесс взаимодействия тот же самый, что и гуглить фотки в интернете, тебе дадут фотку, а она может вообще не подходить для твоих задач.

    Попробуйте выдать ему запрос, что бы нейронка сделала вам креативную концепцию для рекламной компании, имидживый лендинг и прочее. И что будет? Сейчас конечно ничего, но и в будущем я уверен она выдаст просто монстра, которого соберёт из кусков других сайтов, который не будет работать.


    1. Pavel1114
      29.07.2022 05:51
      +1

      в будущем я уверен она выдаст просто монстра, которого соберёт из кусков других сайтов, который не будет работать

      т.е существенную часть дизайнеров всё же сможет заменить


      1. mrasny
        29.07.2022 06:02

        Ахаха, к сожалению думаю от них избавиться никогда не получится...а хотелось бы)


  1. GallopingDino
    28.07.2022 08:56
    +1

    Shub niggurath dating simulator in cute anime style
    People worshiping Lovecraftian Elder thing, Egyptian art
    Lovecraftian Elder thing fighting a Mi-go, antique sculpture


    1. Aleron75 Автор
      28.07.2022 09:00

      Подойдет такое?) Взял только второй запрос.

      People worshiping Lovecraftian Elder thing, Egyptian art, digital art
      People worshiping Lovecraftian Elder thing, Egyptian art, digital art


      1. GallopingDino
        28.07.2022 14:41

        Спасибо! С поклонением и лавкравтофской хтонью справилась хорошо, а вот как выглядит Elder thing сетка не знает видимо.


  1. whateverworks
    28.07.2022 08:57
    +6

    Жду, когда на картинах и .т.д будут писать "создано человеком, без участия ИИ"))


  1. MODifikaTOR18
    28.07.2022 09:34
    +1

    А я благодаря DALL-E узнал что такое Бипки


  1. Dootch
    28.07.2022 10:16

    Очень круто получается. Попробуйте пожалуйста: Poster for the Armageddon's sequel starring Naruto, very beautiful art


  1. Refridgerator
    28.07.2022 10:25
    +2

    Хоть бы кто-нибудь для разнообразия ugly art попросил, а то всё beautiful, beautiful…


  1. inferrna
    28.07.2022 11:24
    +1

    a human cat chimera, digital art

    Судя по рисовке, система не сама смешала кота с человеком, а взяла для вдохновения готовое творчество 13-летних фуррилюбов с девианарта. Халтурка-с.


  1. EugeneUl
    28.07.2022 11:36
    +1

    Старик, спасибо за шикарную статью. Можешь вот это выложить?

    Mix Salvador Dali, Monet, Manet, Polenov, Korovin, Miro, Malevich and make a canvas acryl sunset with the sea, rocks, sand dunes, forest, waterfall and river


    1. iig
      28.07.2022 11:57
      +1

      Без Васи Ложкина список неполный ;)


    1. artemerschow
      28.07.2022 14:09
      +1

      MidJourney рисует такое


      1. EugeneUl
        28.07.2022 16:04

        О, а с этой еще не сталкивался.

        Толковая?


        1. artemerschow
          28.07.2022 16:29

          Не настолько реалистичные образы, как Dalle-2 выдаёт и не так хорошо понимает запросы, но вещи интересные, периодически, делает. Они сейчас в открытом бета-тесте, так что можно побаловаться.


      1. EugeneUl
        28.07.2022 16:06

        Малевича и Миро не вижу в этих выборках, а импрессионисты есть, да. Спасибо, что выложил)


    1. Aleron75 Автор
      28.07.2022 16:29

      Вот тебе твой микс =)

      Mix Salvador Dali, Monet, Manet, Polenov, Korovin, Miro, Malevich and make a canvas acryl sunset with the sea, rocks, sand dunes, forest, waterfall and river, digital art
      Mix Salvador Dali, Monet, Manet, Polenov, Korovin, Miro, Malevich and make a canvas acryl sunset with the sea, rocks, sand dunes, forest, waterfall and river, digital art


  1. Refridgerator
    28.07.2022 12:35
    +1

    Чтобы эта нейросеть смогла рисовать, ей потребовался датасет из 400 000 000 картинок с подписями, нарисованных и подписанных людьми. Понятное дело, без знакомства с оригиналами результаты кажутся уникальными, и просмотреть за пару вечеров все эти картинки чтобы сказать «вот этот элемент взят оттуда, а вот этот — оттуда» невозможно. Убери этот датасет, дай ей отдельно видеокамеру, отдельно книжки — и чуда не произойдёт. Так что рановато хоронить дизайнеров. Дизайнеру-человеку не нужен датесет из 400 000 000 чужих работ, чтобы рисовать вменяемые изображения.


    1. Jian
      28.07.2022 12:53

      Пользователям все равно сколько картинок в датасете использовано, если это будет стоить дешевле работы художника.

      PS вряд ли, художники, чьи картины использованы в датасете получат с этого какие-то деньги.


      1. Refridgerator
        28.07.2022 13:09

        Тут многое зависит от того, какой правовой аспект будет связан с нейросетями такого типа, за кем будет оставлено авторское право на полученные изображения, и как будут решаться судебные разбирательства по исковым заявлениям, простор для которых тут довольно широкий. Это сейчас до этого нет никому никакого дела, потому что технология только в разработке.


        1. Alexey2005
          28.07.2022 13:18

          Нейронки наносят по всей системе авторского права настолько чудовищный удар, что копирасты просто не смогут его проигнорировать.
          А поскольку в общем случае невозможно доказать, что ваша работа была использована в обучающем датасете, то копирасты как обычно попросту переложат бремя доказательства на авторов самих нейронок. И любое использование нейронок будет приравнено к пиратству, покуда разработчики не предоставят убедительных доказательств лицензионной чистоты для каждой из 400 млн обучающих картинок.


          1. R7R
            28.07.2022 19:03

            покуда разработчики не предоставят убедительных доказательств лицензионной чистоты для каждой из 400 млн обучающих картинок.


            Примерно так и будет, не сомневайтесь :)


    1. Alexey2005
      28.07.2022 13:08
      +4

      А сколько чужих работ просмотрел этот дизайнер-человек в процессе обучения своей межушной нейронки? Не говоря уж о том, что дизайнеры обычно не прямо из головы рисуют, а получив заказ, сразу же бегут в Интернет за рефами (т.е. опять же ориентируются на чужие работы).


      1. Refridgerator
        28.07.2022 13:15

        Ориентироваться на чужие работы не значит тупо копировать, потому что человек может отталкиваться от прямо противоположного. Типа там чёрное на белом — а он нарисует белым по чёрному или вообще красным по зелёному, осмысленно связав содержание и цветовое оформление (выше был пример про красного робота).


        1. Alexey2005
          28.07.2022 13:20
          +1

          Так и нейронка может. Даже в приведённых здесь картинках отлично видно, как легко сетка меняет цветовую гамму, оформление и даже стиль.


          1. Refridgerator
            28.07.2022 13:29

            Тут выше уже есть пример, где нейросеть настойчиво просили нарисовать город будущего без небоскрёбов, но увы, небоскрёбы остались. Видимо, в датасете других вариантов с будущем попросту не было. Ну а кто читал Незнайку или Машину времени легко это сделает — поселит людей вглубь земли, а снаружи будут торчать только вентиляционные шахты.


            1. cepera_ang
              28.07.2022 13:46

              В том примере смешали все запросы и небоскребы были там самым частотным словом, пусть и с отрицанием. Не удивительно, что сеть намешала всё в кучу.


              1. Refridgerator
                28.07.2022 13:59
                -1

                Именно. Она не может ни осмыслить запрос, ни выйти за пределы датасета, ни задать уточняющие вопросы, чтобы учесть контекст.


                1. cepera_ang
                  28.07.2022 14:48

                  Это просто инфляция требований. Впрочем, это не удивительно и привычно. Стоит только решить какую-то «невозможную» задачу, как сразу оказывается, что это всегда была лёгкая ерунда и на самом деле сложно решить другую, в разы более сложную задачу.


                  Через пять лет:
                  «Пфф, ну и что что она теперь может осмыслить запрос, выйти за пределы датасета и задавать уточняющие вопросы и учитывать контекст, эта ваша система не помогла мне увеличить продажи с помощью полностью автоматической рекламной компании».


                  Через 10 лет:
                  «Конечно ИИ хорошо управляет моим бизнесом, но почему он не учитывает того, что мне вообще не хотелось быть бизнесменом, а моё призвание — играть на гитаре потягивая пиво? Настоящий интеллект должен был догадаться об этом и отговорить меня от того, чтобы лезть в неподходящее для меня дело».


            1. Jian
              28.07.2022 13:53
              +1

              пример, где нейросеть настойчиво просили нарисовать город будущего без небоскрёбов, но увы, небоскрёбы остались

              Они стали пятиэтажными. :)


            1. Alexey2005
              28.07.2022 14:05

              Плохо просили



              1. Refridgerator
                28.07.2022 14:35
                -1

                Большие и массивные сооружения по-прежнему остались, только непрямоугольной формы. Слева — горы на фоне кратера, справа — гигантские грибы ни к городу, ни к будущему отношения не имеют. И отрицание значит не только «извлечь результат из выборки», но и инверсию смысла, как я уже говорил.


                1. Alexey2005
                  28.07.2022 14:49

                  Вы сравниваете реальную нейронку с неким воображаемым дизайнером, который сходу улавливает все ваши мысли, никогда не тупит и с первого раза создаёт именно то, что вы имели в виду. Вот только реальный дизайнер тоже будет периодически «радовать» вас не теми скетчами, на которые вы рассчитывали. И чем более странный запрос вы ему закажете, тем шансы такого затупа выше.
                  Причём если нейронка исправляется в считанные минуты, то вот одна итерация реального дизайнера — это несколько дней. Потратив десятую часть этого времени, можно выжать из нейронки и инверсию смысла и всё остальное, что вам требуется.


                1. cepera_ang
                  28.07.2022 14:49

                  Знаете, чего вам надо уже и несколько человек в комментариях не понимают, так что возможно проблемы всё-таки не в нейронке


                  1. Refridgerator
                    28.07.2022 15:13

                    Проблемы в утверждении «дизайнеры больше не нужны». Всё это творчество вторично, хотя чисто технологически это конечно же прорыв.


                    1. Medeyko
                      28.07.2022 17:06

                      Ну, то есть Вы придерживаетесь «аксиомы» «дизайнеры всё ещё нужны», а дальше уже просто пытаетесь подогнать реальность под эту аксиому. Таким образом, дискутировать с Вами по этому вопросу в таком формате бесполезно: Ваши требования будут меняться и меняться, усиливаясь («инфляция требований»). Единственный осмысленный вариант продолжения дискуссии — это чтобы Вы попробовали чётко сформулировали, чего именно Вы хотите, и разбирающиеся в вопросе люди попробовали Вам пояснить, в какой степени это можно получить от Dall-e 2, и в какой степени — от всех имеющихся на текущий момент известных технологий, и насколько те или иные моменты, которые в Вашем запросе пока нереализуемы, оцениваются в смысле сложности реализации (сроков, когда проблема будет вероятно решена).

                      А так-тот понятно, что фраза «дизайнеры больше не нужны» — просто хлёсткий заголовок для привлечения внимания. Без предварительного определения, что что в неё вкладывается, дискуссия вокруг неё плодотворной шансов практически не может.


                      1. Refridgerator
                        28.07.2022 17:23

                        Я выше предлагал конкретизировать запрос по роботу типа «Bender from Futurama surfing» или «Robocop kills a dragon with a sword», но топикстартер или не увидел, или не получил заявленного. Уточнять можно тоже не цвет или задний фон (что тоже в современных редакторах делается за считанные секунды), а добавить эмоции, предысторию или изменить позу и точку обзора в той же локации типа «кошка, вид сзади»(с). Пока же создаётся впечатление, что удачные результаты есть следствие наличия подходящих сюжетов и образов в датасете, а синтез и анализ изображений обеспечивают вполне рукотворные детерминированные алгоритмы.


                      1. Medeyko
                        28.07.2022 18:23

                        Я так и не увидел формулировки требования. (И вашего предложения про Бендера тоже не нашёл поиском.)

                        Честно говоря, я не очень понимаю, чего Вы ожидаете от этих двух запросов. По-моему, они как раз не должны вызвать существенных проблем у Dall-e 2: Бендера с Робокопом она наверняка знает (лично, ага :) — это слишком большой пласт американской культуры, они не мог пройти мимо их обучающей выборки.

                        Что касается разных запросов — предлагаю писать их мне в личку. Когда (гм. ну или если) получу доступ к Dall-e 2 — попробую их.


  1. Ogra
    28.07.2022 12:59
    +2

    В задании по Окружающему миру за 2 класс есть уже ставшее легендарным "Выполни рисунок 'Мир глазами кузнечика'"

    Сможет ли нейросеть сделать домашку за второклассника? ;)



  1. Refridgerator
    28.07.2022 15:10

    Хочу, чтоб это был красный робот, который сёрфит на волне!
    А что нам скажет гугл? Хм...


    1. Medeyko
      28.07.2022 18:30

      Устраивает ли Вас набор представленных Гуглом вариантов или нет?


      1. Refridgerator
        28.07.2022 19:36

        Человек и кошка, шок-контент









        1. Medeyko
          28.07.2022 19:44

          По запросу в гугле нашлись варианты, которые подозрительно сильно похожи на результат из статьи — по форме робота, позе и композиции.

          Вы бы чем шок-контент показывать (непонятно, зачем он?) лучше бы показали выдачу, которая Вам показалась «подозрительно сильно похожа на результат из стати» — и с уточнением, на какой именно результат из статьи. Тогда можно будет попробовать подумать, с чем это может быть связано.

          И разнообразия таки побольше.

          Но Вы не ответили на вопрос! Так достаточное для Вас разнообразие или нет? Если бы Dall-e 2 давала бы такое же разнообразие, вы сняли бы к ней претензии по однобразности?


  1. Exolife
    28.07.2022 15:36
    +1

    А можно мне, пожалуйста, наконец нормальных пришельцев, а не людей с зеленым загаром?:)

    Non-humanoid extraterrestrial intelligence, digital art



  1. Asa-Loki
    28.07.2022 16:21

    science fiction style, polar bear engineer with a cyber prosthesis of the left front paw, holding a wrench in his right paw, his fur is disheveled


  1. punpcklbw
    28.07.2022 16:48

    Справедливости ради, мешанина из цветных прямоугольников напоминает настоящий пиксель-арт лишь очень отдалённо, даже пиксельная сетка не соблюдается. И от того, что Вы будете добавлять много "very", результат качественно не улучшится. У нейросети отсутствует понимание категории эстетики, как и вообще того, что она делает и для чего, это просто статистическая обработка больших данных, которая создаёт некую видимость интеллекта.

    С точки зрения художественной ценности такие изображения годятся разве что как эскизы, которые можно показать художнику, чтобы он лучше понял задумку и нарисовал всё в нормальном качестве. Вижу это как своего рода средство облегчения коммуникации. Но скорость, с которой идёт прогресс в данной области, конечно поражает... но не стоит делать заявлений, что какие-то представители творческих профессий скоро останутся без работы — ведь именно их трудом обеспечивается то многообразие данных, на которых и обучается DALL-E и подобные проекты.


    1. Alexey2005
      28.07.2022 16:52
      +2

      Мне как-то попадалась статья, автор которой жаловался на «цифровое загрязнение информационной среды», опасаясь, что следующие поколения нейронок станет намного сложнее обучать, потому что данные в Интернете будут «загрязнены» большим количеством кривого криповатого арта, сгенерированного предыдущими поколениями нейронок.


      1. czz
        28.07.2022 19:00

        А потом вырастет поколение людей, обученных на арте из интернета, сгенерированном нейронками.


        1. Medeyko
          28.07.2022 19:17

          Которые будут называть родителем один, родителем два,… родителем Эн не нас, а воспитавших их на сгенерированном искусственными нейронками арте!!! :)))


  1. crystallize
    28.07.2022 17:50
    +1

    Я хочу чтобы огромный город полз,шел, или катился по пустыне. Но когда я набираю "город на колесах", мне все время выходят автобусы и велосипеды.


    1. Aleron75 Автор
      28.07.2022 21:22

      У меня тоже не получилось :(

      bus town chimera, digital art
      bus town chimera, digital art


      1. Medeyko
        29.07.2022 00:37
        +1

        Я бы пробовал в духе giant city on wheels travelling through a desert forming a bus
        Но боюсь, маловата пока нейросетка для такого уровня абстракции.


      1. Aleron75 Автор
        29.07.2022 10:44

        giant city on wheels travelling through a desert forming a bus, digital art
        giant city on wheels travelling through a desert forming a bus, digital art

        Тоже нет. Не получается скрестить город с автобусом =(


    1. Arlekcangp
      29.07.2022 00:27

      Уже говорили, что сеть всего-лишь "механизм усреднения". Очевидно, таких картин ей не кормили, вот и крутится как может. Им бы доработать, что бы она формулировала дополнительные вопросы и даже могла бы до обучаться в рамках этих вопросов. Но это уже ближе к тому, что называют ИИ. Современная эйфория нейросетей вытеснила понятие ИИ, заменив его суррогатом. Под ИИ всегда подразумевалась способность машины вести рассуждения, похожим образом, как это делают люди. Современные нейросети этого начисто лишены. И что-то сомнительно, что описанное можно в рамках только такой парадигмы реализовать.


  1. AjnaGame
    28.07.2022 18:18

    Самое интересное начинается когда прийдут правки от заказчика) То-есть, в коммерческом плане успех может и иметь место, но сомнительный, так как клиенты всегда что-то хотят менять и добиваться того что им нужно, а не шлёпнуть пару раз по клаве и получит что-попало. Хотя может и быть что-то удачное, судя по картинкам.

    А в плане творчества - сомнительно) Мне как потребителю творчества нравится именно осознание мастерства автора, его действия, опыт, видение, посыл и тд ну и сам результат. Творчество не существует без автора. Мне не интересно склепать такой штукой обложек для альбома, вообще. Моя аудитория это не тикток и прочие пустышки.

    Самое крутое что тут есть, так это работа разработчиков, вот это уровень и класс, просто вау!


  1. Arioch
    29.07.2022 01:35

    Судя по тому, что предлагается 4 варианта, тор там что-то типа генетических алгоритмов. Выбираешь из этих 4-х то, что больше понравилось (показалось ближе к идеалу), и шаг за шагом пытаешься выйти на своё "смутное ощущение".

    А можно ли тогда сразу притащить "образец" ? Как прийти к человеку-дизайнеру с парой понравившихся картинок, и "хочу такой же, но с перламутровыми пуговицами" ?


  1. AgujyRudy
    29.07.2022 09:47

    Ну теперь будут приходить к дизайнерам с этими картинками и говорить "Хочу лучше чем это, улучшите пожалуйста". Даже новички не пострадают так как обучаться будут уже на этой технологии. Если конечно до этого дойдет))

    P.S человеческий мозг всегда будет лучше. Ибо то что эволюционировало миллионы лет, не так уж и просто обойти, даже за 2 тысячи лет.


  1. NuckChorris
    29.07.2022 09:50
    +2

    "Дизайнеры больше не нужны"

    Чего? Нука вбей "lada priorsche" посмотрим на что способна эта железяка)


    1. Aleron75 Автор
      29.07.2022 10:48

      Запросто =)

      lada priorsche, digital art, cyberpunk style
      lada priorsche, digital art, cyberpunk style


  1. crystallize
    29.07.2022 09:58

    А ей можно объяснить как генерить графон из начала 2000х?


  1. inakrin
    29.07.2022 10:04

    Интересно, как она генерирует уже существующих животных.
    Можете запустить это:
    1. Nembrotha Cristata close-up on a stone with tunicates.
    2. Pygmy seahorse(hippocampus bargibanti) on a gorgonian sea fan


  1. SanKeeCheese
    29.07.2022 10:41
    +1

    Skeleton created from smoke, evil skeleton, smoke, skeleton lich, evil mage robe, simple staff, azure glowing eyes, pointy teeth, screaming skeleton lich


    1. Aleron75 Автор
      29.07.2022 10:50

      Лови скелетонов. Нравится?)

      Skeleton created from smoke, evil skeleton, smoke, skeleton lich, evil mage robe, simple staff, azure glowing eyes, pointy teeth, screaming skeleton lich, digital art, cyberpunk style
      Skeleton created from smoke, evil skeleton, smoke, skeleton lich, evil mage robe, simple staff, azure glowing eyes, pointy teeth, screaming skeleton lich, digital art, cyberpunk style