23 февраля 2021 года разработчики из MESS Lab (университет Нью-Йорка) открыли в общий доступ проект «Этот код не существует» (this code does not exist). На сайте doesnotexist.codes выводится листинг части кода на C/C++. Пользователю предлагается угадать — это настоящий код или его фрагменты были получены в результате работы нейросети GPT-2, обученной на 774 млн строк кода из 10 тыс. самых популярных пакетов Debian. Настоящие фрагменты кода также были взяты из того же набора пакетов.
Нейросеть каждый раз генерирует новые примеры кода, путем запроса модели со 128 байтами из случайного файла исходного кода C/C++ из пакета Debian, не входящего в число первых 10 тыс. строк, на которых она обучалась.
Этот проект фактически является продолжением серии проектов "This X Does Not Exist", где нейросети создают различные вариации чего-либо (картинки, стихи, визуальные образы), которых на самом деле нет.
A0Zi4K
Тут иногда в реальности такой код увидишь, что первая мысль возникает, что «такой код не существует», а потом «а нет, вот же вполне реальный код, на котором проект проработал лет 5».
MaratFakhrutdinov
И его написал ты сам несколько лет назад