Была ночь, огни Бориспольской трассы пролетали мимо окон такси. Водитель выключил музыку, невыносимо давившую мне на мозг после тяжелого перелета, и, чтобы не заснуть, начал говорить.


Сначала, конечно, о политике, «довели страну», и все в таком роде, потом о чем-то личном. Я тоже не хотел отключаться прямо на переднем сидении, поэтому пытался его слушать.


—… И тогда нам всем придет конец, — донеслись до меня обрывки фразы. — Точнее только им, не мне. Я надежно подстраховался. Когда их всех: водителей такси, маршруток, даже трамваев выкинут на улицу, меня уже там не будет. Я буду сидеть в тепле, пить кофе и громко-громко смеяться.


— Почему-почему их выкинут на улицу? — заспанно переспросил я.


— Ты что, про Убер не слышал? Что они с водителями делают — только репетиция, да. Скоро, уже очень скоро они запустят свои автопилоты. Это будет дешевле, безопаснее, круче! Всех этих бездарностей ждет работа на стройке. Или бомжатник. Но не меня, я умнее их.


— Да? — протер я глаза.

— Да! Я роман начал писать! Остросюжетный! Знаешь, у меня тут, — постучал пальцем по виску, — столько сюжетов сидит — закидайся. Вожу это разных людей, каждый что-то ляпнет. А память у меня с детства — дай Бог каждому. Кто у меня здесь только не ездил: трансвестит, сделавший уже три операции, все никак определиться не может; элитная проститутка — всю дорогу тараторила о шумерской клинописи; любовник министра одного ехал, столько всего нарассказывал… Имена только меняй и пиши — блокбастер будет!


—А ...


— Единственное, что пишу я пока не очень. Скачал себе пару учебников, читаю после работы. Каждый вечер для тренировки записываю, что услышал за день. Кстати, может ты что-нибудь интересное расскажешь, а то сегодня почему-то голяк полный. Могу даже скидку сделать.


— Что у меня интересного… Я программист, лечу вот из ...


— Слышь, программист, — перебил меня водитель, — о жизни своей можешь не рассказывать. Она у вас всех одинаковая, неинтересно. Скажи мне лучше другое: эти роботы, которые машины научились водить, они романы скоро писать начнут? Только честно. Я не обижусь, не боись. Просто если скоро — в моем плане нет никакого смысла, нужно  на программиста идти тогда, кому-то ж этих роботов ремонтировать потом, настраивать ...


Я, честно сказать, растерялся. С одной стороны, насколько я на тот момент знал, вроде ни один алгоритм еще не умел писать даже приблизительно осмысленный текст, не говоря уже о художественном. А с другой, брать на себя сейчас такую ??ответственность за чужую жизнь, сказать, что профессия писателя в безопасности, а потом, спустя пару лет, ждать этого таксиста с обрезом у своего дома?


— Давай так, — сказал я ему после неловкой паузы. Я тут немного погуглю, почитаю, осмыслю. И напишу статью. Может кому-то еще будет интересно, у кого те же проблемы.


Потом я расплатился и ушел досыпать после тяжелой дороги. Утром о своем обещании конечно же забыл. Вспомнил чуть позже, а там уже совесть замучила: пришлось действительно писать.


Надеюсь, мой случайный друг, (я так и не спросил, как тебя зовут), ты поверил невыспавшемуся пассажиру и читаешь сейчас эту статью. А если нет — черт с тобой. Кому-то пригодится.


Так вот.


Пессимисты прошлого


На первый взгляд, задача программного написания художественных произведений выглядит просто:


  1. Создаем Супер-Мега-Искусственный Интеллект.
  2. Заставляем его написать роман.

Ну нет, скажете вы, это же робот! Белая пластиковая фигня! Он только команды выполнять умеет, куда ему творить? Он не понимает ни человеческих эмоций, ни мотивов, о чем он вообще может написать? Об электроовцах?


С таким мнением вы не останетесь в одиночестве. Также полагала одна очень умная женщина: дочь известного поэта, а заодно первый в истории программист — Ада Лавлейс.


Она утверждала, что компьютер, даже очень мощный, не способен ни на творчество, ни даже на то, что мы называем «интеллектом». Ведь любая машина — всего лишь бездумный исполнитель алгоритмов, заложенных в нее человеком. То есть даже если компьютер когда-нибудь и напишет стихотворение или роман — все равно авторские права будут принадлежать кодеру, который его на это запрограммировал.


Понять мы ее, конечно, можем. Перед глазами благородной дамы стоял пример батюшки, известного повесы и дебошира: только такой склад характера может быть у настоящего поэта. Если ее любимая, логическая и точная машина обречена стать чем-то подобным — лучше уничтожить ее прямо сейчас, чтобы потом не пришлось отправлять десант в прошлое.


С другой стороны, ее ключевой аргумент о «выполнении программой только заранее заданных алгоритмов» в последнее время трещит по швам.


Началось все с того, что над сложными программными комплексами начали работать сотни, а то и тысячи людей. И программистов, которые бы понимали, что делает абсолютно каждая функция, в крупных проектах обычно не водится. То есть за счет сотрудничества разных людей, программы уже стоят на уровень выше того, что способен создать один человек. Представьте себе роман с тысячей авторов. То-то же.


Дальше — больше. Последние достижения машинного интеллекта базируются на алгоритмах, которые никто и никогда не писал. Программы создают их сами, основываясь на данных, которые им скармливают в невероятных количествах. Дошло уже до того, что на вопрос «как работает программа?» ее создатели лишь разводят руками. Назад в человеческие знания таинственные нолики и единицы просто так не конвертируются.


Преемник Ады, Алан Тьюринг, был настроен немного оптимистичнее. Он даже посвятил несколько строк доказательству того, что бессмертная душа может жить не только в человеческом теле, но и в любом другом сосуде. Например, в боевом человекообразном роботе. За такие пассажи его не очень любили на родине, в консервативной Англии.


Даже несмотря на то, что, взломав «Энигму», он серьезно повлиял на результаты Второй Мировой, гендерные предпочтения оказались для публики важнее научных достижений, и в конце концов «народ-победитель» довел вчерашнего героя до самоубийства.


Программистам Тьюринг известен прежде всего своей «машиной», на основе которой возникли все существующие языки программирования, но популярной культуре более знакомо другое его творение — знаменитый Тест Тьюринга.


Мнение о том, что оценить «интеллект» робота можно просто с ним побеседовав, захватила умы ведущих фантастов середины прошлого века и настолько успела всем надоесть, что когда несколько лет назад тест таки был пройден, никто, в конце концов, ничего и не заметил.


Дело в том, что специально наученные лексические генераторы кроме как «выдать себя за человека»  собственно ничего и не умеют. А для повседневных проблем гораздо полезнее оказались системы, которые не пытались скопировать человеческое поведение, а просто решали поставленные перед ними задачи.


Кстати, похожая революция произошла на столетие раньше в автомобиле- и самолетостроении. Как только конструкторы перестали пытаться создать «металлического коня» или «деревянную птицу», сразу же удалось построить механизмы, оказавшиеся гораздо полезнее произведений слепой эволюции.


Человек тоже, если честно, — так себе вычислительный механизм. Будучи предназначенным для конкретной цели — выживания среди диких животных и себе подобных, человеческий организм в некоторых областях безнадежно отстает от примитивнейших механизмов. Какой смысл пытаться имитировать то, что можно сделать лучше?


Именно поэтому после Тьюринга понятие «искусственный интеллект» поселилось разве что в фантастических романах, а программисты тем временем взялись за решение конкретных задач, стоявших перед экономикой.


В космос летали ракеты, на биржах торговались акции. Компьютеры успешно рассчитывали оптимальные расписания движения поездов и самолетов. Пока романтики зачитывались правилами робототехники, простые работники бобины и перфокарты вводили в ламповые машины алгоритмы разной степени сложности.


Логично было бы предположить, что проблему сочинения литературных произведений можно решить аналогичным способом. Мол, выпишем алгоритмы, согласно которым писатель или поэт составляет слова из букв, закинем их в жерло компьютера и вуаля — держите новую поэму. Или стихотворение. Или строчку текста хотя бы, нет?


По привычке программисты обратились к экспертам, ожидая получить четкий набора правил бизнес-логики. Когда-то они так же ходили к физикам, железнодорожникам и даже биологам. Последние с математикой дружили так себе, но среди них оказалось много физиков, говорить с которыми программистам было проще.


Но с филологами вышел полный швах. Формальные признаки текста, сказали они, конечно же существуют. Стихотворный размер, жанры и поджанры, стили речи и письма, в конце концов. Но если расставить ударения машину научить еще можно (после долгого прописывания примеров вручную), то сформулировать в математических терминах особенности стиля Бодлера филологи отказывались наглухо.


Мол, ни в какие цифры настоящее искусство загнать нельзя. И не надо! Ибо кто тогда нам, филологам, зарплату платить будет? Идите словом, дорогие программисты, рассчитывать траектории ядерных ракет. Это нам в ближайшее время понадобится гораздо больше. Вот они и пошли.


Единственной составляющей художественного текста, хоть как-то подходящей для алгоритмизации, долгое время был сюжет. Ведь в большинстве случаев в произведении были главные герои, которые совершали определенные действия. Например, двигались из точки А в точку Б. Прямо как ракеты, подумали программисты и взялись за различные генераторы сюжетов.


Некоторые, честно говоря, даже давали неплохие результаты. Кто-то умудрялся оформить их в целые книги. Только вот Ада Лавлейс, критически прищурив глаз, заметила бы, что такие программы — не более, чем вариации «шляпы сюжетов», когда автор пишет на клочках бумаги сначала имена персонажей, затем события, а потом по очереди вытягивает бумажки, описывая в литературной форме, что произошло и с кем. И если и есть какое-то творчество в этом процессе, то исключительно со стороны автора, который на этих листочках пишет. А со стороны машины здесь один лишь генератор случайных чисел.


Доливали масла в огонь мистики: творчество, мол, — это медитативный процесс, своеобразное общение писателя с духами. Если существуют какие-то правила, то только в их эфирном мире. Пока мы не научим наши компьютеры подключаться туда по HDMI, никакого творчества от компьютеров ждать не стоит.


Эту позицию разделяют и авторы учебников по "creative writing". Большинство советов там о том, как заставить себя сесть за стол, расслабиться и начать «слушать свою брокколи». После того как она надиктует вам текст, стоит только исправить ошибки, выбросить все наречия и можно отправлять рукопись в издательство.


Что ж, метод может и действенный, но для написания программы непригоден абсолютно. Ведь, чтобы запрограммировать что-то, нужно знать, как это что-то работает. Не так ли?


На самом деле… не совсем. Но об этом немного позже.


Мир как правила и представление


Если копнуть глубже, проблема формализации возникает не только в литературе. Философы Древней Греции тоже очень любили давать определение всему, с чем встречались на своем пути. Сначала получалось неплохо. Только вот оказалось, что наибольшие проблемы возникают с простыми понятиями, понятными даже ребенку. Добро, зло, красота, уродство, добродетель, порок, Бог.


После нескольких анекдотичных случаев вроде «человек — это двуногое без перьев», Платон устал работать над определениями и постановил, что настоящие правила этого мира, так называемые Идеи, существуют где-то в параллельном мире, а к нам долетают только их тени. Человеческая душа, имея доступ к этому «Идеальному миру», может без труда их различать, а наше мышление, ограниченное миром материальным, понять этого величия не может.


Поговорить об Идеях под хорошее вино, впрочем, никто не запрещает. Хотя нет, все-таки запрещает.


Витгенштейн, один из ведущих философов двадцатого века, в свое время безапелляционно заявил: «О чем невозможно говорить — о том лучше молчать».


Нет, он не был врагом свободы слова. Просто речь, отметил он, в отношении нашего мышления, — откровенно вторична. Она может помочь в базовом общении и даже передаче какой-то части знаний в печатном виде, но то главное, что происходит с нами, — в слова конвертируется слабо.


Максимум, что мы можем, — это давать названия неким фактам, элементарной единице этого мира. В отличие от «понятий», «факты» описывают то, что мы видим, без лишних обобщений. Конкретный стол стоит в конкретной комнате при конкретной температуре, атмосферном давлении и уровне освещения. Никакой Идеи Стола в комнате нет, а значит и говорить о ней нет смысла. Весь мир вокруг — просто конфигурация атомов и волн, в которую болезненное человеческое воображение пытается впихнуть термины, которые само не понимает.


Ребенок приходит к отцу и говорит: «Папа, я придумал слово карчапан. Что оно значит?». Такими Витгенштейн видел всех философов прошлого. Зато «факты» такими проблемами не страдают. Мы уже знаем, что мы видим. Остается понять — почему?


На язык описания «фактов» серьезно претендовала математика. Стройными рядами формул пытались объяснить все: от взаимодействия атомов до несчастных браков. Только вот когда модель становилась хоть немного сложнее, формулы сразу теряли свою элегантность и превращались в десятиэтажные нотации тензоров и «странных аттракторов» (единственный термин, который я до сих пор помню из курса функционального анализа).


Таким образом, перевести авангард современной математики в булеву логику оказалось еще сложнее, чем художественные тексты. К тому же и сама математика, как показал Гедель, оказалась не такой уж и всесильной. Словом, полное фиаско.


Настолько полное, что часть философов окончательно пустилась во все тяжкие и создала странное учение под названием «постструктурализм». Проблему описания окружающего мира в текстовом формате они решили очень просто. Текст, мол, не описывает, а порождает этот мир. Своеобразное учение Витгенштейна наоборот: если об этом никто не написал — этого на самом деле не существует.


Эта точка зрения могла бы очень понравиться программистам, ведь ввести в компьютер текст гораздо проще, чем заставить собирать информацию о мире миллионами разнообразных датчиков. Только вот сами постулаты теории оказались настолько близки к полной чуши, что, кроме самих создателей, их, кажется, так никто и не понял. Поэтому после смерти Фуко и Делеза течение медленно, но верно растворилась в ризоме.


Окончательно разочаровавшись в философах, программисты обратились к представителям более приземленных специальностей. Например, к уже знакомым биологам.


Уподобиться мозгу


Двадцатый век, кроме прорывов в кибернетике и способах убивать друг друга, принес еще и неплохие результаты в понимании того, как устроены люди. Все больше и больше процессов, которые ранее могли объяснить только общением с духами, теперь приписывали мозгу. До полного понимания того, как работает наше сознание, еще, конечно, очень и очень далеко, но в базовых вещах, вроде строения нейронов, наука уже ориентируется достаточно неплохо.


Так, судя по всему оказалось, что знаменитая Пещера идей — это, на самом деле, просто область внутри нашего черепа. Мозг, получая из органов чувств информацию об окружающем мире, записывает ее на «жесткий диск»в только ему понятной форме из нейронов и связей между ними.


Про «чтение» такой записи речь пока не идет, но мы знаем, что ключевыми характеристиками нашей «пещеры» являются: а) абстракция, то есть объединение черт различных предметов и явлений под одним «ключом» и б) постоянное обновление данных на основе входящей информации.


Система хранения данных типа «мозг» — на несколько порядков лучше всего, пока что созданного человеком. И единственным, хотя и очень неприятным недостатком является то, что как в язык, так и в математику все наши знания и весь наш жизненный опыт конвертируются очень и очень плохо.


Возникает даже забавная ситуация, когда специалист экстра-класса, способный выполнять сложнейшие задачи, не может объяснить ученикам, как это у него получается. Бедолагам остается только наблюдать за Мастером и пытаться воспроизвести каждое его движение. Как перевести это все на машинный язык, вопрос пока даже не стоит.


Казалось бы, очередной тупик. Но ученые, почесав затылок, задумались. А почему бы нам не убрать посредников, неспособных даже между собой договориться, и не выпустить наши программы напрямую во внешний мир? Пусть они сами берут — и учатся! Соблазнительно, не так ли?


Первой попыткой было сотрудничество Уоррена Маккалока и Уолтера Питтса в 1943 году. Стоит отметить, что ни один из них не был программистом. Маккалок — нейропсихолог, нейрофизиолог, философ, поэт, имел с математикой достаточно сложные отношения. Но это компенсировал Питтс — вундеркинд-математик, от которого в восторге был сам Рассел. Питтс сбежал из дома в 15 лет, чтобы ошиваться вокруг MIT, куда его упорно не принимали из-за возраста и отсутствия формального образования.


Маккалок всю жизнь мечтал построить модель человеческого мозга. Питтс помог ему в этом, упростив нейрон до булевого оператора, получающего на вход двоичные числа и на выходе либо активирующийся (результат «да») или остающийся спокойным (результат «нет»).


Такая модель мозга была слишком упрощенной, но вместе с тем ее значимость трудно переоценить. На тот момент самым популярным психологическим течением был психоанализ — полумистическое учение об Иде, Эго и Оргоне, понятиях несовместимых с научным взглядом на мир. Попытка формализовать самый таинственный процесс во Вселенной, человеческое мышление, не могла не выстрелить.


После публикации первой статьи «A logical calculus of the ideas immanent in nervous activity» работой пары заинтересовался Норберт Винер, впоследствии сделавший Питтса своей правой рукой. Позже к ним присоединился и сам фон Нейман. Без преувеличения можно сказать, что модель Питтса позволила построить компьютер таким, как мы знаем его теперь.


Начиная с определенного этапа, нейронные сети отделились от кибернетики. Моделирование человеческого мозга перестало быть самоцелью, к тому же, новые результаты ученых-биологов показали, что мозг работает несколько сложнее, чем модификация линейной регрессии.


Тем не менее, определенные задачи даже таким приемам удавались на ура: базовое распознавание изображений, математическое прогнозирование. Даже медицина получила свою порцию инноваций: нейросети заставляли анализировать кардиограммы.


После стремительного взлета часто бывает очень болезненное падение. Так случилось и в этот раз. Известный и очень авторитетный в своих кругах математик и философ Марвин Мински (сосед Питтса по комнате) в 1969 году издал книгу «Перцептроны». В отличие от широкой публики, он понимал, чем именно занимаются программисты, и спокойно, без эмоций, доказал, что в данной интерпретации так называемые «нейронные» сети имеют очень четкие ограничения. Даже оператор «XOR», базовое понятие программирования, однослойными моделями, которые тогда использовались, описать было невозможно.


Наложившись на первые неудачи в промышленном использовании и отсутствие новых прорывов в лабораториях, эта книга стала могильщиком нейросетей: отсутствие грантов и, как следствие, отток специалистов отправили отрасль в длительный криогенный сон, из которого она стремительно вышла только полстолетия спустя.


Второе пришествие, как водится, стало еще ослепительнее предыдущего. За последние годы нейросети ворвались практически во все области компьютерных наук, и ситуация везде выглядела одинаково: десятилетия исследований, тысячи экспертов, миллионы страниц доводили эффективность алгоритма до фантастической цифры в 80%. А потом приходила нейросеть и без специальных знаний, простым перебором данных показывала результат 90-95%. Так произошло с распознаванием изображений, машинным переводом, генерацией и пониманием человеческой речи, прогнозированием и профессиональной аналитикой. Да что там, сейчас вообще трудно назвать отрасль, куда еще не пролезло вездесущее «машинное обучение».


Нейросети играючи раскусили ранее нерешаемую задачу распознавания изображений: научились отличать кота от собаки — им просто показали миллион картинок и сказали, где что изображено. Все характеристики «кошачести», которые не смогли сформулировать сотни ученых за десятилетия исследований, сеть определила для себя сама.


Удивив весь мир, несколько лет назад команда AlphaGo преодолела одного из сильнейших игроков в Го. Эта игра, в отличие от шахмат, математическому решению не подлежит — слишком велико число вариантов развития событий.


Программе математика и не понадобилась. Вместо этого, она просто «прочитала» все матчи между людьми, доступные в записи, а затем еще несколько миллионов раз сыграла сама с собой. Самым оскорбительным для свергнутого чемпиона стало то, что в обучении программы даже не участвовали известные гроссмейстеры — ей объяснили только базовые правила и критерий победы. Все остальное — набор проб и ошибок.


Подход оказался достаточно общим. Совсем недавно таким же образом программа обыграла игроков людей в покер.


Что же поменялось, спросите вы, по сравнению с серединой двадцатого века? И почему методы, признанные ранее полностью провальными, теперь вдруг заработали так эффективно?


Во-первых, улучшились сами методы. Даже несмотря на отсутствие финансирования, фанатики в пыльных лабораториях одна за другой выписывали сложные формулы, оптимизируя быстродействие и разрабатывая методы избавления от шума.


Во-вторых, конечно, железо. Всем известен пример айфона, вычислительная мощность которого превышает суммарные ресурсы машин, отправивших человека на Луну. Как всегда, двигателем прогресса стала индустрия развлечений: современные системы машинного обучения работают в основном на видеокартах, производители которых сходили с ума, пытаясь выдать геймерам картинку пореалистичнее.


Третьим, и самым главным фактором, стали данные. Ребенку, чтобы он понял, что такое «стол», достаточно показать один-два примера. Нейросети хорошо учатся на выборках, начинающихся от десятков тысяч.


Можно, конечно, попенять на несовершенство современных методов, но в защиту бедного алгоритма следует отметить, что ребенок на самом деле получает гораздо больше информации о предмете. Он видит его с разных сторон, может понюхать, потрогать и даже порой отгрызть кусочек лака, чтобы получить как можно больше разных характеристик. Сеть мы учим на фотографиях — количество каналов уменьшено до одного, еще и без пространственной ориентации. Вот и приходится компенсировать качество количеством.


Сейчас человечество выбрасывает в интернет больше данных, чем было создано за всю историю. Развитие цифровой фотографии привело к тому, что, наверное, ни один уголок планеты не остался незадокументированным.


С другой стороны, радикально выросло и число текстов, написанных человеком. Теперь значительная часть общения между людьми происходит в сети, а художественных текстов в последнее время стало на порядки больше. Казалось бы, ничто не мешает обучить нейросеть на них и вперед — к новым литературных вершинам.


На самом деле, не все здесь так просто. Давайте разберемся почему.


В поисках нейропегаса


Несмотря на всю свою мощность, сети не могут пока и близко сравниться с человеком в некоторых сферах. Создание осмысленных текстов — в их числе. Причин этому много, но самые важные — две.


Первая — те же пресловутые правила. Люди не учатся исключительно на примерах. Им объясняют учителя, дают информацию книги, у людей есть физические и химические формулы, синтаксические законы, словари и энциклопедии. А вот нейронную сеть, обученную на живых примерах, подкорректировать вручную уже невозможно — разве что сгенерировать на основе «правил» дополнительные примеры, но даже в этом случае есть большая вероятность переобучения и, как следствие, — полной непригодности системы для реальной жизни.


(Также, кстати, нет никакой возможности перевести правила, обнаруженные машиной, назад в человеческую речь. Поэтому победа над Ли Седолем вряд ли научит чему-то новому игроков-людей: почему сеть сделала тот или иной ход навсегда останется для нас тайной).


Вторая и главная разница между нашим мозгом и битами в памяти компьютера — исходные данные. Человек не получает абсолютно все свои знания из окружающего мира. Большинство информации идет в виде «заводской прошивки» — инстинктов, эмоциональных реакций, базовых правил поведения.


Этими данными человек обязан миллионам поколений предков, вплоть до бактерий, которые своими постоянными попытками, победами и неудачами формировали генетический код — наверное, самый плотный носитель информации из всех нам известных. Мы не то, что не можем внедрить эти данные в нейросеть, мы и осознать их не способны.


Конечно же, обе эти проблемы решаются любимым методом нейронных сетей: «Нам надо больше, больше, БОЛЬШЕ данных», но оказывается, что для решения в лоб задачи такой сложности, как генерация прозы, даже всех букв, когда-либо написанных человечеством, пока недостаточно.


Дело в том, что текст — не герметичный набор данных, а скорее отражение внешнего мира, и, чтобы постичь «связи» в тексте, нужно понять «связи» самого мира, или, по сути, построить Универсальную Модель, которая будет знать о мире практически все, что знает среднестатистический человек. То есть опять же построить Сильный Искусственный Интеллект, до чего сейчас еще очень и очень далеко.


(На самом деле задачи на понимание мира могут быть вполне тривиальными. Классический пример — предложение “Игрушка не влезла в коробку, потому что она слишком большая”. Что здесь — “она”?


Ребенок ответит сразу: он понимает значение слова “большая” и умеет соединить его со значением “не влезла”. Для компютера же оба смысла равны, на уровне самого текста ответа на эту задачу не существует.)


Но с другой стороны, что мешает программам просто сгенерировать набор символов, не заморачиваясь их смыслом? Ничего, этим они в последнее время и занимаются. Давайте разберемся как.


У продвинутого читателя уже давно должен был возникнуть один вопрос. Нейросети, мол, в большинстве случаев строятся для классификации и прогнозирования. То есть, мы имеем много данных на входе и ограниченный (часто скалярный) результат на выходе.


Мы скармливаем сети сотню тысяч квартир с набором параметров и цену каждой из них. Затем натравливаем на еще одну позицию, цены которой мы не знаем. Результат — одно число, прогнозируемая стоимость квартиры.


Мы показываем алгоритму миллион картинок кошек и миллион картинок собак, указывая, кто есть кто. Затем показываем новую картинку, и алгоритм должен угадать, кот на ней изображен, или собака.


Как такой механизм в принципе можно использовать для генерации хоть чего-то?


Первый метод — обратные вычисления. Нейросеть по своей сути — система линейных уравнений, а, следовательно, ее можно спокойно вывернуть в противоположную сторону. Мы не ставим задачу «что на этой картинке?». Вместо этого мы указываем готовый результат (например, «кот») и спрашиваем: «Как по-твоему он должен выглядеть?».


Именно так поступили разработчики Гугла в 2015 году. Их результаты, напоминающие скорее произведения сюрреалистов, хоть и продемонстрировали наглядно работу нейросети, на какую-то эстетическую ценность претендуют со скрипом. К тому же, один раз обученная нейросеть с таким подходом может дать только один, детерминированный результат для каждого набора входных данных — ограничение не из приятных. Подходит такой способ для генерации текста? Честно говоря, вряд ли.


Вообще говоря, обработка текста по сравнению с обработкой изображений имеет несколько достаточно неприятных аспектов. Во-первых, картинки можно легко сжимать. Вследствие особенностей человеческого зрения, предназначенных для рассматривания далеких предметов, мы даже на иконках 16х16 способны разглядеть какие-то детали.


Для текста сжатия без потерь — абсолютно нетривиальная задача. Нельзя просто взять и объединить соседние символы, как мы поступаем с пикселями. Вместо этого нужно искать обходные пути — анализировать части речи, чтобы выбросить эпитеты, строить модель событий, чтобы объединить несколько предложений в одно. Словом, вся «слепота» нейросетей к бизнес-логике сразу куда-то исчезает.


Во-вторых, текст гораздо чувствительней к шуму. Если для картинки несколько не слишком ярких точек не на своих местах погоды не сделают, то слу»ча%йны*е си$мво^лы, разбросанные по тексту, абсолютно неприемлемы — читать такие опусы чрезвычайно трудно, а порой от замены всего нескольких брюкв вообще меняется весь смысл.


Второй способ генерирования чего-то нового построен на умении нейронной сети прогнозировать. Пусть текст, предполагают адепты этого метода, является определенным временным рядом. И каждая следующая буква каким-то образом зависит от предыдущих. Теперь остается только научить систему на заданных «взаимозависимостях» и заставить ее прогнозировать, какие символы должны быть в тексте следующими.


Несмотря на тривиальность этого подхода, результаты, полученные с его помощью, впечатляют. Первая программа-генератор, описанная Андреем Карпати, умышленно оперирует исключительно символами в отличие от аналогов, пытавшихся искать взаимные связи между словами. И даже в такой постановке удалось получить хоть и бессмысленный, но читабельный и даже стилистически близкий к оригиналу кусок текста.


Генерации подверглись Шекспир, речи Обамы, рекламные заголовки и даже тексты выступлений на конференции TED.


Интересные выводы можно сделать из генерации карт для игры Хартстоун. На первых порах система выдает полную ерунду, но уже после нескольких итераций некоторые карты начинают выглядеть осмысленно — их уже спокойно можно включать в игру.


Мощности современных алгоритмов хватает даже для поэзии (в том числе, китайской и хокку ) или текстов песен, но успех там, честно говоря, достигается в основном за счет ручного выбора исследователем приличных вариантов. Хорошую прозу так пока сгенерировать не получится.


Во-первых, проблема в объеме. Как говорилось ранее, сжимать текст, особенно художественный, — достаточно трудно. А количество взаимосвязей длинного прозаического текста пока превышает вычислительные возможности даже самых мощных кластеров.


Вторая проблема — обучение с учителем. Большинство данных, которые сейчас используются для машинного обучения, были когда-то размечены людьми вручную. Существует даже специальный ресурс «Механический турок», где люди за небольшую плату помогают ученым со всего мира обучать свои алгоритмы.


Для размещения на этом сайте задачи должны занимать максимум несколько секунд эффективного времени обычного человека: «Есть ли на картинке лицо?», «В какую сторону поворачивает дорога?», «Какое слово говорит голос на записи?». За счет простоты, можно получить очень большую базу данных за относительно короткое время.


Заставить пользователей читать рассказы, сгенерированные работами, трудно. Во-первых, текст, составленный наполовину из тарабарщины, а наполовину из гениальных предложений, все равно остается бредом. Во-вторых, даже если роботы когда-нибудь научатся писать что-то осмысленное, второй вариант того же текста не будет иметь того же эффекта, что первый, — читать одно и то же скучно.


Значит, придется наполнять базу произведениями людей. Но и здесь возникает вопрос: какими должны быть критерии оценки? Как мы уже упоминали ранее, машинное обучение конвертирует большие объемы данных в небольшой результат. Как выглядит результат для прозы?


Первое и наиболее логичное предположение — написанное должно иметь хоть какой-то смысл. То есть текст, пусть даже сгенерированный с помощью машинного обучения, нужно сначала преобразовать в последовательность событий и определить, не противоречат ли они друг другу.


Понимание текста, в отличие от генерации, продвинулось гораздо дальше. IBM Watson недавно победил в викторине, Google построил базу данных смыслов слов разных языков. На рынок постепенно выходят анализаторы текста для воспроизведения событий на основе тысяч статей в интернет-изданиях.


Чрезвычайно важной является задача понимания человеческих команд — интернет вещей постепенно перекочевывает из фантастических сериалов в реальный мир, и ваше общение с микроволновкой через какие-то год-два превратится из первых признаков помешательства в практическую необходимость. Людей трудно переучивать на язык инструкций — роботы должны просто понимать, что от них хочет хозяин.


Последствия этой революции могут сыграть значительную роль в генерации художественных текстов — программа сможет прогонять свои «творения» через базовые фильтры и абсолютного бреда на выходе уже не будет. Но этого, безусловно, мало.


Ведь художественная литература — это много больше, чем просто описание событий. Поэзия — вообще в большинстве своем несюжетная. Попытки разобраться, что на самом деле означает та или иная метафора — работа не из легких даже для исследователей из плоти и крови.


Однако, одно правило остается практически неизменным: любое искусство существует для того, чтобы вызвать у нас эмоции. Печаль, радость, злость, страх — читатель должен сопереживать героям. Соответственно, значения слов можно и не знать, достаточно просто провести параллели между предложениями и реакцией на них.


Осталось только посадить миллион человек за машины и заставить их читать тексты, описывая после этого свои эмоции. Хотя нет, учитывая масштабность задачи, миллиона будет мало — надо как минимум миллиард. Вряд ли «Механический турок» потянет такие объемы — понадобится новая система, полностью заточенная под эту цель.


Еще одна проблема — сами тексты. Можно начинать с каких-то базовых кусочков — старых анекдотов или газетных вырезок, но нашему миллиарда «подопытных» такое быстро надоест. Желательно, чтобы тексты они генерировали сами, хотя бы по несколько десятков каждый. Объем не так важен, главное — количество. Чем больше, тем лучше.


Теперь главное — как заплатить миллиарду людей? Где взять деньги на такое масштабное исследование? Может попросить их работать бесплатно? Ради блага науки, например. Или для собственного развлечения. И чтобы весь эксперимент выглядел веселее, можно вместо обычного интерфейса добавить иконки. Например, такие:


Итак, основной проблемой сегодняшнего дня является не генерация, а именно анализ текстов. Как только машина научится понимать и даже в каком-то смысле «сопереживать» творением людей, выделяя гениальные произведения среди гигабайт чуши и графомании, проблемы генерации уже не будет.


Да что там, издатели и сейчас готовы заплатить миллионы за программу, которая будет способна выбрать шедевры из тысяч опусов, ежедневно появляющихся на самиздате Амазона, причем желательно, чтобы она делала это быстрее и эффективнее, чем бедные студенты-филологи, которые занимаются этим сейчас.


Развитие индустрии, таким образом, будет двигаться с двух сторон: нейросети генерации будут совершенствоваться, чтобы извлекать больше информации из данных (RNN, LSTM), а нейросети распознавания будут приближаться к истинному пониманию текста, и, как следствие — настоящему пониманию окружающего мира. На уровне человека, а скорее сильно превосходя нас самих.


***


В конце хочу отметить одну очень важную вещь. Большинство результатов, описанных в этой статье — очень новые. Речь идет даже не о десятилетиях: вышеупомянутая статья Андрея Карпати вышла в мае 2015 года!


Прямо сейчас мы находимся на очередном витке взрывного роста: растет количество ученых, занятых в индустрии, компании тратят миллиарды долларов, чтобы не отставать в гонке Искусственного Интеллекта. Технологии тоже не стоят на месте: хардварные компании одна за другой выпускают железо, предназначенное в первую очередь для машинного обучения.


И поэтому, хоть на данный момент и не существует ни одной системы, способной на создание хоть немного осмысленной прозы, шансы на то, что подобная появится в ближайшее время —очень и очень высоки. (Программистов угроза, кстати, тоже не миновала).


11 сентября 1933 на ежегодном съезде Британской Академии Наук лучший физик-ядерщик того времени Эрнест Резерфорд безапелляционно заявил, что все, кто занимается добычей энергии из трансформации атомов, — шарлатаны. И все их исследования — не более, чем очередной виток лженауки.


Уже на следующее утро молодой исследователь Лео Силард описал принципы цепной реакции, благодаря которым через несколько лет появится первый ядерный реактор.

Поделиться с друзьями
-->

Комментарии (73)


  1. dima117
    27.02.2017 16:05

    Я просто оставлю это здесь: https://meduza.io/shapito/2016/06/28/neyronnaya-oborona-robot-napisal-teksty-pesen-pod-egora-letova

    И вот небольшое видео по теме https://events.yandex.ru/lib/talks/3875/


    1. alchemist_ua
      27.02.2017 22:15
      +1

      Да, видел, линка на статью про «оборону» в статье тоже есть. Но там все же авторы отфильтровали ручками очень много. Да и наличие смысла никогда в требования для русского рока не входило, честно говоря :)


  1. xtala
    27.02.2017 16:27
    +2

    Писать то оно конечно будет. И даже наверное будет удивлять грамотно построенными предложениями и красивыми рифмами. Только наверное смысла в этом будет не больше чем в глупой улыбке робота-бармена из фильма "Пассажиры" когда он сдал главного героя с потрохами не понимая нюансов человеческих взаимоотношений. Это очередная "китайская комната", набор условностей и инструкций которые выполняет машина не вникая в смысл.


    1. elmigranto
      27.02.2017 17:18

      У нас в голове происходит совсем не «магия», соответственно, машина (теоретическая и в вакууме) вполне может достичь уровня человека. Никакого фундаментального отличия между электричеством в мозге и в условном процессоре нет.


      1. stargazr
        27.02.2017 17:57

        Никакого фундаментального отличия между содержимым кассет с программами для Спектрума и с музыкой нет, ага.


        Почему-то технарям восстановление контента по хешу кажется практически невыполнимой задачей, а вот высказаться по поводу чуть ли не тривиальности якобы электрической "немагии" из наших голов они считают своим долгом ("нейромедиаторы" — нет, не слышали?). Кое-кто, видимо, все никак не расстанется с верой в механистическую утопию.


        1. xtala
          27.02.2017 19:38
          +1

          Чтобы это произошло этот робот должен быть полноценной личностью. Т.е. получить большой жизненный опыт через общение с социумом. Тогда его произведения будут нести какую то мысль или философию и возможно даже войдут в наследие. Пока этого не случилось, рассуждать о искусственном интеллекте в контексте творчества нет смысла, т.к это все просто автоматы разной степени сложности и глубины.Полноценный искусственный интеллект креативщик это на мой взгляд именно искусственная личность, наделенная жизненным опытом полученным в процессе обучения и общения в социуме.
          Но надеюсь на нашем веку этого не случится, ибо это будет означать, что человек проиграл эволюционную гонку, т.к. эти новые синтетические личности скорее всего дообучаются до фашизма и уничтожат людей, сделав вывод, что белковые больше не нужны.


          1. stargazr
            27.02.2017 19:47

            Да, я согласен с вами, но, как мне представляется, немаловажен еще и тот факт, что человек получает море информации в ощущениях, и я не вижу, как их можно зафиксировать в доступном машине виде.


          1. alchemist_ua
            27.02.2017 22:25
            +1

            Вы правы, но не до конца. Не вся литература строится на жизненном опыте.
            Ни Бредбери ни Уир на Марсе никогда не были. Шекспир никогда не душил неверную жену и не убивал собственного дядю.
            Новые творения не появляются из вакуума — в большинстве случаев они просто продолжение литературной традиции. Собственно, ничто не мешает машине прочитать всю модерную литературу и написать «вариацию на тему». Вряд ли мы сможем распознать подделку.


    1. Fen1kz
      27.02.2017 17:23

      При достаточном количестве инструкций, можно и в смысл вникнуть


    1. SpiridonovAA
      27.02.2017 17:58
      +1

      человеческий мозг — это тоже «китайская комната»


  1. stargazr
    27.02.2017 17:39

    Оно просто станет еще одним инструментом поэтов.


  1. Nad73
    27.02.2017 17:58

    Игрушка не влезла в коробку, потому что она слишком большая (Игрушка)
    Игрушка не влезла в коробку, потому что она слишком маленькая (Коробка)
    Игрушка не влезла в коробку, потому что она слишком… (Кто-то из)
    не влезла->почему можно не влезть->потому что кто-то много ест или у кого-то слишком маленький дом.


  1. sbnur
    27.02.2017 18:38

    вы изменили своим вдохновенным текстом мое отношение к нейросетям (я занимался ими раньше, но прекратил ) — спасибо


    1. SpiridonovAA
      27.02.2017 20:26

      Снова потянуло заниматься ими?


      1. sbnur
        27.02.2017 20:43

        посмотрим


    1. alchemist_ua
      27.02.2017 22:34

      Спасибо. Нейросети сейчас на хайпе, но это не значит, что они снова не упрутся в потолок. Главное — держать нос по ветру и не расслабляться. Дальше будет только веселее.


  1. maslyaev
    27.02.2017 22:25

    Робот может выглядеть как утка, крякать как утка, ходить, летать и плавать как утка, но уткой он не станет.
    А вот утка по-пекински, хоть уже и не выглядит как утка, не крякает и не ходит, всё же утка. Забавно, правда?

    А если серьёзно, то есть некоторые виды деятельности, которые роботы у нас никогда не отберут. Например, как это ни странно сейчас прозвучит, перевод естественных языков. Задача не имеет технического решения ни при каком уровне развития технологий. Алгоритмы генерации подстрочников, безусловно, будут совершенствоваться, и этому можно только порадоваться. Но полноценного машинного перевода не будет, увы, никогда. Задача, повторюсь, не имеет технического решения. Если хотите, могу рассказать почему.


    1. alchemist_ua
      27.02.2017 22:32
      +2

      Тут главное, что считать уткой. Если нет никакого способа определить реальная перед тобой птица или подделка, само понятие «настоящая» теряет смысл.

      Насчет же перевода: проблема елементарно решается при наличии полной базы значений всех слов и их комбинаций. То есть когда машина понимает, что сказано в тексте, то есть переводит набор символов в набор смыслов, а потом в другой набор символов, просто на другом языке. Понятно, что на данный момент обе трансляции далеки от идеала, но вот декларировать «не имеет технического решения ни при каком уровне развития технологий» я бы не стал.


      1. maslyaev
        27.02.2017 23:09

        Теряет смысл ровно до того момента, пока нам в целом всё равно, настоящая утка, или нет. А если задача сформулирована «добудь настоящую утку», сразу понятие обретает смысл, и мы начинаем решать конкретную задачу «как отличить утку от подделки». В рамках этой задачи понятия «настоящее» и «подделка» есть, и между ними существенная разница.

        Относительно перевода всё дело в том, что мы имеем два подхода к решению этой задачи. Первый, традиционный, заключается в том, что человек получает текст на одном языке, понимает его, и излагает на другом языке. Второй способ — это манипулирование строками символов. Имея одну строку символов на входе, нужно получить другую на выходе. Казалось бы, фигня вопрос — нам всё равно, что там происходит внутри чёрного ящика переводчика, и нам всего лишь нужно, чтобы одна строка символов превратилась в другую. Формально — да, но тут не лишне вспомнить, что текст — это совсем не всегда просто последовательность символов. Кроме символов есть контекст. Без контекста это просто буквы. Контекст есть у живого переводчика, но его нет у машины. Машина на вход получила только текст, и контекстом у неё будут только словари, базы знаний, коэффициенты обученной нейросети и прочие общие вещи, в которых нет и не может быть ничего про то, зачем это сказано, почему так, а не иначе, что собой представляет имплицитный читатель и ещё масса вещей, которые для нас, живых человеков, являются естественной средой обитания.

        Можно изготовить робота, для которого наш мир станет естественной средой обитания, но тогда придётся выдать ему паспорт (потому что он по факту стал человеком) и наделить его гражданскими правами. Оно такое нам надо? Уж лучше мы как-нибудь с подстрочниками (очень качественными, кстати) помучаемся, а в случае надобности позовём живого человека и заплатим ему денег. Кстати, роботу, для которого наш мир стал средой обитания, тоже надо будет платить зарплату. Иначе ему не на что будет содержать своих детей (упс… а как иначе?).


        1. alchemist_ua
          27.02.2017 23:33
          +3

          Еще раз про «утку»: настоящесть важна только до уровня различимости ее человеком. Допустим, что злые марсиане внедрили в ряды уток на ферме одну поддельную. Она выглядит так же, как и земные, ходит и плавает так же, и даже если мы ее разрежем/попробуем на вкус/проведем спектральный или ДНК анализ — она даст те же результаты, что и обычная птица. Вопросы: 1. Как узнать, какая утка — поддельная. 2. Зачем?

          Теперь о переводе.

          Для того, чтобы перевести текст правильно, достаточно перевести его в набор
          1. «Фактов» об окружающем мире, то есть «актор» + «действие» + «обстановка»: «Розовый гусь смотрит в окно».
          2. «Контекста», который в тексте напрямую не указан: «Не может понять, почему так темно». За окном ночь? Гусь — слепой? Или ему кто-то просто закрыл глаза?
          3. «Мета-контекста». Каждый язык — это еще и культура за ним. В одной культуре розовый гусь означает девственницу, в другой эту роль играет, например, горящая свеча. И переводить надо не слово-в-слово, а «символ-в-символ».
          4. «Стиля речи». Тут и люди-переводчики справляються не всегда.

          Так вот. Нюанс в том, что пункты 1-3 спокойно можно «выучить»
          1. Читая уже существующие переводы
          2. Методом проб и ошибок генерируя новые, каждый раз не забывая спрашивать у человека, получилось или нет.
          Что, собственно, Гугл успешно и делает. Ну а в передаче (и распознавании) стиля алгоритмы так вообще справляются намноооого лучше за людей уже сейчас.

          А на счет «паспорта» надо сначала разобраться зачем и почему его дают людям. Спойлер: совсем не за интеллектуальные возможности и не за умение переводить фразы.


          1. maslyaev
            28.02.2017 13:44

            Ну какая разница, можем мы отличить настоящую утку от поддельной, или не можем? Сегодня не можем, а завтра наука шагнёт вперёд, и сможем.
            Представьте себе такую ситуацию. Допустим, поступила партия очень качественно подделанных пятитысячных купюр. На глаз подделку выявить невозможно. Ни один из существующих детекторов не ловит. Есть желание получить зарплату пятитысячными? Не знаю кому как, но мне почему-то нет. Наверно потому, что скорее всего через неделю придумают, как отличить подделку. А пока не придумали, у меня никто их всё равно не примет. «Настоящее» / «поддельное» — внутреннее свойство, не очень зависящее от конфигурации волновых функций частиц, составляющих объект. Мятый изрядно поюзанный слегка надорванный пятитысячник по свойству «настоящесть» равен новому настоящему, а неотличимый от настоящего поддельный — нет.

            Идеологический затык с утками возникает от того, что мы привычно путаем понятия «тот же» и «такой же». А это разные категории. Не надо их путать. «Такой же» — это про равенство значений характеристик, а «тот же» — про такую в целом загадочную штуку, как идентичность. В случае с утками идентичностью обладает множество «утки», и конкретный экземпляр либо принадлежит ему, либо нет. Технически мы выясняем принадлежность экземпляра по значениям характеристик (выглядит, ходит, крякает и т.п.), но это только потому, что нам так удобно и практично. Но мы, надеюсь, понимаем, что подделка даже всех известных характеристик не влияет на идентичность, а лишь затрудняет правильную идентификацию.

            О переводе.

            Читая уже существующие переводы
            Каждый новый текст уникален. Уметь переводить то, что уже переведено — так себе заслуга. Анализ существующих переводов позволяет наполнить словарь, но если я, например, попытаюсь найти в интернетах перевод на английский текста хотя бы вот этого коммента, который вы сейчас читаете, я обломаюсь. Сколько бы мы ни накопили бигдэйты, она окажется бесполезной даже при решении такой простой задачи.
            Методом проб и ошибок генерируя новые, каждый раз не забывая спрашивать у человека, получилось или нет.
            Допустим, я хочу получить перевод этого текста на китайский. Есть ли смысл мне показывать разные варианты перевода?

            Давайте прикинем, что нужно для того, чтобы перевод текста этого коммента на китайский получился правильным:
            0. (нулевым пунктом как само собой разумеющееся) Нужен набор словарей и формализованной грамматики. С этим худо-бедно роботы справляются.
            1. Нужно понимание, что это не самостоятельный текст, а коммент к комменту в ответ на коммент… и так далее. То есть нужно понимание, почему в первой половине текста говорится о каких-то утках, а во второй о каких-то переводах.
            2. Сам хабровский пост тоже нужно учесть, потому что именно он задал направление.
            3. Обязательно нужно учесть текущую сиюминутную ситуацию в той области техники, которую поспешили назвать искусственным интеллектом. Без этого не может быть понятна грубая провокационность моего заявления о том, что задача полноценного перевода не имеет технического решения. Очень не помешало бы при составлении перевода понимать, как на эту ситуацию завязан хабровский пост и дальнейшее его обсуждение. Для понимания текущего момента развития технологий весь накопленный комплект качественных переводов мировой литературной классики в целом бесполезен.
            4. В первой части я вскользь упомянул ситуацию получения зарплаты фальшивыми деньгами. Я в такое не попадал и Вы, надеюсь, тоже, но мы оба можем себе живо представить всю глубину облома. Просто потому, что мы вовлечены в товарно-денежный обмен. А робот не вовлечён. Он никогда не получал зарплату и не ходил с ней в магазин. И ещё он никогда не держал в руках ветхие купюры (у него рук нет). Ему не может быть понятно, о чём речь. Это объекты, не принадлежащие к тому миру, в котором он живёт.

            Ещё раз подчеркну, что речь идёт не о составлении качественного подстрочника, а о high-end переводе. Понятно, что результат работы начинающего переводчика или переводчика, не погрузившегося на всю глубину сути происходящего, будет хуже подстрочника, выданного супер-пупер алгоритмом.


        1. michael_vostrikov
          28.02.2017 12:45
          +1

          Второй способ — это манипулирование строками символов.
          Формально — да, но тут не лишне вспомнить, что текст — это совсем не всегда просто последовательность символов. Кроме символов есть контекст.

          Какой же это способ, если он не решает задачу?


          Машина на вход получила только текст, и контекстом у неё будут только словари, базы знаний, коэффициенты обученной нейросети и прочие общие вещи

          Почему контекстом не может быть предыдущий опыт? Что заложите в нее, то и будет контекстом.


          Можно изготовить робота, для которого наш мир станет естественной средой обитания, но тогда придётся выдать ему паспорт (потому что он по факту стал человеком) и наделить его гражданскими правами.

          Зачем выдавать ему паспорт? Люди вообще только через несколько лет паспорт получают. Это не мешает им переводить текст, например на уроках в школе.


          Оно такое нам надо? Уж лучше мы как-нибудь с подстрочниками (очень качественными, кстати) помучаемся

          Подождите, одно дело "Задача не имеет технического решения ни при каком уровне развития технологий" и совсем другое "Оно такое нам надо?". Вам не надо, другим надо. Это никак не доказывает невозможность решения.


          Способ сделать правильный перевод только один — представить то, что описано, и описать это на другом языке.


          1. maslyaev
            28.02.2017 15:00

            Какой же это способ, если он не решает задачу?
            Задачу «получить текст на другом языке» решает. Но только вот очень большой вопрос, достаточно ли хорошо полученный текст соотносится с исходным. Слова вроде бы подставлены из набора допустимых вариантов, грамматические конструкции корректны, но что там с мыслями, чувствами, нюансами? Если предположить, что читатель перевода по получившемуся тексту сам, лишь слегка поморщившись, восстановит упущенное, то ОК. А если нет?
            Почему контекстом не может быть предыдущий опыт? Что заложите в нее, то и будет контекстом.
            Весь вопрос в том, что это должен быть за опыт. У нас опыт — это вся наша личная предыстория пребывания в нашем грешном мире, включая радости и огорчения, победы и поражения, взаимоотношения с другими людьми и т.п. вещи. Огромный пласт даёт опыт взаимодействия с физической реальностью, включая и ту, которая является нашими собственными телами. Какой опыт программного агента может быть полезен при переводе фразы «было мало воздуха»? Программный агент никогда не попадал в ситуацию, когда ему было мало воздуха, и поэтому ему ничего не остаётся, как по словарю подставить «little air» и побежать дальше.

            Когда я говорил про паспорт, я именно то и имел в виду, что для понимания нужно быть существом, аналогичным имплицитному читателю. Только в этом случае возможно понимание, необходимое для составления качественного перевода. Детям на уроках, кстати, не дают переводить тексты, для которых они ещё не созрели. Например, юридические заморочки, квантовую физику и молекулярную биологию.
            Вам не надо, другим надо. Это никак не доказывает невозможность решения.
            Не, ну если по приколу и невзирая на цену, то да, конечно. Но вопрос ведь в том, чтобы получить дешёвое и практичное решение. Именно это нам надо от техники. А если решение представляет собой искусственного человека, живущего в реальном мире в реальном масштабе времени и, к тому же, ещё и социализированного, то это совсем не то, что мы ожидаем от технических решений.

            Нам ведь хочется механического раба — послушного, исполнительного и эффективного. Такого раба, которого при выходе новой более продвинутой модели мы можем, глазом не моргнув, выбросить в ведро или грохнуть через Shift-Delete. Раб, обладающий собственной полноценной личностью и заявляющий о своих правах, нам на фиг не нужен.
            Способ сделать правильный перевод только один — представить то, что описано, и описать это на другом языке.
            А чтобы представить, нужно быть имплицитным читателем.


            1. michael_vostrikov
              28.02.2017 19:46

              Задачу «получить текст на другом языке» решает.

              Задача стоит перевести текст, а не получить произвольный набор слов на другом языке. Применив этот способ мы перевели текст? По вашим же словам получается что нет. Это примерно тоже самое, что случайно выбирать слова из словаря. Только процент схожести чуть побольше.


              Весь вопрос в том, что это должен быть за опыт. У нас опыт — это вся наша личная предыстория пребывания в нашем грешном мире, включая радости и огорчения, победы и поражения, взаимоотношения с другими людьми и т.п. вещи.

              У робота, как ни странно, тоже опытом будет его личная предыстория. И взаимоотношения с другими людьми. Он может не испытвать радости сам, но может наблюдать ее у людей.


              Программный агент никогда не попадал в ситуацию, когда ему было мало воздуха.

              Для перевода это и необязательно. Как, по-вашему переводятся фантастические произведения? Никто никогда не попадал в описанную в них ситуацию.


              Когда я говорил про паспорт, я именно то и имел в виду, что для понимания нужно быть существом, аналогичным имплицитному читателю.

              Вот ИИ (который называют сильным ИИ) и будет существом, аналогичным естественному интеллекту.


              Детям на уроках, кстати, не дают переводить тексты, для которых они ещё не созрели.

              Опять же, это никак не доказывает невозможность технического решения.


              А если решение представляет собой искусственного человека, живущего в реальном мире в реальном масштабе времени и, к тому же, ещё и социализированного, то это совсем не то, что мы ожидаем от технических решений.

              Техническое решение можно скопировать. В мире существует робот, набирается опыта, а копии его интеллекта используются для перевода текстов.


              Нам ведь хочется механического раба — послушного, исполнительного и эффективного.

              Вам хочется, другим нет. В первую очередь от ИИ требуется решение задач. Это примерно как считать молоток своим рабом.


              А чтобы представить, нужно быть имплицитным читателем.

              Чтобы представить, достаточно иметь средства построения моделей окружающего мира на основе входной информации. Вот с этим пока и есть основная техническая проблема.


              1. maslyaev
                28.02.2017 21:09

                … Только процент схожести чуть побольше.
                Я даже не буду пытаться защищать методику перевода, ориентированную на преобразование последовательностей символов. Скажу лишь, что таким образом можно получать разного качества подстрочники.
                У робота, как ни странно, тоже опытом будет его личная предыстория. И взаимоотношения с другими людьми. Он может не испытвать радости сам, но может наблюдать ее у людей.
                Взаимоотношения в качестве кого? В качестве окошечка для ввода текста? Если мы говорим о переводе через понимание, то обсуждаемый в переводимом тексте предмет должен присутствовать во внутреннем мире переводчика. В принципе, глухой с детства переводчик может перевести отрывок текста про то, как тихонько звучащая мелодия Лунной сонаты Бетховена накладывалась на шум дождя, шорох листьев и отдалённые раскаты грома. Залезет в словарь, найдёт перевод слов, грамматически правильно их свяжет. Но это будет не «через понимание». Даже весьма символическое различие между мужчинами и женщинами уже приводит к тому, что некоторые тексты в переводе, выполненном женщиной, выглядят криво. И наоборот.
                Для перевода это и необязательно. Как, по-вашему переводятся фантастические произведения? Никто никогда не попадал в описанную в них ситуацию.
                Фантастика пишется людьми для людей про людей. Зацепок более чем достаточно, особенно когда это правильная фантастика, то есть написанная по принципу «обычные люди в необычных обстоятельствах или необычные люди в обычных обстоятельствах». Заметьте, и в первом, и во втором случае это люди. Никому в голову не придёт писать о злоключениях IP-пакета в хакнутом DNS :))
                Вот ИИ (который называют сильным ИИ) и будет существом, аналогичным естественному интеллекту.
                Он будет мальчиком или девочкой? Ответ «существо среднего рода» не принимается, потому что ну нафиг заниматься решением психологических проблем сексуально дезориентированного робота. Лучше я сам изучу китайский.
                Техническое решение можно скопировать. В мире существует робот, набирается опыта, а копии его интеллекта используются для перевода текстов.
                Совершенно верно. Можно скопировать, и это удобно. Но что мы потом с копиями будем делать? Боюсь, под пресс они не захотят. Они полноценные человеческие личности со всем присущем нам комплектом приколов, включая инстинкт самосохранения и стремление к справедливости.
                Вам хочется, другим нет.
                Вполне допускаю, что могут быть и другие мотивы. Но если говорить не об извращениях и не о психопатологиях, то мотивация технаря — это решение задачи более эффективным, чем ранее, способом. Проще, дешевле, выше, быстрее. Железная тётя, психующая по поводу собственной железности — совсем не похоже на «проще» и «дешевле».
                В первую очередь от ИИ требуется решение задач. Это примерно как считать молоток своим рабом.
                Молоток мой — раб мой. Впрочем, нет, между инструментом и рабом есть существенная разница. Ещё есть существенная разница между рабом и свободным. Подозреваю, полноценный перевод может делаться только свободным. А мы хотели инструмент. Печалька.
                Чтобы представить, достаточно иметь средства построения моделей окружающего мира на основе входной информации. Вот с этим пока и есть основная техническая проблема.
                И ещё мировоззренческая. Никто не знает, что это за шняга такая, эта самая наша хвалёная модель мира. А некоторые подонки вообще утверждают, что ни о каких моделях внутри черепной коробки говорить вообще нельзя.


                1. michael_vostrikov
                  01.03.2017 06:41

                  Взаимоотношения в качестве кого? В качестве окошечка для ввода текста? Если мы говорим о переводе через понимание, то обсуждаемый в переводимом тексте предмет должен присутствовать во внутреннем мире переводчика.

                  В качестве субъекта окружающего мира. Я имею в виду не программу в компьютере, а робота с камерой и миркрофоном, то есть с устройствами ввода разной информации.


                  Даже весьма символическое различие между мужчинами и женщинами уже приводит к тому, что некоторые тексты в переводе, выполненном женщиной, выглядят криво.

                  И это опять же не доказывает технической невозможности перевода.


                  Заметьте, и в первом, и во втором случае это люди.

                  Совсем необязательно. Фантастика разная бывает. Но для правильного перевода текста все равно необязательно попадать в описанную ситуацию.


                  Он будет мальчиком или девочкой? Ответ «существо среднего рода» не принимается, потому что ну нафиг заниматься решением психологических проблем сексуально дезориентированного робота.

                  У него не будет психологических проблем. Он будет роботом, устройством для анализа входной информации. Кроме того, ничего не мешает сделать так, чтобы его не волновали определенные вопросы, даже если это вдруг случится.


                  Лучше я сам изучу китайский.

                  Вам проще самому изучить, для других это не подходит. И это тоже не доказывает технической невозможности перевода.


                  Но что мы потом с копиями будем делать? Боюсь, под пресс они не захотят. Они полноценные человеческие личности со всем присущем нам комплектом приколов, включая инстинкт самосохранения и стремление к справедливости.

                  Нет. ИИ стремятся сделать в том числе и для того, что исключить влияние на реультат человеческих недостатков. Никто не будет делать ИИ с инстинктом самосохранения. А если сделают, можно его отключить. С ненужными копиями будет происходить то же, что и с любой другой программой. Просто стереть с диска.


                  мотивация технаря — это решение задачи более эффективным, чем ранее, способом. Проще, дешевле, выше, быстрее. Железная тётя, психующая по поводу собственной железности — совсем не похоже на «проще» и «дешевле».

                  Обойтись без участия человека там, где ранее было обойтись нельзя, это тоже "эффективнее".
                  И с чего вы взяли, что кто-то будет психовать? Вы это постоянно постулируете, причем вместо доказательства принципиальной технической невозможности.


                  Подозреваю, полноценный перевод может делаться только свободным. А мы хотели инструмент.

                  Нет. Принцип перевода не зависит от того, кто переводит. Результат может отличаться, но принцип нет.


                  И ещё мировоззренческая. Никто не знает, что это за шняга такая, эта самая наша хвалёная модель мира.

                  А это неважно, как оно там с философской точки зрения. Главное найти технический способ сделать такую программу.


                  Итого. Вместо доказательств вы привели только свое личное мнение и предположения. Никаких принципиальных ограничений для правильного перевода машиной нет. Так что вопрос остается открытым до тех пор, пока не найдут такие ограничения, либо не построят робота для переводов.


                  1. maslyaev
                    01.03.2017 13:30

                    В качестве субъекта окружающего мира.
                    «Окружающий мир» — понятие очень неконкретное. Сильно зависит от субъекта и от ситуации. У меня один окружающий мир, у моей собаки другой, у почтового клиента третий, у SQL-сервера четвёртый. Атомы, конечно, одни и те же, но смыслы, означаемые этими атомами, все разные. Перевод текста, как и любой другой вид работы с информацией — это именно работа со смыслами, и поэтому очень важно, чтобы для переводчика зелёный цвет был тем же самым зелёным цветом, что и для автора текста. И чтобы тем же самым были любовь, ненависть, благородство, предательство, боль, надежда на будущее, отчаяние и т.п. вещи. Просто дотянуть видеосигнал от камеры и аудиопоток с микрофона вовнутрь коробочки — это ни о чём.
                    И это опять же не доказывает технической невозможности перевода.
                    Я обещал рассказать, почему задача не имеет технического решения, но я не обещал дать корректное со всех точек зрения доказательство. Если говорить в терминах «возможно / невозможно», то конечно возможно. Просто цена слишком высока, и эта цена имеет внутри себя гадскую компоненту, которая не снижается технологическим развитием.
                    И ещё мировоззренческая. Никто не знает, что это за шняга такая, эта самая наша хвалёная модель мира.
                    А это неважно, как оно там с философской точки зрения. Главное найти технический способ сделать такую программу.
                    Раньше люди верили в божественные чудеса и силу молитвы. Соответственно, если ставилась ранее не решённая задача, то первой мыслью было «надо найти такую молитву, которая донесёт до Всевышнего нашу просьбу». Сейчас мы очарованы чудесами техники и нам кажется, что поможет «технический способ сделать такую программу». Соответственно, лихорадочно думаем над тем, как в программе формализовать модель мира так, чтобы эта модель верно отражала окружающий мир. В общем, конечно, правильно. Не надо задумываться над тем, что у нас добрая половина базовых концепций логически несостоятельна. Надо кодить.


                    1. michael_vostrikov
                      01.03.2017 14:07

                      У меня один окружающий мир, у моей собаки другой, у почтового клиента третий, у SQL-сервера четвёртый.

                      Вот и у робота свой. Тем не менее, треугольник в его мире останется фигурой с тремя углами, а не с четырьмя.


                      Перевод текста, как и любой другой вид работы с информацией — это именно работа со смыслами

                      Вот про это я и говорю. По входной информации на одном языке строится внутреннее представление того, что эта информация описывает. А потом это внутреннее представление описывается другим языком.


                      Просто дотянуть видеосигнал от камеры и аудиопоток с микрофона вовнутрь коробочки — это ни о чём.

                      Я не говорил, что надо просто дотянуть. Я говорил, что робот с ИИ это не окошечко для ввода текста.


                      Я обещал рассказать, почему задача не имеет технического решения, но я не обещал дать корректное со всех точек зрения доказательство.

                      Вы говорите, "я думаю, что робот будет истерить и психовать" и "оно мне не надо". Это никак не связано с возможностью или невозможностью технического решения.


                      Просто цена слишком высока, и эта цена имеет внутри себя гадскую компоненту, которая не снижается технологическим развитием.

                      Это вам так кажется, при этом вы не дали никаких обоснований для того, чтобы так считать. Вы просто это постулируете — "робот будет делать так, поэтому...". А робот не будет делать так. Потому что ничто не мешает сделать другого робота.


                      Не надо задумываться над тем, что у нас добрая половина базовых концепций логически несостоятельна.

                      Опять же это вам так кажется. Если люди не могут что-то объяснить, то это не значит, что объяснения нет в принципе. Что в вашем понимании "логически несостоятельна"? Я не знаю ни одной такой концепции.


                      1. maslyaev
                        01.03.2017 14:56

                        Что в вашем понимании «логически несостоятельна»? Я не знаю ни одной такой концепции.
                        Это очень большая (и интересная) тема. Я не уверен, что есть смысл раскрывать её здесь и сейчас.

                        Под логической несостоятельностью я имею в виду наличие внутренних противоречий и/или логических петель. Например, концепция «модель мира» содержит в себе контрпродуктивную логическую петлю, заключающуюся в том, что когда мы говорим о любых моделях, мы неявно подразумеваем, что есть субъект, пользующийся этой моделью. Субъект, у которого в его «голове» тоже складывается модель мира, которой пользуется… и так далее в дурной логической петле.

                        Отсюда принципиальный момент, упускаемый примерно всеми энтузиастами ИИ: нужно как-то так исхитриться, чтобы «изделие» обходилось без моделей внутри себя. Просто потому, что когда в основу положена логически несостоятельная концепция, результатом проектирования будет технически несостоятельное устройство.

                        Если же убрать концепцию моделирования мира, то неизбежно приходим к тому, что ИИ сам должен стать плотью от плоти той предметной области, в которой он работает. В случае с пониманием естественного языка он должен сам стать существом, наравне со всеми остальными обитающем в языковой среде. То есть, фактически, человеком. То есть не программой на жёстком диске. Это и есть та неустранимая часть цены, которую нужно заплатить за удовольствие.


                        1. michael_vostrikov
                          01.03.2017 19:03

                          Например, концепция «модель мира» содержит в себе контрпродуктивную логическую петлю, заключающуюся в том, что когда мы говорим о любых моделях, мы неявно подразумеваем, что есть субъект, пользующийся этой моделью. Субъект, у которого в его «голове» тоже складывается модель мира, которой пользуется

                          Есть субъект. У него на основе входной информации складывается некоторая модель мира. Он же ей и пользуется. Где тут петля? У другого субъекта своя модель мира.
                          Часть понятий модели связывается с понятием "Я". "Я" это просто понятие, примерно такое же как "он", оно не содержит внутри себя других понятий и модели в целом.


                          1. maslyaev
                            01.03.2017 21:18

                            Есть субъект. У него на основе входной информации складывается некоторая модель мира. Он же ей и пользуется. Где тут петля?
                            Сама идея моделирования (можете взять любое определение этого вида деятельности) предполагает, что берётся некая штучка, свойства которой совпадают с изучаемыми свойствами моделируемой системы. И познающий субъект вместо того, чтобы лазить за инфой в моделируемую систему (это может быть долго, дорого, геморно и не всегда возможно), играет с моделью.
                            Ключевое в этой истории то, что субъект получается отдельно от модели. Модель для субъекта — часть внешнего мира. Прокси к менее доступным явлениям остальной реальности.

                            Если мы принимаем, что в голове есть модель, то где субъект? Стоя на твёрдых естественнонаучных позициях, мы его тоже помещаем в свою голову. Итого, у нас в голове образовались две логически разные подсистемы: модель и субъект. Дальше мы или полагаем, что внутримозговой субъект — полный болван и ничего не понимает, или соглашаемся с тем, что у него самого внутри есть модель мира. Но только его внешний мир теперь в значительной мере состоит из ставшей внешней по отношению к нему модели (активно юзает прокси). Итак, у нас получилась модель второго порядка в голове субъекта второго порядка. Но где же субъект, юзающий модель второго порядка? Правильный ответ: это субъект третьего порядка в «голове» субъекта второго порядка. Логическая петля.

                            Вся эта бредятина известна в среде мозговедов как «теория гомункла». Об неё, понятное дело, вытерли ноги все, кому не лень. Ибо действительно полный шлак. Но юмор в том, что существование внутримозгового гомункла является неизбежным следствием концепции «модель мира». А концепция эта сейчас по сути является безальтернативным мэйнстримом. В общем, такая печалька.


                            1. michael_vostrikov
                              01.03.2017 22:07

                              Ключевое в этой истории то, что субъект получается отдельно от модели. Модель для субъекта — часть внешнего мира.
                              Это только один из смыслов. В общем случае, модель это то, что заменяет реальный объект. Она необязательно должна быть частью внешней системы.
                              Модель есть абстрактное представление реальности в какой-либо форме (например, в математической, физической, символической, графической или дескриптивной), предназначенное для представления определённых аспектов этой реальности и позволяющее получить ответы на изучаемые вопросы.

                              Я даже больше скажу, без внутренних моделей вы ни одну систему не построите. В простом случае модель это просто входные данные — плюс/минус у конденсатора, схема расположения ножек у микросхемы. В сложном она выделяется в отдельную составляющую системы — для импорта данных из внешнего источника надо построить внутреннюю модель, как интерпретировать эти данные, например, сделать тип данных.

                              что в голове есть модель, то где субъект? Стоя на твёрдых естественнонаучных позициях, мы его тоже помещаем в свою голову.
                              Модель в памяти субъекта (например, человека или робота). Больше никуда ничего помещать не надо, не знаю, что вы имеете в виду.


                              1. maslyaev
                                01.03.2017 22:55

                                Модель есть абстрактное представление реальности в какой-либо форме (например, в математической, физической, символической, графической или дескриптивной), предназначенное для представления определённых аспектов этой реальности и позволяющее получить ответы на изучаемые вопросы.
                                Самое главное выделил жирным. По-любому должен быть кто-то, (или на худой конец что-то) кто использует модель для получения ответов на изучаемые вопросы. При этом сам с этой моделью совпадать не должен.
                                Говорю же, мерзкий гомункл при такой постановке вопроса неизбежен.
                                без внутренних моделей вы ни одну систему не построите
                                Вот потому и безальтернативный мэйнстрим. Для того, чтобы избавиться от внутриголовных моделей (и выгнать наконец внутриголовных гомунклов), нужно так перевернуть всё наше мировоззрение, что нужно трижды подумать, прежде чем пускаться в такие приключения.


                                1. michael_vostrikov
                                  02.03.2017 06:21

                                  По-любому должен быть кто-то, (или на худой конец что-то) кто использует модель для получения ответов на изучаемые вопросы. При этом сам с этой моделью совпадать не должен.

                                  Вы почему-то упорно не признаете, что может быть другой вариант. Что то, что использует модель, само является частью модели. Вернее, частью информационной системы. Эту часть можно назвать блок анализа. В нем не нужна своя внутренняя модель, это части одной системы, поэтому в качестве нее используется существующая модель. Внешняя по отношению к блоку, но внутренняя по отношению к информационной системе в целом.


                                  Для того, чтобы избавиться от внутриголовных моделей, нужно перевернуть наше мировоззрение

                                  Не надо ничего переворачивать, никаких гомункулов нет. Не знаю, почему вы так считаете. Всё нормально объясняется и без них.


                                  1. maslyaev
                                    02.03.2017 14:19

                                    Что то, что использует модель, само является частью модели.
                                    Технически мы можем накрутить что угодно, но если модель является частью юзера модели (или наоборот), то это уже противоречит тому, что мы считаем моделированием во всех остальных случаях. Терминологическая путаница, сразу уводящая рассуждения в ложном направлении. Слово «модель» в данном случае использовать нельзя. Словосочетание «картина мира», кстати, тоже, потому что картина предполагает зрителя, а это опять мерзкий внутримозговой гомункл.
                                    Всё нормально объясняется и без них.
                                    Во-первых, не объясняется. Если Вы вдруг забыли, то я напомню, что загадка мышления — это сейчас один из самых гнусных нерешённых вопросов. Редко кому даже из серьёзных профессиональных исследователей удаётся обсуждать эту тему, не сваливаясь в конце концов в «тонкие материи», боженьку и прочую галимую мистику.

                                    Во-вторых, не в объяснениях дело. Объяснять можно что угодно чем угодно. Самые объясняющие объяснения всему на свете есть в Библии, Коране и прочих священных книгах, не счесть им числа. Но что толку? Нам, технарям, проку от этих объяснений — строго ноль. Нам нужны работающие рецепты. Чтобы собрал, включил, работает. Пока же мы имеем, что даже хвалёный google translate выдаёт откровенную хрень.

                                    Вот, например, предыдущий абзац, пропущенный туда-обратно через гуглоперевод на английский:
                                    Во-вторых, независимо от объяснения. Объясните все возможно все. Большинство объяснений объяснить все в мире находится в Библии, Корана и других священных книг, они не находят число. Но что толку? Мы, технари, много хорошего эти объяснения — строго равен нулю. Нам нужно работать рецепты. Для того, чтобы собрать, и бег. В то же время, у нас есть, что даже хваленая Google Translate дает прямую дерьмо.


                                    1. drafterleo
                                      02.03.2017 15:00

                                      даже хвалёный google translate выдаёт откровенную хрень.

                                      Эх, посмотреть бы ещё, что выдаёт не менее хвалёный Compreno, у которого все эти «модели» и «картины мира» заданы явно (у них это называется «онтологии») и практически вручную — тяжёлым, непосильным трудом нескольких десятков филологов (навевает параллели со средневековым проектом кардинала-доминиканца, зарядившего порядка 500 собратьев по ордену составлять библейский конкорданс).


                                      1. maslyaev
                                        02.03.2017 15:16

                                        Да уж, по ссылке на описание Compreno очень не хватает окошечка для ввода текста. Позубоскалили бы от души.


                                    1. michael_vostrikov
                                      02.03.2017 15:20

                                      то это уже противоречит тому, что мы считаем моделированием во всех остальных случаях

                                      "Модель есть абстрактное представление реальности в какой-либо форме". Никакого противоречия нет. Слово модель использовать можно. Да и неважно, как это назвать, результат от этого не меняется. Технически возможно сделать систему, в которой будет модель окружающего мира.


                                      Во-первых, не объясняется.

                                      Объясняется. Неизвестны детали реализации, но никакое мировоззрение переворачивать не надо.


                                      Во-вторых, не в объяснениях дело. Нам нужны работающие рецепты.

                                      Если рецептов еще нет, это не значит, что задача в принципе нерешаема, и надо придумывать рекурсивные сущности, которые должны доказывать ее нерешаемость.


                                      1. maslyaev
                                        02.03.2017 17:33

                                        «Модель есть абстрактное представление реальности в какой-либо форме»
                                        Представление кому?
                                        Технически возможно сделать систему, в которой будет модель окружающего мира.
                                        С какой-то интересующей (опять же, кого?) степенью раскрытия отдельных аспектов — да, но так, чтобы глобально всё-всё-всё — безусловно нет. Разбабахивание далеко вширь утыкается в ограничения СТО, запрещающей говорить об одновременности разнесённых в пространстве событий, а заковыривание далеко вглубь утыкается в ограничения КМ, запрещающей копировать квантовые состояния объектов. Приходится довольствоваться частичными моделями, функциональность которых определяется, как Вы, наверно, уже догадались, потребностями юзера. То есть от юзера модели при моделировании никуда не деться.
                                        Неизвестны детали реализации
                                        Плевать на детали. Работа мозга — информационный процесс, а суть информационного процесса параллельна подробностям его реализации. Сложение что в столбик на бумажке, что на деревянных счётах, что на АЛУ Core i7 — одно и то же сложение. На одних и тех же исходных данных обязан получиться один и тот же результат. Детали реализации безусловно важны, но для начала очень не помешало бы разобраться с тем, что там вообще происходит. Научиться обо всём этом говорить так, чтобы не натыкаться на каждом шаге на абсурд и самопротиверечия.
                                        Если рецептов еще нет, это не значит, что задача в принципе нерешаема
                                        Есть ещё вероятность того, что сама задача сформулирована криво. Или решение есть, но оно совсем не похожее на то, о чём мечталось. Например, алхимики веками бились над задачей трансмутации, и вот наконец она решена. Получить золото из других веществ — не проблема. Нужен лишь ускоритель частиц, и будет вам золото. В количестве нескольких атомов в секунду :))


                                        1. michael_vostrikov
                                          02.03.2017 21:09

                                          Представление кому?

                                          Тому, кто его анализирует. Например, компьютеру, который на основе введенной в него модели раскладывает звук на составляющие, используя преобразование Фурье.


                                          С какой-то интересующей (опять же, кого?) степенью раскрытия отдельных аспектов — да, но так, чтобы глобально всё-всё-всё — безусловно нет.

                                          Скажем так, можно сделать с такой степенью детальности, которая используется у естественного интеллекта.


                                          Плевать на детали. Работа мозга — информационный процесс, а суть информационного процесса параллельна подробностям его реализации. Сложение что в столбик на бумажке, что на деревянных счётах, что на АЛУ Core i7 — одно и то же сложение.

                                          Тем не менее, до деталей реализации сложения в столбик доходили не одну сотню лет. Так что детали очень важны.


                                          Детали реализации безусловно важны, но для начала очень не помешало бы разобраться с тем, что там вообще происходит.

                                          "Что там происходит" это и есть детали. Но если вы имеете в виду "в общих чертах", то я вам описал это в предыдущем комменте. В общих чертах все нормально объясняется без всяких рекурсивных сущностей. И насколько я могу судить, в моем описании нет противоречий. Есть только неизвестные детали реализации.


                                          Есть ещё вероятность того, что сама задача сформулирована криво.

                                          Задача сформулирована просто и понятно — сделать аналог естественного интеллекта, который сможет его заменить в некоторых или в любых задачах.


                                          1. maslyaev
                                            03.03.2017 15:58
                                            +1

                                            сделать аналог естественного интеллекта, который сможет его заменить в некоторых или в любых задачах
                                            «В некоторых» — done.
                                            «В любых»… дичь какая-то.

                                            Ах, как мне, автоматизатору, знаком зуд «исключить человеческий фактор». Когда меня окончательно этим достают, я обычно предлагаю говорящему в первую очередь исключить из процесса его собственный фактор. Почему-то пациенты начинаю дёргаться и беситься. Почему-то никто не хочет исключать собственный фактор. Всем хочется царствовать. Милостиво повелевать соизволять. И чтобы вокруг на идеально ровном брезентовом поле ровными рядами росли вкусные алюминиевые огурцы.

                                            Откуда такая ненависть ко всему живому — для меня загадка. Ладно бы ещё если бы эта дурь давала клиенту эгоистическую выгоду, так ведь нет же. Исключение человеческого фактора делает систему нечеловеческой. То есть такой, которая неприменима к решению человеческих задач. Алюминиевые огурцы оказываются несъедобными. И каждый раз одно и то же, снова и снова. Господи, вразуми этих идиотов, ибо не ведают они, чего хотят.


                                            1. michael_vostrikov
                                              03.03.2017 18:59

                                              «В любых»… дичь какая-то.

                                              Если искусственный интеллект будет полным аналогом естественного, он сможет действовать аналогично ему в любых задачах. Ничего дикого тут нет. Обычные законы природы.


                                              я обычно предлагаю говорящему в первую очередь исключить из процесса его собственный фактор. Почему-то пациенты начинаю дёргаться и беситься

                                              Потому что вы подменяете понятия. "Исключить человеческий фактор" означает исключить возможность ошибки из-за человеческих недостатков. А вы предлагаете исключить участие человека полностью, причем того человека, которому это надо. Который вам, как автоматизатору, платит деньги, либо работает на того, кто платит деньги. Если вы предложите начальнику возможность не совершать ошибок, он только рад будет. Только таких решений еще не придумали.


                                              Предложите исключить собственный фактор рабочим в шахтах и рудниках. С тем, чтобы часть прибыли от работы робота шла им на ежемесячную компенсацию. Думаю, они только рады будут.


                                              Исключение человеческого фактора делает систему нечеловеческой. То есть такой, которая неприменима к решению человеческих задач.

                                              Человеческая задача — посчитать доходы и расходы за текущий месяц. Человеческий фактор — в одном месяце посчитать правильно, в другом нет, так как из-за усталости человек пропустил одну цифру. Исключение человеческого фактора — сделать программу для расчетов на компьютере, которая не устает. Система "нечеловеческая"? Да. Применима к решению человеческих задач? Да. Вывод — ваше высказывание неверно.


                                              1. maslyaev
                                                03.03.2017 22:22

                                                Если искусственный интеллект будет полным аналогом естественного, он сможет действовать аналогично ему в любых задачах.
                                                Что значит «полный аналог»? Если это полный аналог, то он тоже должен любить котят и щенят, испытывать безотчётную ненависть к тараканам, тупить над простыми задачами, прокрастинировать, попадаться на финансовые пирамиды, верить рекламе и иногда уходить к кришнаитам?

                                                Мы где-то в глубине своего понимания считаем, что ум — это что-то вроде магической субстанции, которой бывает больше или меньше. Вот у козявки её совсем мало, у голубя побольше, у собаки ещё больше, а у нас, человеков — ваще капец много. Царь природы, как-никак. Компьютеры пока ещё глупые, но мы работаем над тем, чтобы магической субстанции в них стало содержаться больше. Когда её станет столько же, сколько у человека, он сможет «действовать аналогично ему в любых задачах». Дело ведь в количестве магической субстанции, разве нет?

                                                Конечно, нет. Интеллект невозможно выразить скалярной величиной, следовательно операции сравнения «больше/меньше», «хуже/лучше», «выше/ниже» к нему вообще неприменимы. Операции сравнения неприменимы даже к векторам (длины векторов, выражаемые скалярными величинами, сравнивать можно, а сами векторы — нет). Никакой магической субстанции не существует, и подсчитывать и сравнивать её количества не нужно.

                                                Вся концепция «сильный ИИ» построена на том, что дело всего лишь в количестве ума. Про магическую субстанцию никто, конечно, не говорит, но само сравнение «сильнее/слабее» подразумевает, что есть штука, количество которой мы имеем для простого скалярного сравнения. Но магической субстанции «ум» не существует. То есть совсем не существует. Соответственно все рассуждения, начинающиеся с «когда интеллект компьютеров превзойдёт...» — несусветная глупость.
                                                А вы предлагаете исключить участие человека полностью, причем того человека, которому это надо. Который вам, как автоматизатору, платит деньги
                                                Мне платят деньги за решение задачи. Если задача не может быть решена без того, чтобы вправить клиенту мозги, приходится вправлять мозги. На выходе должна получиться работающая система, а не смутные воспоминания о том, как было приятно общаться с приятным человеком.
                                                … Система «нечеловеческая»? Да. Применима к решению человеческих задач? Да. Вывод — ваше высказывание неверно.
                                                В данном случае система — инструмент. Она становится механистическим продолжением мозга бухгалтера. Точно так же, как топор становится продолжением руки плотника. Инструментальный подход. Мы не заменяем человека, но даём ему артефакты, при помощи которых он действует эффективнее. Не рабов механических даём, которые работают вместо человека. Работает по-прежнему человек, но с инструментами ему это делать удобнее, производительнее, эффективнее, точнее.


                                                1. hungry_ewok
                                                  03.03.2017 23:15

                                                  >Конечно, нет. Интеллект невозможно выразить скалярной величиной, следовательно операции сравнения «больше/меньше», «хуже/лучше», «выше/ниже» к нему вообще неприменимы.

                                                  /усмехаясь/
                                                  … и вместо «волшебной субстанции 'интеллект'» получается еще более волшебная субстанция 'душа'. Которая, значится у человека есть, потому что он по образу и подобию божьему, а у прочих — животных там, козявок, язычников, атеистов и тэдэ итэпэ её нет и быть не может, ага.

                                                  >Инструментальный подход. Мы не заменяем человека, но даём ему артефакты, при помощи которых он действует эффективнее. Не рабов механических даём, которые работают вместо человека. Работает по-прежнему человек, но с инструментами ему это делать удобнее, производительнее, эффективнее, точнее.

                                                  А если даем архитектору инструмент «бригада строителей», которые строят здание вместо него, то это что?


                                                  1. maslyaev
                                                    04.03.2017 17:39
                                                    +1

                                                    … и вместо «волшебной субстанции 'интеллект'» получается еще более волшебная субстанция 'душа'. Которая, значится у человека есть, потому что он по образу и подобию божьему
                                                    Бога, конечно, нет, но понятие «душа», если им аккуратно пользоваться, оказывается очень полезным. Как способ обозначить одним словом весь комплект нематериальных активов человека.
                                                    А если даем архитектору инструмент «бригада строителей», которые строят здание вместо него, то это что?
                                                    У архитектора с бригадой строителей в лучшем случае симбиоз, а в худшем — паразитизм. А это всё уже совсем другая сказка.


                                                1. michael_vostrikov
                                                  03.03.2017 23:25

                                                  Если это полный аналог, то он тоже должен любить котят и щенят.

                                                  Капитан Очевидность подсказывает, что не все люди любят котят и щенят. Кто-то любит, кто-то не любит, кому-то без разницы. Нет никакой проблемы в том, чтобы ИИ тоже было без разницы.


                                                  Мы где-то в глубине своего понимания считаем, что ум — это что-то вроде магической субстанции

                                                  Это вы так считаете. Я например считаю, что никакой магии нет.


                                                  которой бывает больше или меньше. Вот у козявки её совсем мало, у голубя побольше, у собаки ещё больше
                                                  разве нет? Конечно, нет. Интеллект невозможно выразить скалярной величиной, следовательно операции сравнения к нему вообще неприменимы

                                                  Научите собаку решать дифференциальные уравнения. Скажете, не получится? А почему?


                                                  Никакой магической субстанции не существует, и подсчитывать и сравнивать её количества не нужно.

                                                  Никто не подсчитывает количество магической субстанции. Сравнивают конкретные характеристики в конкретных задачах. Вы сначала придумали какую-то необъяснимую сущность, почему-то решили, что все ее считают, а потом доказываете, что ее нет, и из этого делаете вывод, что сравнивать нельзя. Естественно, нет. Есть некоторые принципы работы.


                                                  Вся концепция «сильный ИИ» построена на том, что дело всего лишь в количестве ума.

                                                  Нет. Между нейросетями и принципами естественного интеллекта разница качественная, а не количественная. И это не концепция, а просто название. А сравнение идет по спектру задач, которые он может решать, в отличие от слабого. Например, перевод текста. Плюс одна задача. Вот и количество появилось.


                                                  В данном случае система — инструмент. Работает по-прежнему человек.

                                                  Работает программа. Начальник может в бух-учете ничего не знать, а просто получать отчеты раз в месяц по e-mail. И да, ИИ это тоже инструмент. Который сможет решать задачи более эффективно, чем это делает компьютер.


                                                  В общем, нравится вам верить в необъяснимые вещи, дело ваше.


                                                  1. maslyaev
                                                    04.03.2017 22:47

                                                    Нет никакой проблемы в том, чтобы ИИ тоже было без разницы.
                                                    Отбросить каждую конкретную «фишку» — действительно без разницы. Но если отбросить две, то уже не так без разницы. Я бы предпочёл, чтобы котята и щенята остались, лишь бы тупость и алчность ушли.
                                                    Научите собаку решать дифференциальные уравнения.
                                                    Для того, чтобы поймать в прыжке фрисби, собаке фактически нужно решить не хилую систему дифуров. Так что не клевещите на собаченек. Всё в порядке у них с дифурами.
                                                    Сравнивают конкретные характеристики в конкретных задачах.
                                                    Это верно для «слабого ИИ». Именно он про конкретные задачи. Сильный — про все задачи.
                                                    Например, перевод текста. Плюс одна задача
                                                    Задача с подковыркой. «Strong AI only». Потому до сих пор и не решена. И, по ходу дела, не будет решена.
                                                    В общем, нравится вам верить в необъяснимые вещи, дело ваше.
                                                    Как раз всё строго наоборот. Никаких необъяснимых вещей, всё рацонально и прагматично. А то, что слегка причудливо и отличается от популярных мемов — ну извините.


                                                    1. michael_vostrikov
                                                      05.03.2017 07:07
                                                      +1

                                                      Для того, чтобы поймать в прыжке фрисби, собаке фактически нужно решить не хилую систему дифуров.

                                                      Нет. Вы подменяете понятия. Прыжок может и описывается системой дифуров, но собака ее не решает. Она определяет силу прыжка на основе опыта. Так же как и не сможет решить другую произвольно заданную систему для решения конкретной задачи. А человек-математик сможет. И да, вы ушли от ответа.


                                                      Кстати, раз уж речь зашла о животных. У них в данной терминологии тоже "сильный" интеллект. Потому что они могут распознавать образы и принимать на основе этого решения. В отличие от. Так что "сильный ИИ" тоже бывает разного уровня силы.


                                                      Именно он про конкретные задачи. Сильный — про все задачи.

                                                      Тут у вас какая-то демагогия. От наличия слабого ИИ "все задачи" никуда не делись. Часть он решает, часть нет. Сильный решает больше задач, потому что "все" это больше чем "часть". При этом сильный ИИ вполне может решать часть задач менее эффективно, чем слабый, по причине более сложной обработки и при этом ограниченных вычислительных ресурсов. Так же как и человек, который складывает большие числа менее эффективно, чем калькулятор.


                                                      Как раз всё строго наоборот.

                                                      Как же это наоборот, если вы говорите, что аналог ЕИ сделать нельзя, просто потому что нельзя. Вы верите в уникальность и необъяснимость ЕИ. А как только речь заходит о причинах, вы говорите мнение в стиле "я бы предпочёл".


                                                      1. maslyaev
                                                        06.03.2017 13:32

                                                        Нет. Вы подменяете понятия. Прыжок может и описывается системой дифуров, но собака ее не решает.
                                                        Вы правы. Совершенно верно. У собаки нет никаких шансов сдать зачёт по дифурам :))
                                                        Вы верите в уникальность и необъяснимость ЕИ. А как только речь заходит о причинах, вы говорите мнение в стиле «я бы предпочёл».
                                                        Никаких уникальностей и необъяснимостей. Моё «я бы предпочёл...» обусловлено исключительно тем, что если браться хоть сколь-нибудь адекватно раскрывать эти темы, то получится очень много букв. Тема «интеллект» и всё, что болтается вокруг неё, сейчас представляет собой какой-то диковинный клубок весьма респектабельных мифов и предрассудков. Чтобы его распутать, копать нужно очень глубоко. И аккуратно. Выстроить надёжную методическую основу, и в правильной последовательности тщательно перебрать всю систему понятий и концепций, лежащую где-то совсем глубоко внутри наших представлений о том, что есть мир и что есть мы в нём. Глубоко закопанная ветка обсуждения — точно не лучшее место для этого.

                                                        В принципе, я мог бы замутить серию лонгридов здесь, на хабре, или, может быть, лучше на гиктаймсах. Пока у меня нет ощущения, что публика созрела к тому, чтобы поразбираться в этих вопросах предельно честно и серьёзно. Или я не прав?


                                                        1. drafterleo
                                                          06.03.2017 14:12

                                                          Непременно мутите. Разобраться может и не разберусь (тем более — предельно честно), однако прочту с удовольствием. Если опубликуетесь, закиньте, пожалуйста, ссылочку в этот блог.


                                                        1. dimm_ddr
                                                          06.03.2017 17:33

                                                          Скажите, насколько глубоко вы разбираетесь в области ИТ искусственный интелект и во всей математике за этой областью стоящей? По вашим словам есть подозрение что вы просто не в курсе всех тех работ, которые по этой теме уже сделаны и собираетесь начать делать то же самое, но в одиночку.


                                                          1. maslyaev
                                                            06.03.2017 19:58

                                                            Скажите, насколько глубоко вы разбираетесь в области ИТ искусственный интелект и во всей математике за этой областью стоящей?
                                                            То, что сейчас получило гордое название «ИИ» — всего лишь одно из прикладных направлений, связанных с обработкой данных. Не надо, пожалуйста, об этом забывать. Что касается конкретно DML, тот тут я не более, чем дилетант. Прочитать по этой теме толковую лекцию, конечно, могу, но пока сам своими руками эти штуки не потрогаю и не сотворю из них что-нибудь интересное, буду считать себя дилетантом. Захочу я сам играть конкретно в эти игры или предпочту просто понаблюдать — вопрос открытый.

                                                            Речь не про то, чтобы самому забабахать какой-нибудь ИИ. Проблема-то ведь намного глубже. И скилзы тут нужны не по части нейросетевых алгоритмов и прочей IT-специфики. Вспоминать придётся Декарта, Канта, Витгенштейна, Винера, Шеннона, Тьюринга и других достойных товарищей.


                                                            1. dimm_ddr
                                                              07.03.2017 11:32

                                                              Вот именно об этом я и говорю — тема гораздо глубже чем может показаться. Единственное с чем я не согласен — из ваших комментариев у меня создалось впечатление, что вы считаете что по этой теме нет нормальных работ, а только одна болтология, а вот вы сейчас соберетесь и наведете порядок. Я и попытался понять считаете вы так на основании глубокого знакомства с темой или просто ошибаетесь из-за незнания.
                                                              Сделал я этот вывод в том числе на основании вот таких ваших заявлений (конкретно это для примера):

                                                              Тема «интеллект» и всё, что болтается вокруг неё, сейчас представляет собой какой-то диковинный клубок весьма респектабельных мифов и предрассудков.

                                                              Поправьте меня, если впечатление создалось ошибочное.


                                                              1. maslyaev
                                                                07.03.2017 14:58

                                                                Вполне допускаю, что мне просто хронически не везло. Можете посоветовать что-нибудь особо достойное? Вариант «in English» — не пугает.


  1. DmitryKogan
    28.02.2017 00:05

    Статья замечательная — глубокая и остроумная. Но оптимизм автора разделить трудно. Информацию невозможно перевести в знание, это сущности разной природы. Имитировать можно что угодно, кроме смысла. Т.е. виртуозность слога и стиля, безусловно, может быть достигнута алгоритмически, а легкость в мыслях — нет. Видимо, проблема в самой природе сознания и мышления — они не основаны на цифровой математике и не могут быть порождены вычислениями, это своего рода сингулярность, квантовый переход — вспомните Пенроуза


    1. alchemist_ua
      28.02.2017 00:12
      +1

      Дискуссия о «физикализме» и «дуальности» сознания — очень интересная тема. Ключевые философы современности до сих пор ломают копья в ожесточенных спорах еще на уровне дефиниций.

      Но нам, если разобраться, и не нужен робот, который на самом деле мыслит. Нам достаточно «философского зомби», который сможет «симулировать» эмоции для нашего развлечения.

      Это как два типа актеров: один на самом деле переживает все перипетии сюжета, второй просто знает, в какой момент пустить из глаз искусственную слезу. Шутка в том, что мы верим обоим одинаково.


      1. DmitryKogan
        28.02.2017 00:39

        Если речь об имитации, то конечно — проблема очень сложная, но техническая. Но очень сложная


    1. maslyaev
      28.02.2017 15:13
      +2

      Попытка свести свободу воли к неопределённости (пусть даже к квантовой) — дохлый номер. Весь мой жизненный опыт подсказывает, что чем больше человек свободен и сознателен, тем меньше в его действиях неопределённости. Болван, болтающийся на ниточках своих простейших сиюминутных рефлексов как пушинка на ветру, гораздо более непредсказуем, чем достойный чел, который и обещание сдержит, и работу сделает качественно и в срок, и ни в какую дурь не вляпается.

      Да и вообще, неопределённость процесса принятия решений — совсем не та же самая неопределённость, которую мы наблюдаем при подбрасывании монетки. Эти неопределённости имеют совсем разную природу. Не уверен, что мировая философская мысль дозрела до обсуждения природы этих неопределённостей.


      1. DmitryKogan
        28.02.2017 15:25

        Я не о том. Роджер Пенроуз (крупный физик-теоретик) в своих книгах («Голый ум короля» и др.) развивал идею о несводимости мышления к вычислениям любого рода и о том, что его главный момент носит сингулярный характер и сравним с квантовым переходом. Почитайте, там очень интересно.


        1. maslyaev
          28.02.2017 18:03

          То, что мышление не сводится к вычислениям (т.е. не может быть воспроизведено машиной Тьюринга) не знаю кому как, но мне очевидно. Но я напрочь не понимаю, почему вокруг этого такой ажиотаж. К вычислениям сводится только функционирование закрытых систем. Этого требует сама концепция вычисления: данные и алгоритм на входе, потом полностью изолированный от всего процесс, потом результат на выходе. Если же по ходу пьесы извне подтаскиваются какие-то данные, багфиксы и прочая ерунда, то это уже не вычисление. Для того, чтобы это стало вычислением, границы системы нужно расширить так, чтобы туда вошли источники доп. вводных. Но если, сколько ни расширяй, закрытой системы не получается, то остаётся только махнуть рукой на это безнадёжное предприятие.

          Мы, сами того не заметив, научились строить системы, несводимые к вычислениям любого рода. Вот эта хабровская страничка, например, в моём хроме — тоже система, функционирование которой в целом не сводится к вычислению. Я вот в окошечко что-то пишу, мышкой двигаю, что-то по таймеру небось запускается, с сервером общается. Открытая система. Если даже такую штуку принципиально невозможно воспроизвести машиной Тьюринга, то глупо удивляться тому, что наше открытое всей внешней реальности мышление не сводится к вычислению.

          «Новый (не голый) ум короля» читал. Хорошая книжка, поучительная. Лично для меня она особенно примечательна как пример хорошо замаскированного ухода в мистику. Мистика ведь — это совсем не обязательно разглагольствование про богов, демонов и прочие тонкие сущности. Мистика — это в первую очередь склонность прятать непонятное в заведомо непознаваемое. В данном случае, уткнувшись в идеологический тупик (на самом деле ничего страшного, бывает), автор предпочёл спрятать концы в непознаваемость квантовой неопределённости и сделать вид, что всё в порядке. Плохой дядя Роджер. Бяку сделал.


        1. alchemist_ua
          28.02.2017 22:13

          Соотношение мышления и квантовой физики — это как объяснять молнию причудами Зевса. Ни того ни того никто не понимает, давайте их объединим. На самом деле нету никаких доказательств, что сознание возникает на квантовом уровне и не следует напрямую из химии + электрики мозга.


          1. DmitryKogan
            28.02.2017 22:45

            Доказательств нет, действительно. И доказательных опровержений тоже. В этом и проблема. Как будто мы наталкиваемся на какой-то барьер. Наша математика умеет считать, а мы — понимать, причем математикой не пользуясь. Каким-то образом аналоговые физические и химические процессы в нашем мозгу порождают процесс понимания, а цифровые процессы в компьютере этого сделать не могут. И мы с Пенроузом думаем, что это в принципе невозможно.


            1. alchemist_ua
              28.02.2017 23:22

              Ну вот словами «в принципе невозможно» я бы не швырялся. Сто лет назад мы знали о мозге лишь то, что он отвечает за мышление. Двести лет назад и в этом были сомнения. Теперь у нас есть куча данных о том, где и что происходит. Есть прямая зависимость между областями мозга и поведением человека. Тайна сознания пока остаеться тайной, но соседние загадки давно уже разгаданы.
              Кстати хорошая книга: «Когда дыхание растворяется в воздухе». Там нейрохирург очень интересно рассказывает о том, насколько много мы уже знаем о мозге. И насколько быстро мы продолжаем учиться.


              1. DmitryKogan
                01.03.2017 09:26

                Ну, рано или поздно вопрос прояснится. А пока наше дело — переводить проблемы в техническую плоскость и решать их, например, сгенерировать какой-нибудь триллер-бестселлер.


  1. PeterZha
    28.02.2017 00:52

    Как-то в юности написал под DOS простую программу составления стихов, используя в качестве основы собственноручно всхаченный бинарный формат словаря орфографии текстового редактора Лексикон в части выяснения словарной формы и части речи. Стихи программа писала согласно заданному размеру, стопности и типу рифмы, используя шаблоны речи, не требующие сложных согласований (типа прилагательное-прилагательное-существительное, и т.п.). Получался в основном довольно забавный бред, пока однажды из-под ее пера не вышел следующий конец строфы:

    Сталь упростит настилать
    Крупный железный приплод


    Больше с тех пор ее не запускал, Скайнет с нами, просто мы о нем не догадываемся…


    1. alchemist_ua
      28.02.2017 00:57
      +1

      Крутой стих. Я думаю, так же пишут стихи и настоящие поэты: записываешь весь бред, что приходит в голову, а потом смотришь — оно!


      1. PeterZha
        28.02.2017 01:53
        +2

        Когда б вы знали, из какого сора
        Растут стихи, не ведая стыда

        Вообще стихи это в некотором роде как программа, иногда можно два дня сидеть страдать фигней, в итоге выкинуть весь код и переписать одной строчкой, а иногда оно как-то само получается и потом нужно только линтануть и поправить стиль.


  1. ideological
    28.02.2017 11:03
    -1

    Она утверждала, что компьютер, даже очень мощный, не способен ни на творчество, ни даже на то, что мы называем «интеллектом». Ведь любая машина — всего лишь бездумный исполнитель алгоритмов, заложенных в нее человеком. То есть даже если компьютер когда-нибудь и напишет стихотворение или роман — все равно авторские права будут принадлежать кодеру, который его на это запрограммировал.

    Всё именно так и никак иначе.
    Остальное лишь в воображении «непрограмистов» (про все эти сказки о ИИ как замену человеку и права для роботов).


  1. RedSkyNet
    28.02.2017 12:15

    Как художник рисует картину?

    Пейзажист приезжает в красивое место, достаёт инструменты и рисует что видит. Может изменить какие-то детали, поменять закат на восход или исправить пасмурное утро — картина готова.

    Что может противопоставить такому искусству машина?
    Сделать фото этого пейзажа и проделать тоже самое что делает художник — перенести фото на холст.
    Получаем в результате две картины. Сможете ли вы определить какую из них рисовал человек?

    Второй вариант когда художник пишет картину в своей мастерской включая воображение.
    У машины нет воображения, но что считать воображением?
    Если воображение это огромный архив фото-образов, которые за всю свою жизнь накопил художник.
    Часть образов в голове помечена как негативные, другая часть как позитивные, третья часть как счастливые и так далее.
    Можно упростить воображение до списка с фотографиями. сгруппировать тысячи фото по состояниям, которые они отражают. Робот рандомно определит состояние — печаль. Из списка печаль определит также рандомно фото и нарисует его на холсте.
    Можно ли это будет считать за машинное воображение?

    Когда машины полностью возьмут на себя физические труды, нужно оставить людям возможность работать не только операторами. Пусть люди творят.


    1. Ravaldini
      28.02.2017 19:12


      Робот рандомно определит состояние — печаль. Из списка печаль определит также рандомно фото и нарисует его на холсте.
      Можно ли это будет считать за машинное воображение?

      Конечно же можно!
      Например, можно считать, что мы тоже роботы и оцениваем картину по тысяче параметров, которые рандомно переключаются у нас в голове в зависимости от внешней обстановки и нашего состояния.
      Мы ведь уже удивлялись картинам, которые рисуют нейросети…
      А что если этот робот проведет исследование — будет рисовать картины, перебирая разные параметры и настроения, и будет собирать отзывы людей? Так он научится удивлять и в какой-то момент удивит очень сильно!
      А если его спросить, он сможет рассказать, как постепенно подбирал ключ к успеху. Он расскажет об этом своими логами, а может и в формате простейшего диалога.
      Также и с переводом — можно требовать идеального и контекстозависимого перевода, а можно радоваться и тому, что сейчас умеет гугл. В любом случае, роботы смогут переводить тексты с достаточным для понимания смысла качеством.


      1. dimm_ddr
        02.03.2017 18:09

        Например, можно считать, что мы тоже роботы и оцениваем картину по тысяче параметров, которые рандомно переключаются у нас в голове в зависимости от внешней обстановки и нашего состояния.

        Вообще не факт что рандомно даже. Если квантовые эффекты никак не влияют на мышление, то человек окажется детерминированным конечным автоматом полностью зависящим от внутреннего состояния (память, текущее настроение и т.д.) + внешние раздражители. Возможно есть какой-то другой источник случайности для мышления но пока что остаются только квантовые эффекты, да и те в ближайшие несколько лет будут проверять уже.


  1. Emelian
    28.02.2017 19:14

    >... любое искусство существует для того, чтобы вызвать у нас эмоции.
    > Печаль, радость, злость, страх — читатель должен сопереживать героям.

    Это называется «производство впечатлений» (аналогичные визуальные впечатления дают «зрелища»). Только к этому не сводиться литература (о ней, как бы речь). Здесь идет речь о воздействии на эмоциональный уровень человека. А кроме этого существуют еще ментальный и духовный уровни. Высокое искусство работает больше в этом направлении.

    Дети, например, много читают (по крайней мере, читали) не столько ради новых впечатлений, сколько ради получения нового жизненного опыта. Сейчас, правда, книги заменяют мультимедиа. А вот взрослые читают меньше, жизненного опыта у них, как правило, уже достаточно и в обычных книгах они уже не находят ничего интересного для себя. Зато вполне могут читать что-то полезное для себя, например, техническую документацию, учебники, научные статьи и т.п.

    У кого своего уникального жизненного опыта много – стремятся поделиться им с окружающими, хотя бы на уровне мемуаров, дневников или там технических книг и статей. Можно написать, скажем, про свою любовь, но чтобы эти банальности были интересны окружающим, надо хорошо постараться, а именно, описать свои любовные похождения (и не только!) КРАСИВО.

    Другими словами, даже красиво описанные жизненные банальности это уже Литература. Не зря говорят, что красота спасет мир.

    Автор через литературу может эффективно пропагандировать свои идеи. Вспомним, например, цикл произведений К. Кастанеды про Дона Хуана и магию тольтеков. Эти мексиканские учения, почему-то нашили большой отклик у русских в «лихие девяностые». Магией увлеклись сотни тысяч, причем настолько, что очень многие кончили очень плохо. Достаточно почитать об этом книги Странника и поискать информацию о «хакерах сновидений».

    Но главных слов автор статьи так и не сказал. Компьютерные технологии еще не скоро составят конкуренцию литературному творчеству, но ПОМОЧЬ начинающему литератору могут уже сейчас.

    Вот смотрите, есть такая бесплатная замечательная программа Blenler. По сути это электронный помощник художника, даже очень-очень начинающего. Если у вас есть идеи что-то нарисовать, ну там морской шторм, туман в горах, живой огонь и много чего еще, ограниченное только собственной фантазией, то Blender вам с относительной легкостью (после нескольких недель или месяцев тренировки) поможет это сделать. Он научит вас даже ваять мультфильмы с качеством максимально приближенным к реальности (как в современных видеоиграх). В интернете можно найти замечательные видеоролики со 100%-но сгенерированной реальностью, например на тему фэнтези, сделанные с помощью Блэндера.

    Если бы существовал такой же, но литературный Blender, то проблема повышения эффективности создания литературных произведений была бы полностью решена. Зачем нужен Искусственный Интеллект для создания книг, если вполне достаточно создать литературный аналог программы Blender? И все, автор только генерит идеи, а всю черновую работу по наведению марафета (т.е., КРАСОТЫ) осуществляет электронный литературный помощник. Мне лично кажется, что подобная программа уже существует, где-то в недрах Голливуда. Другое дело, что маститые авторы из США не слишком заинтересованы в ее широком распространении.


  1. dimm_ddr
    02.03.2017 18:14

    Это я невнимательно прочитал статью и комментарии или никто здесь не вспомнил что недавно по сценарию написанному нейросетью сняли фильм?