Я давно собирался и наконец-то решился высказать публично и доказать одну крамольную мысль. Датасайентисты из области NLU и NLP могут заранее готовит кирпичи, чтобы швырнуть ими в меня. Будет много жареного!
Начнём с главного - мир ошибается. Де факто! Диалоговые технологии развиваются не в том направлении и не теми темпами. Сайентисты научили алгоритмы превращать звук голоса в текст, а текст обратно в слышимую речь. Но между этими двумя частями находится задача понимания смысла сказанного - того, что было заложено в произнесённый текст. Порой двусмысленное и даже трёсмысленное. По сути - ту часть, которая является мозгом всей системы не могут создать. “Рот” и “уши” сделать сумели, а к голове “прикрепить” их не получается. Вернее, то что подают за решение, решением не является. То что выдают за современные технологии IT-гиганты такой “детский сад”, что мама дорогая! Как это не стыдно выкладывать в мир таким компаниям как Гугл, Майкрософт и Яндекс. Примитивизм и убогость голосовых навыков просто удручает.
А причина почему эту задачку не могут решить ИТ-монстры проста. Решение лежит не в области программирования, а потому должно решаться не программистами, а людьми с совсем другими компетенциями. Но почему-то в нашем мире есть стойкое убеждение, что компьютерщики это некие волшебники, способные придумать и создать решение для любой задачи или проблемы.
Но ведь когда у нас болит зуб, мы же не идём в IT-отдел, чтобы нам там напрограммировали какую-то фичу, от которой перестанут болеть зубы. Хотя было бы прикольно жить в мире, где всё устроено именно так. Но в нашем мире всё по-другому. С подобными проблемами с зубами мы почему-то обращаемся к профильному специалисту. Так почему же с задачей распознавания семантики идут к программистам. И программисты расчехляя scikit-learn и pandas, обещают, что к вечеру всё нашаманят. И самое удивительное они же на полном серьёзе берутся за решение этой задачи. В результате мы получаем то, что, например, называется Яндекс.Алисой или Гугл.Асисстентом. Для аборигенов, впервые попавших в цивилизацию это может выглядеть как чудо, но для людей, рождённых с мобилой в руке это воспринимается как нечто странное.
Спрограммировать базу данных, пользовательский интерфейс, настроить потоки коммуникаций - всё это задачи с очевидными решениями. Конечно, они включают вариативность и каждый разработчик создаст какое-то своё видение. Но сами эти задачи имеют понятное и очевидное решение. Разработка любой CRM - это принятие серии очевидных решений. А вот задача создания эмулятора работы мозга это уже задача без очевидных решений. И даже не то, чтобы без очевидных, а в принципе задача без решений. Вообще непонятно как к ней подступиться. Человечество знает лишь физиологическое устройство мозга, а не ментальные принципы его функционирования. Скопировать решение, блин, неоткуда!
В результате голосовые навыки от наших братьев-разработчиков, это в принципе ахтунг какой-то! Я бы ещё смирился, если бы это было творением рук первоклассника на уроках информатики, но ведь это же взрослые дяденьки делают! Как такое может быть. Это что-то уровня плинтуса. В принципе, школьники младших классов на уроках информатики создают не хуже. Кто же мне объяснит, почему мир признал, что это достойный и приемлемый уровень?!
Отчего такой низкий уровень развития технологий распознавания СМЫСЛА сказанного или написанного? Почему я не могу сказать голосовому ассистенту так же как своему другу - любую фразу. Человек меня поймёт, а ассистент поймёт только, если я буду следовать по заранее прописанному скрипту. И шаг влево, шаг вправо карается непониманием. И как же быть, если люди с рождения привыкли общаться друг с другом в свободном режиме, а не по заранее прописанным сценариям.
Люди ведь друг с другом не скриптами общаются! Как это почему-то хотят представить датасаентисты, создающие всякие а-ля GPT-трансформеры… Или всё-таки скриптами и я чего-то упустил об этом мире?!!!
Берусь высказать мнение, которое все высказать открыто боятся… или стесняются. Неудобно ведь признаться, что король-то голый и то, что подаётся как достижение достижением не является. Почему-то в головах прогрессивного человечества крепко вбита мысль, что задача распознавания смысла из неструктурированной текстовой информации (говоря по-простому - в разговорных фразах) решается с помощью нахождения паттернов и синонимичных фраз. И для этих целей подогнали мат-аппарат машинных алгоритмов, нейронных сетей и биг дата. Все эти популярные Bert-ы, Elmo, GPT-трансформеры (различных тюнинговых мастей и улучшений) каждый исследователь кичится тем какой навороченный или тюнинный трансформер он создал, какую опупенную кучу данных в него влил - а-ля обучил. Какой бессмысленный бред, но со смыслом. (Почти как песни у Земфиры - бред бредом, но, блин, какой же там глубокий смысл.)
Только ребята-сайентисты, давайте откроем миру страшную правду. Все эти алгоритмы созданы для одной цели - поиска закономерностей, шаблонов и зависимостей… А теперь скажите какое отношение это всё имеет к мыслительному процессу по распознаванию смысла? Признаем горькую правду - НИКАКОГО. Да, эту математику приспособили для поиска синонимичных фраз и одиночных слов. Синонимы находить, конечно, нужно уметь. Да только задачка на этом не заканчивается, а только начинается. Получается как в анекдоте - ищут не там, где потеряли, а там где светло. (Работают не над тем, над чем нужно работать, а над тем, что можно за уши притянуть, как типа решение задачи.) Если посмотреть со стороны на всю эту суету, то очевидно, что люди занимаются решением какой-то иной задачи, чем та, что была поставлена. Причём усердно создают сложное решение, которое на самом деле никакое не решение, а его имитация. Мыслят обычно так - у нас есть диалог и нам нужно найти все синонимы составляющих его фраз. А почему бы не задуматься над решением этой задачи БЕЗ заранее прописанного диалога. Для семантистов-диалогистов эта мысль звучит как глупость. Но постарайтесь справиться с первым впечатлением и на миг представить, что это не бред, а реальность… Или всё же моя бредовая фантазия?
На мою критику технологий можно возразить, что мол всё равно нет никаких инструментов или методик, как с этой задачей справляться. Вот и делаем хотя бы то, что можно. Приспосабливаем, что есть. Пусть даже это и не совсем про то, а вернее, совсем не про то.
Когда на заре развития этих технологий кто-то придумал понятие интент. Это были ребята, которые работали над подобными задачами ещё до появления людей, разработавших Siri и ребят, создавших api.io . Не суть, чей грех. Виноваты не они, а все те идиоты из Гугла, Майкрософт, Фейсбук, Яндекса и Сбера, кто совершенно не включив ни мозги ни фантазию, стали копировать решение почему-то наивно решив, что развитие этих технологий должно идти именно по такому вектору развития и никак не иначе. И вот уже вся индустрия считает стандартом де-факто подход мышления в терминах интентов. Почему из всех этих ребят никто не задумался - а годное ли это решение, а нету ли каких других путей? А туда ли пошло человечество? Люди копируют решения друг у друга и бахвалятся, если их решение по каким-то второстепенным показателем превосходит, то что было создано до них.
Давайте скажем вслух - решение в формате интентов (разработка диалоговых алгоритмов) это тупиковый путь. (И вот сейчас, господа, вам понадобятся заготовленные кирпичи!) Те, кто следует этому подходу, очень быстро упирается в стену, которую невозможно преодолеть на интентах. Интент-мышление практически полностью остановило развитие смысловых распознающих технологий. Причём ни где-то локально в какой-то отдельной стране, а по всему миру. Почему весь мир пошёл по одной колее поисков, полностью проигнорировав все остальные? Для меня личная ключевая проблема в отсутствии разнообразия подходов и методов. Почему все как мартышки копируют друг у друга? Где борьба мнений и подходов? Различия лишь в том как мы тюним решение, а не в кардинальной смене парадигмы подхода!
Задача распознавания смысла свелась к задаче распознавания интентов. Ну раз так, то давайте возьмём томик “Война и мир” Льва Толстого и найдём в нём все интенты, которые Лев Николаевич туда напихал. И таким способом поймём, о чём там суть. Думаю, что если бы писатели знали, что так опримитивят их творения, они бы их просто не писали!
Человечество должно признать свою ошибку. Сжечь всех идеологов интент-подхода на кострах и открыть разум для поиска новых решений. Не факт, конечно, что сразу найдётся искомое, но пока этого не случилось мы будем иметь голосовых ассистентов, способных отвечать на вопросы о погоде, курсе валют, рецептах и с горем пополам перекидывать на поисковой движок во всех остальных случаях.
Давайте разбираться, почему интенты это зло. Ведь кажется очень логичным подход мышления, что, когда мы что-либо спрашиваем или даём команду диалоговому алгоритму, то следует понимать это как выражение некоего намерения. Верно! Вот только наша речь это не команды и вопросы. А литературные произведения и подавно не так устроены. Если посмотреть на коммуникации, то на интентосодержащие фразы придётся порядка 10% текста (в лучшем случае). А остальные 90% в понятие интент совсем не вписываются.
Вернёмся к упоминаемому примеру “Война и мир” и попытаемся проанализировать его с позиции поиска интентов. И упс - оказывается, что мы не можем этого сделать. Интенты не работают с лирикой. Похоже, это очевидный факт. Тогда как же мы можем на них строить алгоритмы диалогов? Если 9/10 диалога алгоритмом не будет пониматься.
Именно поэтому мы и не можем поговорить с Яндекс.Алисой по душам. Она ведь ждёт вопросов и команд, а мы ей тут свой внутренний мир открываем. В лучшем случае она в ответ спопугайничает, поискав в своих базах, что обычно говорят люди на подобные фразы. (Хотя, если честно, люди тоже постоянно копируют друг друга, повторяя услышанные коммуникации. Но делают они это как-то более изящно и изощрённее). Ваши чувства, эмоции, переживания, мысли, фантазии и размышления не воспринимаемые ею абстракции. Ну, что с машины возьмёшь?! Железка есть железка!
Довольно демагогии! Теперь тоже самое, но более математическим языком.
Чтобы научить алгоритм воспринимать смысл, его нужно научить выстраивать получаемую информацию в иерархических структуры. Это базовое условие. И при необходимости уметь перестраивать эти структуры в другие иерархии. В зависимости от преследуемых целей. Интенты не позволяют это сделать. Интенты это не про иерархии, а про линейные структуры. Использовать их для описания получаемой информации как минимум неудобно. Это как дырку в зубе пациенту сверлить отвёрткой, а не специализированной бор-машиной - можно, конечно, но, блин, больно!
Давайте посмотрим на шикарные примеры: “Люблю погреться на солнышке”, “Ну ты, блин, даёшь!” Где здесь вопрос, где команда? И нафига сюда GPT-трансформер подключать, делая умный вид, что можно таким способом получить вменяемый результат. Можно лишь найти фразу, которую люди обычно используют, если слышат упомянутые выше. Но это лишь попугайничанье, а не осмысленный разговор. Похоже на ситуацию - вы выучили десять иностранных слов и не зная, что они обозначают стараетесь интуитивно их применять в разговоре с иностранцем. Даже если у вас супер интуиция, иностранцу очень быстро станет понятно, что смысла слов вы не разумеете.
Понимаю ваш назревающий гнев и желание сказать - критикуешь - предлагай решение! Есть ли у меня готовое решение? Иными словами это можно сформулировать так - покажи нам решение, которое мы сможем скопировать. Нет, такого решения у меня нет!... Я просто знаю, куда ходить не надо. Но я так же как и все вы не знаю, куда надо! Слишком много разных направлений. Я иду по какому-то своему. (Ну а как же иначе! Был бы я погружён в тему, если бы не работал над этой задачей.) С высокой долей вероятности он может оказаться также тупиковым. Но если найдутся люди, которые прочитают суть, высказываемую в этой статье, и найдут в себе смелость пойти по какому-то собственному пути, оставив глупым хомячкам их GPT-трансформеры и прочую хрень) и не действовать как мартышки бездумным копированием обученным приёмам. То шансы у человечества на то, что кто-то что-то сможет найти повысятся кратно. Господа, давайте перестанем коммуниздить решения у соседа и попытаемся создать что-то полностью своё. Это реально круче. Путь улучшений это слишком долгий путь для человечества. Нужен кардинальный скачок! И сделать его можно, если перестать думать в направлении “Как улучшить”, а начать мыслить “Как сделать принципиально по-другому”! Но для этого нужны мозги, а не копировальный аппарат.
Можно ли на основе интентов создавать умные диалоговые алгоритмы? Очевидно, что нет. Интенты созданы для распознавания запросов и команд. А диалоги состоят преимущественно из совсем других сущностей. Можно ли на интентах создавать вопросно-командные системы - очевидно, что да. Может быть стоит признать нашу убогость и тупость и неспособность решить задачу качественного смыслового распознавания. Видимо для начала нужно решиться публично это признать.
Люди не думают интентами! Даже если пытаться наши цели и желания описать в виде интентов, то как минимум, мы приходим к каким-то иерархическим структурам интентов, состоявшим из множеств малентких интентов. К каждому нашему желанию можно приписать вопрос - Зачем? И, получив ответ, в цикле повторить вопрос. Не у каждого нашего желания есть действие. И далеко не все люди имеют цели. Хотя все имеют потребности. И в самом интенте может содержаться множество побочной информации. Так как мы не можем описать и структурировать эту информацию, то мы её просто выбрасываем, делая вид, что её нет! (Например, очень распространён подход выбрасывания из текста всякого мусора, типа союзов, предлогов, частиц… Зачем нам вся эта высокочастотная шваль, которая только мешает определению интентов. В топку её! А напрасно. Это напоминает мне алгоритм Мешок слов, когда выбрасывают самую ценную и важную информацию, а потом из оставшейся пытаются извлечь смысл. Выглядит презабавно! И ведь делают это на полном серьёзе. Этому на разных курсах и даже в университетах учат. (Не спорю, мир не может ошибаться! Ошибаюсь я!) Но разбирать такие алгоритмы без смеха нельзя. А ведь их на полном серьёзе объясняют и описывают в умных книжках. Наблюдаешь это и создаётся ощущение, что мир сошёл с ума.)
И я не утрирую и не ёрничаю - так реально работают современные диалоговые ассистенты! Кажется, это как минимум неразумно! Но ведь нет понимания как этими чёртовыми словами управлять! Поэтому мы поднимем вероятность того, что это мусор и... так избавляемся от проблемы. Вот такой классный выход из ситуации придумали!
Когда мы высказываем своё отношение к чему-либо или кому-либо, то в теорию интентов эти высказывания не засунуть. Это просто параметры описания нашей собственной картины мира. Конечно, можно эти данные где-то сохранить. Но если не перевести их в какой-то структурный примитивный вид, то мы этими данными не сможем эффективно пользоваться. Получается, что как не крути, нужна теория описывающая сущности и образы мира в виде структур. И даже не важно какие именно это будут структуры. Структурность описания даст возможность их быстрого анализа. В принципе - саму возможность анализа для извлечения смысла… - весь вопрос, что именно мы описываем и с какой первичной целью. Да, нужно сразу признать, что нельзя описать полностью весь смысл поступившей информации и какую-то её часть придётся потерять. По крайней мере до того момента пока мы не поймём, что эта часть информации важна и что её также нужно сохранять.
Не имея ответов на эти вопросы (или даже не задумываясь над ними) мы даже не формулируем такие вопросы. Кажется, что подобным бездействием мы совершаем ошибку.
Интенты это лишь мираж решения, который человечество наивно восприняло всерьёз за правильный путь решения сложной проблемы распознавания смыслов… Это тяжело и больно - признать, что все ошиблись и дружно пошли по ложному пути. Тот кто осмелится на это указать, будет выглядеть очень неприятным типом, который портит приятную картину бытия. Интенты способны справится лишь с очень узким кругом задач. 90% содержания остаётся за скобками и не работает. Все мы не хотим и стесняемся открыто признать эту правду. А надо бы…
Подобные алгоритмы чрезвычайно опасны! Всех кто их использует в работе следует просто сажать в тюрьму, жёстко наказывать и в принципе изолировать от общества, приравнивая их к опасным преступникам. Ведь эти люди наносят чрезвычайный вред человечеству. Эти алгоритмы достойны остаться лишь достоянием истории и максимум сгодиться для лабораторного задания студенту первого курса. В практической деятельности применять их в работе следовало бы запретить. Они создают лишь иллюзию решения. Те кто их использует, лишь притворяются или самообманываются, что решили задачу. А фактически происходит обратное - они отказываются от поиска истинного решения и соглашаются на убогое, на а бы какое-то. Результат которого - сильнейшее замедление скорости развития технологий. А это преступление перед человечеством. Когда же это происходит не в единичных случаях, а в масштабе всего мира, то это бедствие и общество с ним должно бороться, а не игнорировать. Ведь от того с какой скоростью идёт прогресс зависит наша жизнь, здоровье, быт и благополучие.
А скорость развития технологий это единственный шанс человечества спасти себя и свой мир от полного уничтожения варварским потреблением, с которым мы относимся к своей планете… Так что, казните, казните таких сайентистов - убирайте тормоза.
Интентопоклонники могут возразить, что сейчас нет альтернативного решения. Мол смиритесь с этим грустным положением дел. Человечество в жопе и точка! Но ведь для того, чтобы альтернативные решения стали появляться, общество должно заявить, что они ему необходимы. Сейчас же создаётся ощущение, что все всем довольны. А ведь решение этой важной задачи позволило бы человечеству сделать кардинальный шаг вперёд, освободить миллиарды людей от занятий ерундой и быстрее привести мир к всепланетному введению безусловного дохода...
Представить жутко, если бы Пушкин, Толстой, Достоевский создавали бы свои произведения с позиции передачи информации с помощью интентов… А можно анекдот описать интентами? Останется ли он анекдотом?
Вот вам сказочка в интент-стиле. Жил-был юзер. И был у него интент - хотел дочь замуж выдать. И была у него дочь, судя по KPI - красавица. Правда собственных интентов она не имела и выполняла чужие. А ещё там была мачеха и был у неё преступный интент - пофакапить дочь юзера.
И вот как-то раз в зимнюю пору дала она интент дочери юзера - чесать в лес за подснежниками. Дочь приаттачила навигатор и двинула с запросом по задефайненному маршруту.
А в лесу хостились 12 серверов. Описать какую пользу они приносили, мы в текущих инструментах не способны, поэтому просто выкинем эту информацию и будем считать, что они просто флудили всякую мусорную чушь.
В общем трансфернула им дочь юзера распознанный запрос мачехи. Початились они, помашинлёрнили, перетряхнули свои данные машинными алгоритмами и древними апишками и нашли-таки решение… Только всё это тоже не описывается в терминах интентов, поэтому тоже удалим эту часть истории как ненужный мусор.
В общем у сказки был хеппиэндный конец. Дочь успешно выполнила запрос и доставила мачехе корзинку с цветами и код 200. По-моему, там ещё внизу корзинки горсть биткоинов была насыпана, но мы снова вынуждены выбросить эту информацию как ненужную с точки зрения анализа содержания интента. Скажем лишь, что эмоциональность высказываний была скорее положительна...
Печально, правда, жить в мире с таким сознанием. Печально так интерпретировать смысл текстов. Слишком много важной инфы теряем. С водой выплёскиваем и ребёнка. А в остатках пытаемся выявить смысл. Давно пора признать эти алгоритмы архаикой и придать анафеме.
Люди не думают интентами. Интент это очень сильное упрощение в реальности действительно очень сложного процесса, происходящего в головах людей. Интент это линейный и однозадачный подход. А мышление человека многозадачно, сложно и очень запутано. Выявление сути из какой-то информации это не выявление какой-то одной грани смысла, оно зачастую имеет множество смыслов. Подобия интентов в наших головах на самом деле содержат много избыточных данных, пересекаются, накладываются, останавливаются на середине выполнения и переключаются на другие процессы понимания интентов. Они могут вернуться обратно к оставленному интенту, а могут породить на его основе новый. И даже не один. А возможна и обратная ситуация - слить все интенты в единый... И вся эта анархия в наших головах работает в штатном режиме выполнения.
Когда мы пытаемся описать в терминах интентов процесс мышления (клубок мыслей), мы сталкиваемся с серьёзными трудностями, многовариативностью интерпретаций, не способностью эффективно управлять и обрабатывать всю поступающую в алгоритм информацию. А значит алгоритм теряет данные. А люди теряют знания о мире.
Технология имитации (воссоздания) процесса человеческого мышления по степени влияния будет сильнее ядерного оружия. Для её материализации нужны большие амбиции и авантюризм, а ещё смелость перечеркнуть всё, что было создано в этом мире до нас и начать всё с чистого листа, споря со всем человечеством. Лишь такой выскочка способен ближе придвинуться к истине. Арсенал существующих решений в этой задаче не помощник, а ненужная ноша, которая мешает идти. Смело выкидывайте этот багаж.
Если записать всю речь человека, произносимую им в течении дня, там обнаружится мизерное количество интентов. То есть большая часть содержимого для алгоритмов выявления интентов это чёрная дыра и полная неизвестность. Да, тут подключают алгоритмы выявления именованных сущностей. Эту суть можно в принципе отмасштабировать на выявления всех предметов окружающего мира.
Но даже озвученное желание далеко не всегда нужно интерпретировать как интент, как таковой, даже если интент там содержится. Вот так-то всё сложно, господа!
Если не работает интент-подход, то чем его можно заменить? Пока есть единственная альтернатива - это статистическая аналитика информации. Если разобраться, то это ещё более убогое решение, чем теория интентов. И зачастую лучшие результаты можно получить не используя её, чем используя.
И не говорите мне про машинные алгоритмы! Человечество не может разобраться как текст кодирует информацию, поэтому пытаются анализировать самые примитивные его составляющие - шаблоны употребления и использования слов и букв. Хотя любому вменяемому человеку ясно, что это совсем не те данные, которые нужно извлекать из речи. Для выявления смысла нужно понять природу смысла, из каких составляющих он состоит. (И что-то мне подсказывает, что это не слова, а абстракции, т.е. структуры.) И затем выявлять уже эти составляющие и анализировать их. Слова и буквы языка это лишь внешняя оболочка над сутью. Чтобы понять, что внутри, нужно оставить анализ оболочки в покое и переключиться на содержимое внутренностей.) Но пока вырваться на уровень смыслов человечество не способно, поэтому анализирует буквы с помощью GPT-трансформеров. (Привет датасайентистам, поклоняющимся GPT-богам. Вам здорово повезло, что люди, платящие вам зарплату и близко не понимают какой фигней вы на самом деле занимаетесь. Но самим-то вам не стыдно смотреть по утрам в зеркало? Вы действительно считаете, что создаёте искусственный интеллект, способный генерировать смыслы? Или всё-таки он генерирует псевдобред. Правда делает это очень интеллектуально.
Хочу высказать гипотезу - нашими мыслями, а опосредованно и речью управляют два органа, а не один - мозг и сердце. Причём мозг управляет, условно, не больше 10% информации. Видимо, потому, что его использование слишком затратно для организма. Большую часть времени работает сердце - то есть генерируются эмоции. Когда работает мозг, в его работе можно выделить какие-то определённые цели и рассматривать с точки зрения интентов. Когда работает сердце, создаваемая информация в основном эмоциональная, то есть безинтентная.
Казалось бы, что может быть проще и логичнее, чем такой алгоритм - по ключевому слову или фразе попали в цикл формирования интента. Увидели, что нужно заполнить данными какой-то набор слотов. Ну и начали их заполнять, задавая вопросы о содержании слотов. Запросили по каждому слоту информацию, заполнили слот. Ну и все дела! Всё логично и красиво… Только это искусственный диалог (а не искусственный интеллект-:), оторванный от жизни.
Как быть если инициатива на стороне человека и вопросы задаёт он, а не алгоритм. стандартная рекомендация от гуру voice-ux это ни в коем случае не допускать такой ситуации. И это ещё можно сделать в чат боте, но в разговоре контролировать активность нельзя. Селяви! Люди во время общения периодически перехватывают инициативу ведущего в диалоге. Постоянно выступать в роли Дудя не получится.
Мы анализировали большой корпус русскоязычных диалогов с позиции активности ролей. Так вот продолжительные диалоги происходят, когда собеседники периодически меняются ролями (интервьюер - интервьюирующий). Если такой смены нет, то (если этот диалог не связан с профессиональной деятельностью) диалог не развивается… Не верьте мне на слово! Откройте любой мессенджер и посмотрите на свои чаты. Так зачем же гуру индустрии чат-ботов строения дружно советуют нарушать привычные человеческие модели поведения? Видимо действует принцип не “технологии для людей”, а “люди для технологий”. Ну а что, научились же мы говорить на яндексовском диалекте русского языка. “Купить цветы москва дёшево”. И все всё поняли. Толстой, узнав, во что превратят Русский язык, убился бы в гробу. А для нас нормуль.
Зачем я затеял хейт интент-подходов?
Больше всего меня огорчает, что нет противоборствующих лагерей, отстаивающих свою правоту и доказывающих свою точку зрения. Все ровным строем идут куда-то и никто даже не задаётся сомнением в правильности пути. Если бы в мире существовали бы борющиеся технологические подходы, мир развивался бы намного быстрее и эффективнее. Когда нет борьбы и сравниваешь себя с собой, то слишком мало драйва двигаться дальше.
Мне искренне хочется создать альтернативную технологию, отличную от существующих решений, найти другой взгляд на решение столь сложной проблемы. И потому первый шаг это подвергнуть сомнению состоятельность существующих достижений. Максимально раскритиковав их и отвергнув.
Как известно из истории нашей страны, когда-то давно, когда коммунисты хотели создать новую страну им понадобилось разрушить всё, что было создано до них веками. Это было крайне жёстко и безжалостно, но эффективно... Если не разрушить современные неработающие подходы и не развенчать мифы, то ничего нового создать не получится. Всё, что будет создаваться будет лишь клоном существующих технологий с какими-то улучшениями. И это не движение вперёд, а топтание на месте.
Друзья, надеюсь, что ваш мозговой аппарат успешно распознал в тексте сатиру и громкие популистские высказывания и отделил ересь от сути, а главное от воды. Чтобы мир создал искусственные мозги, нужно, чтобы в мире сначала нашлись мозги реальные! Буду рад, если статейка зашла.
Комментарии (42)
MFilonen2
09.11.2021 15:49+6Создали то, что решает поставленную проблему с достаточной точностью.
Так ведь всегда было. Например, сначала для перемещения использовали силу животных, потом пар, потом электричество, сделали реактивные двигатели. Никто не ставил задачу – или создаем телепортатор из точки A в B, или будем продолжать перемещаться только на своих двоих.
Придумают лучше – будут использовать лучшее.IamSkazka Автор
09.11.2021 17:34-2Моё эгоистичное желание - подтолкнуть мир создать это лучшее скорее. Я не согласен, что то, что уже создано, решает проблему с достаточной точностью. Оно лишь эмулирует решение. Нас водят за нос, а мы подыгрываем.
ibrin
09.11.2021 15:57Вот вы тут критику развели, мол плохо всё, потёмкинские технологические подходы, голый зад ИИ, GPT-хайп... Да нет же! Это хорошо! Пусть так и остаётся. Чего мы все, как человечество, хотим достичь, запрограммировав искуственное сознание? Цель и выгодоприобретатель?
IamSkazka Автор
09.11.2021 17:24+2Всем сердцем с вами соглашусь. Технический прогресс вместе с комфортом и удобством несёт страх и тревогу. ( А, возможно, и катастрофу.) Но никто не способен его остановить. ИИ неминуемо придёт. Вопрос лишь в том выиграет ли человечество, если он придёт раньше или если он придёт позже.
ibrin
11.11.2021 09:44Вопрос не только лишь в том, это преждевременный вопрос. Сначала нужно ответить на вопрос, который был полностью вами проигнорирован из-за страхов и тревог. Зачем вы избегаете его? Может человечеству-то этот ИИ нафиг не сдался. Может оно в массе своей расходный материал на этом празднике машин?
TiesP
09.11.2021 15:58+6Не понял — что такое «смысл», про который вы пишите на протяжении всей статьи?
IamSkazka Автор
09.11.2021 17:16-2Я задавался тем же вопросом и перерыл много литературы. Нигде нет конкретного определения, что такое Смысл. Везде пространные описания. Похоже, мы, люди не способны понять, что это такое.
Eugenenen
11.11.2021 17:28По поводу определения термина "Смысл" - полностью поддержу, одни общие описание, в духе, что "смысл - ну это вообще все в общем, такие дела". Работать или моделировать подобное совершенно невозможно.
У некоторых авторов, кстати, есть достаточно прикладное понимание этого самого "Смысла" - это накопленный результат действий человека и обратной связи, полученной по результатам этих действий.
За, возможно, поверхностным описанием, скрывается глубокий фундамент, основанный на следующем тезисе:
Человек накапливает опыт и получает знания об окружающем мире за счет выполнения базовых действий и получая тот или иной отклик на них. Совокупность действий и откликов и создают индивидуальную, смысловую картину мира, которая представлена не буквально, а именно так, как ее человек воспринял - "осмысленно".
Комментарий можно было бы еще дальше расписывать, но наверное легче сослаться на серию статей, где про это достаточно подробно рассказано - https://habr.com/ru/post/554738/
johnfound
09.11.2021 16:26+3Статья провокационная конечно. Но я плюсанул, потому что недовольство, это прямое стремление к лучшему. Так что, пусть будут недовольные, пусть и необоснованно. Довольство это прямой путь к упадку и деградации.
maldalik
09.11.2021 17:51+8Пришли зайцы к сове:
- ты мудрая что нам делать от волков спасу нет.
- а вы возьмите и набейте им морды.
- а как это сделать, они же сильнее?
- идите нафиг, я стратег, а не тактик.
IamSkazka Автор
09.11.2021 18:17+1По законам драматургии, прервать произведение нужно на катарсисе - всё плохо, мир гибнет, мы все умрём! А во второй серии герой спасает мир). Это статья не финал истории.
kuzzzov
09.11.2021 18:47+1Все эти алгоритмы созданы для одной цели - поиска закономерностей, шаблонов и зависимостей… А теперь скажите какое отношение это всё имеет к мыслительному процессу по распознаванию смысла?
Восприятие окружающего мира строиться на том, что мы классифицируем предметы и взаимодействия, изучаем их свойства. Мы знаем, какие действия могут быть произведены с конкретным предметом, что с ним может произойти в определенных условиях, какими свойствами он может обладать.
Понимание смысла фраз базируется на нашем знании окружающего мира. Мы, точно также как и нейросети пытаемся вычленить из непрерывного потока данных, поступающих от органов чувств, зависимости и закономерности. Просто мозг помощнее любой нейросети и справляется с такой работой гораздо лучше.
IamSkazka Автор
09.11.2021 22:42+1Давайте представим такой эксперимент:
Вариант 1: Вас вывели на улицу и вы разглядываете, что вокруг находится и происходит. Вариант 2: Вас вывели на ту же улицу с завязанными глазами и словами рассказывают, что вокруг находится и происходит.
Вопрос, действительно ли в вашей голове во втором случае будет происходит процесс, который повторяет алгоритм действия gpt3. Или будет нечто другое?
kuzzzov
10.11.2021 10:00+1Мозг человека выполняет множество функций. Система позволяющая понимать речь и разговаривать является лишь надстройкой над более сложным основанием, способным распознавать образы, делать прогнозы, иметь пространственную память и т.д.
Очевидно, что нейросеть типа GPT3, обученная на текстовых данных будет способна выявлять лишь закономерности построения предложений и фраз. Собственно на большее такие сетки и не претендуют.
Возможно, какого то прорыва стоит ждать от более универсальных нейросетей, обучение которых будет проводится на различных типах данных: тексте, изображениях, видео, информации с ладаров.
nktkz
10.11.2021 01:58+4вот тоже смущает. почему все идиоты ученые пошли по пути химии чтобы создавать вещества. алхимия принесла бы куда лучшие результаты, позволяя создавать хоть золото из железа
IamSkazka Автор
10.11.2021 10:50Вы ближе к истине, чем, возможно, сами подозреваете!
Человечество до сих пор считает, что передача электричества по воздуху невозможна, а эксперименты Тесла столетней давности доказывали обратное. Химия до сих пор не знает, что такое эфир. Возможно алхимия была ближе к пониманию, что это за субстанция и как ею пользоваться.
Не принимайте реальность как единственную догму. Она остаётся таковой пока не находится выскочка, который всё меняет. Моя статья о том, что не бойтесь думать не как все и отрицать правила. История этого мира показывает, что правила это сиюминутная условность, а не истина.
nktkz
10.11.2021 12:56+1тогда я предлагаю вам поверить что я умею предсказывать будущее по причине тонкой чувствительности к окружающему эфиру:
"вы напишете следующую статью на хабр. в ней не будет ни одного логически корректного аргумента в вашу пользу. вашу статью раскритикуют за это. вы 'убедитесь' в том что все вокруг дураки и не могут смотреть также широко как вы"
не знаю что я написал в абзаце выше, это было в состоянии трансаIamSkazka Автор
11.11.2021 17:04Я не склонен считать кого-то дураком за то, что он думает иначе, чем я. (Хотя в статье, я, действительно, использовал провокационный стиль и резкость высказываний.)
Очень здорово, что под этой статьёй столько мнений, не согласных с моим. Если есть спор, значит есть движение к истине. Крутые идеи, изменившие этот мир, всегда встречались в штыки.
А по поводу предсказания будущего, так все мы ощущаем эфир по-разному.)
nktkz
12.11.2021 12:46+1не любой спор ведет к истине
некоторые крутые идеи встречались вштыки в редчайших случаях. но большая часть того что встречается вштыки - просто глупость
yurixi
10.11.2021 10:49Человек не знает себя. Но это пол беды. Вторая половина беды что он догадки не проверяет, а сам за этими догадками повторяет. И такой: «Ну, теперь всё сходится. Наверное. Скорее всего.»
khmheh
10.11.2021 14:08Именно поэтому мы и не можем поговорить с Яндекс.Алисой по душам. Она ведь ждёт вопросов и команд, а мы ей тут свой внутренний мир открываем.
А зачем? Алиса создана не для разговора по душам и не как замена живого общения, а как помощник. Не знаю, как вы, а я себе голосового помощника представляю как нечто, кому(чему) я могу делегировать функции, которые способен выполнить и без него - проверить погоду, узнать время, построить маршрут до пивного ларька. А с помощником я могу его просто попросить - и он это сделает за меня.
Как известно из истории нашей страны, когда-то давно, когда коммунисты хотели создать новую страну им понадобилось разрушить всё, что было создано до них веками. Это было крайне жёстко и безжалостно, но эффективно... Если не разрушить современные неработающие подходы и не развенчать мифы, то ничего нового создать не получится.
Вот только, увы, есть примеры стран, которые достигли больших (ударение на и, вопрос больше-меньше дискуссионный) успехов и без разрушения всего, что было создано до них.
Как по мне, текущая реализация голосового помощника свою функцию выполняет и, как минимум, странно требовать от неё чего-то большего. Никто и не говорит, что г.п. - тот же Вася или Петя, да никто так и не воспринимает их. Всем понятно, что это и для чего. А настоящий ИИ напишут, когда под него будет готова математическая основа, которой, пока что, нет.
IamSkazka Автор
10.11.2021 15:24Когда-то люди жили без мобильных телефонов, интернета, автомобилей и даже без электричества. И никто не считал, что этого всего ему не хватает. Однако отбери эти вещи сейчас у людей, и на Земле случится коллапс, если не катастрофа.
Пока нас не подсадят на очередное благо прогресса, мы не подозреваем, что не можем без него жить!)
johnfound
10.11.2021 19:07У меня есть гипотеза, что человеческий интеллект, это гипертрофированная способность прогнозировать будущее. То есть, впервые это был механизм прогнозирования самого близкого будущего и это было эволюционно выгодно. (кстати, обратите внимание как например птицы реагируют на кошку. Они совершенно не понимают что будет через 2..3 секунд и реагируют только на прямое действие – прыжок кошки). А потом, этот механизм начал усовершенствоваться и пытаться прогнозировать все дальше и дальше и все шире и шире (и конечно грубее и грубее). Так вот, я думаю, что корни всего абстрактного мышления является именно механизм прогнозирования будущего.
С другой стороной, я не знаю про попытки сделать ИИ на этой основе. Все попытки ИИ, про которых читал, пытаются имитировать высокоуровневых функциях мышления, так сказать, на другой виртуальной машиной. И поэтому остаются только имитациями.
IamSkazka Автор
11.11.2021 12:24+1Интересная теория. То что вы подразумеваете по-другому называется интуиция. В восточных учениях она противопоставляется опыту. Опыт это прошлое, а интуиция это будущее. Все машинные алгоритмы, основанные на данных, по сути используют опыт прошлого. Как вывернуть их наизнанку и научить работать в обратном направлении тот ещё вопрос!
johnfound
12.11.2021 17:58Нет, не совсем интуиция. Я подразумеваю, что вся интеллектуальная деятельность мозга, сознательная или нет состоит в предсказания будущего.
Например водя машиной на трассе, мы всегда прогнозируем что будет через 3..4..5 секунд и все наши действия состоят в коррекции плохой прогнозы, если такая случается. Если ошибаемся в прогнозе, то умираем (утрирую конечно). Чтобы сделать прогнозу, мы используем (конечно) весь наш предыдущий опыт сопоставляя его с данными поступающие из органов чувств. Например видим пенсионер, стоящий на тротуаре и мозг вспоминает, что уже видел такое и в прошлом пенсионер стоящий вот так, потом перешел дорогу. И делаем прогноз – вот-вот пенсионер начнет пересекать дорогу. Значит надо замедлить или хотя смотреть на него повнимательнее. Как-то так...
O5e2e2
10.11.2021 23:40-1Не стреляйте в тапера (программиста), он играет, как умеет (с) Алгоритм, это раб лампы, который оптимально быстро и недорого выполняет несложные действия и предоставляет запрошенную информацию.
Человеку от служащего в справочном бюро, нужно ровно то же самое, что и от Алисы, - информацию. И он это от Алисы, в основном, получает. Что тут плохого?
Просто отделите для себя раз и навсегда швейцара (алгоритм) в отеле, от постояльца (человека), с которым можно поболтать по душам.
Что касается смысла, это не скоро. Возможно никогда. Потому как, очень похоже, что сначала нужно понять природу сознания.
IamSkazka Автор
11.11.2021 16:44+1Моё имхо такое:
Создать ДУМАЮЩИЙ алгоритм - это ещё не скоро.
Создать ПОНИМАЮЩИЙ алгоритм - это скоро.
O5e2e2
11.11.2021 19:59Разве понимание возможно без думания?
Разве думание возможно без понимания?
Речь, конечно, не о вопросах уровня Алисы. А, например, о тексте, который вы предложили для обсуждения.
yurixi
12.11.2021 14:54Интересно, можно ли создать простой удивляющийся алгоритм, или для этого надо наделять его аналогом эго, которое во время удивления разрушается.
O5e2e2
12.11.2021 23:59можно ли создать простой удивляющийся алгоритм
Это вряд ли. Удивление подразумевает понимание некой несообразности. Чтобы удивиться, алгоритм должен тонко понимать смысл чего-либо.
Это и люди не всякие умеют. Например, анекдоты понимают не все. Парадоксальность, анекдотичность ситуации обычно вызывает смех и удивление. Алгоритм должен понять всё на уровне человека и только затем удивиться.
IamSkazka Автор
12.11.2021 15:06+1Я на пальцах объясню. Возьмём как пример насекомое-таракан. Очевидно, что у него нет физиологии, называемой мозгом. Следовательно Думать он не умеет. Но при этом, когда ему грозит опасность он убегает от неё прочь. Значит у него появляется Понимание опасности.
Если алгоритму задать все возможные варианты приветствия, он сумеет Понимать, когда с ним поздоровались. Но думать он при этом так и не научится.
Поэтому я высказываю мысль, что Понимающий смыслы алгоритм создать легче, чем Думающий.
O5e2e2
12.11.2021 23:46Я на пальцах объясню. Возьмём как пример насекомое-таракан...
Не надо профанировать. Это не понимание, а реакция. Можно привести пример еще проще: звонок понимает, что нужно звонить, когда нажмут на кнопку.
Я специально отметил, что уровень Алисы, а уж тем более таракана, нас не интересует.
Чтобы понимать смыслы нужно думать.
IamSkazka Автор
13.11.2021 10:55+1Мне приятно с вами дискутировать, потому что у нас очевидно очень разные картины мира. В моей голове сидит твёрдое убеждение, что "Чтобы думать нужно понимать смыслы".
Извините, но снова буду аргументировать примерами.
Подумайте об мороженом. После этой фразы мы все легко подумали о мороженом. А теперь подумайте о блюхостанколитодоте. И... ой, мы не можем это сделать, потому что не понимаем, что это такое. На этом примере я делаю вывод, что чтобы запустился процесс, который называется "думать" должен сначала отработать процесс, который называется "понять".
O5e2e2
13.11.2021 12:40"Чтобы думать нужно понимать смыслы".
И наоборот. Смысл и думание невозможно разделить. Если смысл непонятен, то думание стопориться, человек начинает искать информацию вне себя. Или находит и думает дальше или бросает и живет без этого.
Примеры, это нормально. Но примеры о таракане или незнакомом слове не подходят. Вы ведь сами писали о том, что вас не устраивают простые алгоритмы уровня алисы. А аргументы приводите именно на этом уровне.
Берем какой-либо более-менее сложный текст, например. Попробуйте, понять не думая или думать не понимая. А потом подставьте вместо себя алгоритм и скажите, можно ли разделить у алгоритма понимание и думание во-время изучения этого текста.
ПС:
В моей голове сидит твёрдое убеждение...
Убеждения - это границы. Если речь о таблице умножения, то скорее всего вы окажетесь правы. Но если о сознании, например, то всякая инаковость будет от вас закрыта.
Sanek22
12.11.2021 13:03Автор правильно отмечает ограниченность концепции интентов, но они никогда и не претендовали на полноценное понимание текста и ведение осмысленных диалогов. Соответственно такая длинная статья с их критикой выглядит немного странной :)
Имхо, смысл любого текста/речи - в описание некоторых действий и их свойств. Так что например упоминаемая в статье фраза “Люблю погреться на солнышке” вполне себе может быть описана в этих понятиях (Действие - "греться", свойство 'где' - "на солнышке", свойство 'Мое отношение к действию' - "люблю")
IamSkazka Автор
12.11.2021 14:54Аналитика, основанная на интентах не даёт понимания смысла. Смотрите два примера:
Люблю погреться на солнышке.
Я думал, что люблю погреться на солнышке, пока не попал в Сахару.
Интент один, а смысл противоположный. И таких примеров в русском языке вагон и маленькая тележка! Чтобы справиться с этой проблемой, придётся уходить от интент-подхода, как бы он не казался приемлемым решением. Статья об этом.
Sadler
Я даже не знаю, как это комментировать. Испанский стыд.
IamSkazka Автор
Поверьте, мне тоже очень стыдно за свои неправильные мысли и неправильную точку зрения! Но, что поделать - статья уже опубликована. Придётся умереть с позором.