Последние инновации в сфере ИИ, наиболее примечательными из которых стали проекты наподобие GPT-4, очевидно, могут иметь далеко идущие последствия для общества: от утопического избавления от монотонного труда до антиутопического ущерба для работы художников в капиталистическом обществе, а также до экзистенциальных угроз самому человечеству.
Лично я получил формальное образование дата-саентиста, даже выиграв в высококонкурентном конкурсе по машинному обучению в одном из лучших университетов Австралии и написав магистерскую, для которой создал в MATLAB с нуля собственные библиотеки. Я не гений в этой сфере, но, очевидно, лучше большинства конкурентов, то есть практиков вроде меня; я не могу, сидя в пещере, создавать собственные библиотеки на C, но умею читать учебники, реализовывать готовые решения на языках высокого уровня и использовать библиотеки, написанные элитными организациями.
Поэтому с глубочайшим сожалением должен объявить, что следующий человек, который начнёт говорить мне о реализации ИИ, получит от меня сеанс живительных процедур над позвоночником; иными словами, я сломаю ему нафиг шею. Мне очень-очень жаль.
I. Но мы достигнем невероятной эффективности благодаря машинному обу...
Я тебе чё сказал?!
Я начал работать дата-саентистом в 2019 году, а к 2021 году осознал, что, несмотря на огромный размер этой сферы, в ней в то же время ужасно много мошенничества. Большинство руководителей, с которыми я работал, очевидно, читали по теме не больше получаса, но уже рассуждали о том, что через пять лет нетехнологическая организация из десяти тысяч человек будет целиком заниматься ИИ. Количество компаний, запустивших инициативы по разработке ИИ, намного превосходит количество истинных сценариев его применения. Основная часть рынка — это просто аферисты и бездарности (а иногда и то, и другое!), пользующиеся хайпом, чтобы увеличить количество подчинённых, с целью добиться повышения или казаться авторитетными экспертами1.
[1. Это может объяснить, почему столь многие мысли в духе времени всегда настолько глупы. Многие из знакомых мне руководителей в Малайзии были одержимы биткойном, но резко забыли о нём, когда он стал политически непопулярным.]
Объём денег в этой области был феноменальным, но я, тем не менее, отправился в более спокойные воды data engineering и разработки ПО. Видите ли, хотя хайп — это хорошо, для практиков он хорош только в небольших порциях. У нас есть ключевые аспекты, которых нет у афериста: стабильность работы, искренняя дружба и душа. Чего у нас нет, так это возможности быстренько перейти в другую сферу в момент завершения золотой лихорадки, ведь нам, к сожалению, нужно накапливать знания и опыт. Аферисты же владеют мультиинструментом, который они тщеславно называют «политикой»2. Я к тому, что если твоя основная компетенция — это улыбаться и обещать людям то, чего не можешь исполнить, то ты обладаешь навыком, применимым во многих сферах.
[2. Я знаю нескольких людей, действительно проявляющих то, что я бы назвал политическим талантом, но чаще всего это сводится к обещанию людям чего-то вне зависимости от того, можешь ли ты выполнить обещание. Если ты бесстыжий, то это несложно.]
Я ушёл из этой области, как и большинство моих умных друзей, а моя зарплата продолжила расти с достаточной скоростью и стабильно, пока я изучал мудрость наших древних предков. Сидя промозглыми ночами под бледной луной рядом с едва горящим костром, когда деревья тянут к тебе свои ветви подобно рукам зловещего призрака, а сквозь порывы ветра иногда слышен вой (хорошо, если волка), от которого кровь стынет в жилах, ты можешь напрячь свой слух и едва расслышать:
«Просто используй Postgres, дубина ты этакая».
Должностей в data science становится всё меньше, а цикл хайпа начал постепенно смещаться от всех этих ИИ-инициатив, не обеспечивших практически никакого прогресса, в сторону data engineering. Это был сигнал, который я правильно предсказал, и самое подходящее время для побега. По крайней мере, я думал, что со всей этой ИИ-чушью наконец покончено, и мы можем перейти к чему-то более перспективному в плане достижений.
Но потом какой-то сукин сын изобрёл ChatGPT, и посмотрите на нас сейчас. Посмотрите на нас в платье голого короля, сшитом из жадности и доверчивости. Мы тратим половину инженерных ресурсов планеты на добавление поддержки чат-ботов во все приложения в мире, хотя половина отрасли всё ещё не разобралась, как регулярно тестировать бэкапы баз данных. Именно поэтому я обрушу невероятное физическое проявление ярости на следующего дурака, заявившего, что ИИ — это будущее бизнеса; не потому, что это невозможно в принципе, а потому, что теперь его не отличишь от сотни миллионов других упёртых идиотов.
II. Но нам нужен ИИ, чтобы оставаться конкуренто...
Господи ж, Боже мой, да заткнись ты! Если вы не один из горстки бизнесов, которые точно знают, для чего собираются использовать ИИ, вам он не понадобится ни для чего, или, точнее, чтобы воспользоваться его преимуществами, вам не нужно ничего делать. Искусственный интеллект в том виде и с той степенью полезности, что есть сейчас, наверняка уже встроен в вашу цепочку поставок ПО. Ваш поставщик услуг по управлению информационной безопасностью, вероятно, использует алгоритмы для выявления аномального трафика, встроенные в ПО какой-то лаборатории, и секрет в том, что этот поставщик тоже не особо работал с ИИ: он купил ПО у крошечного сектора рынка, которому действительно нужны дата-саентисты. Понимаю, что вы хотите стать новым Стивом Джобсом, а для этого нужно выходить на сцену и рассуждать о своей инновационной мощи, но всё это не даст вам возможности натянуть чёрную водолазку, а если и даст, то вам придётся сменить свитер на полный латный доспех, потому что иначе я вас ухайдакаю.
Вспомните о том, что большинство компаний неспособно даже успешно разработать и внедрить простейшие CRUD-приложения вовремя и уложившись в бюджет. Это решённая задача — при условии работы с умными людьми, способными ставить разумные требования, компетентная команда будет справляться с ней каждый раз, пусть и с небольшими напрягами. Клиенты, с которыми я работаю, все такие — даже если они совершенно не технари, у нас есть взаимное уважение к интеллекту друг друга, поэтому мы берёмся за безумную миссию: решаем задачи вместе. Возможно, я не знаю всех нюансов создания аналитических систем для исследований реабилитации зависимых людей, но благодаря мощному навыку общения друг с другом, как взрослые, нам как-то удаётся решать задачи.
Но большинство компаний этого не делают, потому что с операционной и культурной точки зрения они калеки. В среднем инженер задерживается на одном месте от года до двух лет, поэтому организация страдает от систематической ретроградной амнезии. То и дело какой-то придурок говорит что-то в стиле «Возможно, нам следует отнять у команды разработчиков привилегию удалённой рабо... ой, а куда это разбежались лучшие инженеры?» Когда происходит атака вируса-шифровальщика, стабильно обнаруживается, что уже полгода никто не тестировал бэкапы, а половину легаси-систем невозможно вывести из комы. Лично я видел это дважды всего за четыре года. Разве это не сумасшествие?
Большинство организаций не способно хоть с каким-то постоянством выпускать простейшие приложения, а вы тут заявляете, что лучший способ оставаться конкурентоспособными — это внедрить экспериментальную технологию, которая на порядок величин сложнее, чем всё, что создавал и поддерживал ваш отдел ИТ; у вас нет опыта найма под эту технологию, у вас в конторе на GPU разве что джуны играют во время созвонов, отключив вебку; но даже если вы всё сделаете правильно, какова вероятность того, что задача попросту нерешаема из-за самих характеристик ваших данных и бизнеса? Это не просто верный путь к провалу, а последовательная инструкция по тому, как привести компанию к катастрофе.
А может, вы просто обеспечите конкурентоспособность, вычистив весь навоз? Я знал одного ведущего дата-саентиста с доступом к сотням тысяч чувствительных клиентских данных, которому дозволялось хранить свой пароль в текстовом файле на рабочем столе; а вы тут беспокоитесь о том, как бы получше обеспечить безопасность клиентов благодаря ИИ при помощи механизма, который даже ещё не придумали? Вы говорите, как настоящий засранец, и я буду бить вам в челюсть, пока врачу не придётся замотать её проволокой, чтобы вы заткнулись на десять секунд, а мы могли бы решать реальные задачи.
III. Но мы уже получили большую выгоду от...
В юности я читал классическую фэнтези-повесть Роберта Сальваторе «Магический кристалл». Там есть сцена, в которой молодой протагонист Вульфгар вызывает вождя варваров на дуэль, чтобы решить вопрос контроля над кланом и повести своих людей на войну для спасения мира. В кульминации боя Вульфгар отбрасывает своё оружие, хватает голову вождя голыми руками и умоляет того сдаться, чтобы не пришлось раздавить его череп, подобно яйцу, и не стать убийцей.
Ну так вот, это я. Я умоляю вас. Перестаньте врать. Я не хочу ломать вам череп, очень не хочу.
Но сломаю, если вы меня вынудите.
Вчера мне показали «Отчёт о готовности к ИИ на 2024 год» компании Scale. В нём был такой график:
Насколько тупым надо быть, чтобы поверить в неудачную реализацию проектов ИИ всего в 8% компаний? Мы не можем стабильно выпускать CRUD-приложения, но при этом люди думают, что эти числа не смехотворны? Некоторые компании получили преимущества во время хайпа LLM, но не 92% из них. 34% компаний сообщают, что генеративный ИИ помогал им конкретно в принятии стратегических решений? Да что вы такое несёте? GPT-4 даже не может написать связный код на Elixir, предположительно потому, что датасет был слишком мал, чтобы достичь уровня результатов для Python3, но вы признаётесь, что отдали принятие решений на аутсорс штуке, которая иногда советует людям готовить в пищу семье смертельно опасные токсины? Что это вообще значит?
[3. О качестве кода на Python тоже можно поспорить.]
Я вам не верю. И вам не поверит никто в здравом уме, а если руководство компании поверит в то, что вы написали в отчёте, оно обязано вас уволить. Я наконец понял, почему некоторые из моих друзей считают необходимым вырваться в начальники: кто-то обязан вырвать бразды правления из лап этих рептилоидов, прежде чем они не приведут нас всех к падению с обрыва, объясняя в процессе полёта вниз, что с текущим кризисом лучше всего позволит справиться дополнительное вливание средств в SageMaker.
Несколько лет назад одна из компаний FAANG пригласила моего друга в США. Многие из обсуждений касались технических демо впечатляющих продуктов на основе ИИ. Мой друг разрабатывает ПО, поэтому немного пообщался за кулисами с разработчиками, где они и признались, что большинство демо были фальшивками. Продукт не работал. Им попросту не удалось решить некоторые мелкие задачи, например, прогнозировать то, что и должен прогнозировать продукт. Но это не помешало им в течение часа втирать абсолютную чушь аудитории, смотревшей на них с открытым ртом! Я виню не инженеров, которые, наверно, добросовестно пытались заставить продукт работать, а лживых хвастунов, которые утверждали, что обязаны создать презентацию, иначе они будут устранены4.
[4. Учитывая особенности здравоохранения США, это может означать и увольнение, и устранение в стиле Шварценеггера, когда ты плавишься в ковше с расплавленным металлом.]
Ещё один мой друг выполнял проверку ПО, предназначенного для аварийно-спасательных служб, а продажники исполнителя не ожидали, что закупкой для аварийных служб будет заниматься хардкорный программист. У них возникло ложное чувство безопасности, благодаря которому они случайно проговорились, что весь сервис — это какой-то парень, живущий в Индии. Слушайте, если бы я поменялся местами с кем-то из моих родственников, то мог бы быть тем самым парнем из Индии, поэтому восприму это на личный счёт и заявлю, что вы используете термин «ИИ» как обходной способ для продажи труда людей из других стран, и что вы безнравственное чудовище; а если продолжите zakroi{Varezhka}
, то можете poluchit{Vhlebalo}
.
IV. Но мы должны быть готовы к будущему нашего...
Я спрошу у ChatGPT, как изготовить удавку, а потом задушу ею вас; вам остаётся только молиться, что я выкину шанс 10% того, что он заглючит и скажет мне, что удавка должна состоять только из папье-маше и злобы.
Я много раз слышал руководителей, говорящих о необходимости немедленного развёртывания генеративного ИИ, чтобы подготовить организацию к работе в будущем. Несмотря на то, что все их речи звучали абсолютно одинаково, я уверен, что они долго репетировали, ведь им удавалось одновременно размахивать руками, говорить и не лить при этом слюну изо рта!
Но давайте на секунду задумаемся об этом серьёзно.
Я не отношусь к столь же несерьёзному лагерю считающих, что генеративный ИИ не имеет потенциала для существенного изменения нашего мира. Очевидно, он есть. Когда ещё учась в университете, я увидел ранние демо GPT-2, то был наполовину убеждён, что это фальшивка. Помню, как понял, что ошибался, поэтому больше не так уверен в происходящем.
Однако у меня есть технический опыт, чтобы понимать основные принципы этой технологии, и мне кажется, что мы движемся в одном из трёх направлений.
Во-первых, может произойти взрыв интеллекта, ИИ начнёт рекурсивно самосовершенствоваться, а нас разберут на атомы, потому что маркетинговый алгоритм решит, что человечество можно превратить в глобнар — новую эпоксидную смолу, на которую есть огромный спрос у инопланетян в соседней галактике для ремонта их аналога кофе-машин. Вероятно, некоторых читателей удивит то, что я допускаю такую возможность, но аргументы в её пользу всегда казались мне разумными. Однако защита планеты — это совершенно иное, и я даже не уверен, возможно ли это. Как бы то ни было, вас не удивит, если я скажу, что в таком сценарии меня не особо будет волновать прибыль компании, так что больше мы говорить о нём не будем.
Во-вторых, может оказаться так, что нынешний подход по сотне причин не масштабируется так, как мы надеялись. На планете недостаточно данных, архитектура не работает так, как мы ожидали, ИИ просто перестаёт умнеть, контекстные окна навсегда останутся ограничивающим фактором и так далее. В этом отношении некоторые компании, например, занимающиеся технической поддержкой, ждут серьёзные неприятности.
В случае, если технология продолжит инкрементально совершенствоваться, то вашей компании не понадобится генеративный ИИ ради него самого. Вы точно будете знать, зачем он вам нужен, разумеется, если он вам нужен. Пример использования ИИ, от которого выиграл лично я: управлением своей жизнью я занимаюсь через Todoist, а у Todoist есть функция, позволяющая преобразовывать фильтры задач из естественного языка во внутренний язык фильтров. Потрясающе! Это позволило мне сэкономить время на изучении системы, которой я буду пользоваться раз в пять лет. Мне действительно это очень понравилось, и это реальное преимущество перед другими приложениями. Но если у вас нет сценария использования, то наличие подобной широкой возможности не окажется особо полезным. Вам следует заняться совершенствованием своих процессов и культуры, а это уже даст вам возможность использовать ИИ, когда он станет важным. Все говорят о Retrieval Augmented Generation, но у большинства компаний даже нет внутренней документации, которую стоит извлекать. Разгребите. Свой. Навоз.
Последний результат будет заключаться в разрешении этих фундаментальных проблем. В таком случае у нас появится система, действительно способная заменить такие вещи, как программирование в современном понимании, и которую общем смысле можно считать искусственным интеллектом.
В случае, если генеративный ИИ совершит резкий скачок, создание чат-ботов не подготовит вас к будущему. Теперь это вам понятно? То, что ваша команда может ввести import openai
, не значит, что вы находитесь на переднем крае прогресса искусственного интеллекта, как бы вы ни надували щёки на LinkedIn и на жалких церемониях награждения (схожих до степени неразличимости с подкупом), устраиваемых порочными сущностями Варпа, продающими вам корпоративное ПО5. Ваш бизнес тряхнёт точно так же, как если бы вы не делали ничего, и гораздо сильнее его тряхнёт, если вы не создадите для компании прочный фундамент. Если вы учите своих сотрудников писать при помощи ChatGPT письма стейкхолдерам, то это не поможет вашему бизнесу пережить этот скачок. Если мы найдём путь между посредственным влиянием ИИ и катастрофой уровня вымирания динозавров, то всё изменится навсегда, а ваши вялые потуги будут походить на попытки муравья держаться за травинку в тени надвигающегося цунами.
[5. Недавно мне стало известно, что это молчаливая сделка, заключаемая многими поставщиками SaaS с руководителями компаний. Если ты покупаешь их ПО, например, Snowflake, то все без слов понимают, что тебе позволят рассказать о своём успехе на сцене; так ценой передачи поставщикам кучи чужих денег ты улучшишь своё портфолио руководителя.]
Если ещё один тупой придурок попросит меня реализовать код-ревью на основе LLM, чтобы «повысить стандарты» вместо того, чтобы научить людей основам дисциплины, то клянусь, я овладею дзюдо настолько, что заброшу его на Солнце.
Я пытаюсь донести это максимально понятно: вам нужно или находиться на самом острие прогресса и проводить прорывные исследования, или заниматься ровно тем же, чем и пять лет назад, с незначительными включениями LLM в работу компании. Всё, что посередине, не имеет никакого смысла, если только вы не работаете в очень редкой нише, которую трясёт уже сейчас.
V. Но все говорят, что пользуют...
Можете представить, сколько законов написано ChatGPT, прежде чем утомлённый чиновник отправился домой с работы? Сколько отделов компаний — это просто LLM, циклически общающаяся друг с другом, потому что люди, уставшие от пересылаемой другими хрени, просто вставляют свои переписки в поле промта? Я уверен, что в радиусе десятка километров от вас есть врач, поставивший ошибочный диагноз, потому что вбил симптомы в чат-бот.
Чем мы, как общество, занимаемся?
Руководитель организации, сертифицирующий обучающихся для выполнения работ, потенциально связанных со спасением жизней и иммиграционным законодательством, спросил меня, могу ли я научиться выявлять жульничающих студентов. Я собирался ответить «Скорее всего, нет»... но у меня возникло подозрение, поэтому я сказал: «Возможно, получится, но по моим прикидкам, до 50% обучающихся жульничают, что сильно повлияет на прибыль организации, если мы действительно их отстраним. Нужно ли мне провести такое исследование?»
Больше мы к этому вопросу не возвращались.
Я задал вопрос ментору, работающему в государственном секторе, об очень озадачившей меня беседе, свидетелем которой я стал.
Я: Серьёзный вопрос: люди действительно верят историям, которые настолько очевидно глупы, или это по большей мере продуманная отчаянная попытка получить деньги от аферистов, наживающихся на ИИ (то есть, у этих людей есть хотя бы частичные внутренние сомнения)?
Он: Должен ответить на этот вопрос максимально деликатно... существуют те, кто похожи на сектантов. А есть те, кто на них непохожи. А ещё есть те, кто пытается создать как можно более сектантскую атмосферу. Оставлю тебе решать, к какой категории кто относится.
Я решил, и хотя мне не удастся отличить сектантов от тех, кто продаёт сектантство в промышленных масштабах, я доберусь хотя бы до некоторых из них прежде, чем до меня доберётся полиция. А если мне повезёт, она потратит несколько месяцев впустую, спрашивая LLM, где меня искать.
Когда я был в отпуске на Фиджи, во время последнего завтрака официантка принесла мне бланк с вопросом, хочу ли я вступить в клуб. Это было абсолютно бесплатно, и за это полагался подарок. Все остальные посетители ресторана сразу же подписали бланк, а я вкратце просмотрел условия обслуживания. Оказалось, они оставляют за собой право использовать любые переданные мной данные для обучения моделей ИИ, а также делиться этими моделями с неуказанным количеством компаний в их конгломерате.
Я просто хочу спокойно поесть панкейков, конченные вы люди.
VI.
Основная проблема моей пламенной ненависти не в том, что я ненавижу LLM или ажиотаж вокруг генеративного ИИ. Мне было интересно поэкспериментировать с Copilot, но потом я решил, что из-за него я тупею — он впечатляет, но не особо пригоден ни для чего более серьёзного, чем генерация бойлерплейта. В этом нет ничего плохого, но он не привёл к огромному скачку продуктивности, как я надеялся, потому что программирование — это проектирование, а подобные инструменты недостаточно хороши (пока), чтобы серьёзно помогать мне в этом.
Нет, ненавижу я людей, которые ухватились за них, как множество пиявок, разбухли от крови и хаотично извиваются. До того, как стал непопулярным блокчейн, именно они любили говорить о его потенциале для бизнеса. Когда я в последний раз был на конференции, именно они на одном дыхании обсуждали потенциал «квантов», понятия не имея о том, что же это вообще означает. Только в процессе написания поста я осознал, что у меня есть картинка, идеально описывающая связь между этими областями.
На прошлой неделе я читал статью, в конце которой был небольшой опросник. Он предназначен для руководителей в сфере безопасности, но я быстренько прощёлкал его, чтобы почитать вопросы.
Ну что, дорогой руководитель, что вас больше всего интересует? Искусственный интеллект, блокчейн или квантовые вычисления?6 Составители опросника чётко знают, кто их целевой рынок — люди, которым дали власть над чужими деньгами, потому что они научились приятно улыбаться, знающими, что они смогут стричь бабло, если вовремя хайпанут.
[6. На самом деле я не знаю, что такое «zero-trust architecture», но слышал этот термин от достаточно большого количества глупых людей, поэтому предполагаю, что это ещё один термин, означающий нечто в теории, но не в повседневной жизни.]
Ни одного знакомого мне компетентного человека в сфере безопасности (то есть работающего над повседневной кибербезопасностью, а не в организации, занимающейся передовыми исследованиями) ничто из этого не волнует. Они трудятся над правильной настройкой файрволлов или защищают организацию от того, чтобы она не коммитила пароли в свои репозитории. Да, кто-то должен разбираться, какие последствия для криптографии несут квантовые вычисления, но таким человеком точно не будет «синергетический руководитель», не обладающий никакими навыками, кроме как быстрой речи и раздувания количества подчинённых. У «синергетического руководителя» нельзя просить совета ни по каким важным вопросам, от машинного обучения до быстрого завязывания шнурков. Когда в последний раз я общался с одним из множества аватаров «синергетического руководителя», он настаивал, что я должен вложить основную часть своих денег в криптовалюту под названием Monero. И таково лицо корпоративного ИИ. Узрите эту тоскливую картину и уклонитесь от общения с ним, ибо глаза его налиты кровью, как у демона, и он притворяется, что получает удовольствие от сигар.
В моей консультационной фирме есть три достаточно неплохих дата-саентиста — на самом деле, двоих из них можно со всеми основаниями назвать одними из лучших в стране, если не считать группы, проводящие экспериментальные исследования, хотя эти двое и слишком скромны, чтобы говорить о себе так. Несмотря на это, мы не продаём никакие сервисы ИИ. Рынок настолько перекошен, что это было бы почти столь же ужасно, как погружаться в мир крипто. Всё ещё не так плохо: в конце концов, я ещё не дошёл до того, чтобы считать подонком каждого, кто хоть раз вводил import tensorflow
, но мы уже давно движемся в этом направлении.
Проще говоря, весь этот класс людей ненавистен правильно думающим людям. Они вызывают стыд у тех, кто действительно двигает прогресс в этой сфере, и отвращение у людей, умеющих использовать технологии для совершенствования мира; а ещё они — это кучка унылых ничего не знающих ублюдков, достойных заключения в Тюрьму для авторитетных экспертов, фандрайзинг для постройки которой я сейчас провожу. Каждое утро фигура в тёмном капюшоне голосом, напоминающим скрежет по могильной плите, шестьдесят минут будет рассказывать заключённым менеджерам о том, как данное учреждение совершает революцию в физических наказаниях, под конец объявляя, что инновация, как и во все прочие дни, заключается в том, чтобы очень сильно бить их в живот.
[7. И это буду я. Я буду делать это, если вы скажете мне, что вам нужно подготовить инфраструктуру под ещё один чат-бот. Вас предупредили.]
Меня тошнит от того, что выбранная мной профессия подтолкнула меня так близко к этим людям, и именно поэтому я так активно учусь — меня обуревает отчаянное желание никогда больше не слышать их гнилостные речи; я хочу присоединиться к компании праведных, участвующих в разработке открытого ПО и считающих, что разговоры об Agile весь день — это упражнение для инопланетян, читающих книгу о продуктивности людей.
Я только что вернулся из путешествия в существенно менее развитую страну. Я действительно жил в этой стране, пусть не очень долго, и видел, сколько жизней могли бы улучшить эти деньги, которые просто сливаются в канализацию Microsoft Fabric. Вы не поверите, насколько сильно это меня бесит. Клянусь Богом, я буду учиться, писать, расширять свои связи и иными способами прикладывать силы к проблеме, пока эти ресурсы не попадут туда, где они принесут пользу обществу, а не кошельку какого-то ухмыляющегося клоуна.
VII. А, так вы один из тех пессими...
Призываю Бога в свидетели, ты, гротескный простофиля: если лично ты не пишешь системы машинного обучения, но осмелишься ещё раз открыть рот по поводу ИИ, то я отправлю тебе по почте кирпич и лист бумаги с инъекцией промта, заставляющей тебя разбить себе лицо, а потом просто сяду и буду ждать, пока ты загрузишь промт в ChatGPT, потому что ты уже наверняка разучился читать самостоятельно.
Постскриптум
Возможно, вам понравятся мои статьи «Я тебя вырублю апперкотом, если ты будешь пользоваться этой таблицей», «Я тебя просто уничтожу, если ты снова начнёшь говорить об Agile», а также другие интересные посты. А ещё у меня есть подкаст «Обладает ли лягушка природой скорпиона», в котором мы с друзьями откровенно обсуждаем технологии. Надеюсь, вам понравилось!
Ещё мне подсказали, что я сошёл с ума, если в конце каждого поста не советую людям обращаться ко мне с интересной работой. Так что вот он я! Читатели и работодатели могут писать мне на ludicity.hackernews@gmail.com.
Комментарии (169)
nikolz
21.06.2024 15:19+3Я начал работать дата-саентистом в 2019 году, а к 2021 году осознал, что, несмотря на огромный размер этой сферы, в ней в то же время ужасно много мошенничества.
Автору понадобилось 3 года, чтобы понять очевидное.
Наверное постигал "Путь самурая" на русском языке.
Tannenfels
21.06.2024 15:19+3на русском языке.
Статья - перевод
edogs
21.06.2024 15:19+4Видимо поэтому и понадобилось 3 года, если бы постигал на английском - уложился бы в год:)
Politura
21.06.2024 15:19+37Похоже реальная причина столь сильных эмоций автора гдето здесь:
В моей консультационной фирме есть три достаточно неплохих дата-саентиста — на самом деле, двоих из них можно со всеми основаниями назвать одними из лучших в стране, если не считать группы, проводящие экспериментальные исследования, хотя эти двое и слишком скромны, чтобы говорить о себе так. Несмотря на это, мы не продаём никакие сервисы ИИ.
Сделал ставку на то, чтоб быть не такие как все и везде подчеркивать, что у них нет ИИ и внезапно осознал, что услуги его консультационной фирмы никому не нужны.
Фишка в том, что чтоб использовать генеративные сети, не надо быть датасайнтистом, это совершенно разные сферы, разные навыки и разный опыт. Поэтому его отсылка к собственному крутому опыту датасайнтиста ничего не значит. Автор не нашел для себя способов, где он может применять эти сети и ему завидно, когда он видит, как другие применяют:
Нет, ненавижу я людей, которые ухватились за них, как множество пиявок, разбухли от крови и хаотично извиваются.
Я тоже очень мало пользуюсь генеративными сетями, но при этом вижу людей вокруг меня, которые стали применять их часто и стали более эффективными уже здесь и сейчас, и закрывать глаза на это, и тем более злиться от этого просто глупо.
omxela
21.06.2024 15:19+37Я тоже очень мало пользуюсь генеративными сетями, но при этом вижу людей вокруг меня, которые стали применять их часто и стали более эффективными уже здесь и сейчас, и закрывать глаза на это, и тем более злиться от этого просто глупо.
Так про то и речь. Это же классическая формула хайпа: я сам нет, но у меня есть знакомые, которые таки (а) часто применяют; (б) заметно повысили эффективность. Часто применяют для чего? Повысили эффективность в чем и насколько? Если в каждом конкретном случае детально разобраться, то, возможно, иногда так оно и есть. Но мы же нормальные люди, мы всем верим на слово.
Aniro
21.06.2024 15:19Ну допустим я участвую в разработке системы которая активно использует генеративные модели для серьезных задач. У нас есть измеримые метрики и результаты, полученные реальными клиентами на реальных задачах. Повышение эффективности заметное, хотя и не всегда революционное, в зависимости от задачи. Но я вам про них не расскажу, потому что NDA. Так что остается только верить на слово или не верить.
venanen
21.06.2024 15:19+16Например, я не пишу больше простой и рутинный код, ИИ в IDE мне сам его пишет. Сам понимает, какая мне нужна рекурсия, как собрать строку и так далее - не всегда точно, иногда нужно править, но продуктивность выросла 100%. Еще мне очень нравится возможности вроде создания массива дней недели, где пишешь
['пн',
, а сетка сама дописывает массив. Или когда исправил одну строчку в мок-данных, ИИ сразу предложил вариант исправления остальных строк по образцу (например, массив -> объект). И это я еще далеко не все перечислил.
Друг иллюстратор, например, говорит, что сейчас никто арты с нуля уже не рисует, это долго. Берут MJ/SD, и дорисовывают за ним, исправляя косяки и меняя детали на нужные.
Еще, например, с выходом GPT-4o я начал при необходимости загружать в него договора (например, на аренду машины), и он отлично находит там нестыковки/ловушки. Я использую GPT-4o\Codeseeker для написания простых функций на языках, которые я плохо знаю - например, преобразования dataframe в pandas по нужным мне условиям.
С udio и suno я даже несколько песен добавил себе в плейлист.
С нейронкой 300 от яндекса мне не приходится искать в доклад и конференциях на ютубе нужный мне момент, я вставляю ссылку и получаю весь таймлайн с пересказом.
Не говоря уже о локальных и узких применениях, например, загрузить список новостей и статей по акции и попросить оценить настроения людей, агрегировать персонально для себя новости. А с возможностью запускать локально сетки, которые уже не такие тупые как раньше - возможностей еще больше.
И я удивляюсь, как люди могут не замечать такой прорыв. Для меня это чудо чудное, когда железяка отвечает как человек, знает почти все, умеет отвечать на вопросы. Для меня это как изобретение нормально работающего сенсорного экрана.N-Cube
21.06.2024 15:19+18Вот только все перечисленное не имеет отношения к искусственному интеллекту. Можно называть это комбинаторикой слов, звуков и изображений, но не интеллектом. И основаны нейросетевые методы на огромном массиве уже существующих данных, а не на создании нового. Интеллект - это разработать физическую теорию всего, которую не смог создать Эйнштейн, а не слова рифмовать или список дней недели подсказывать. Калейдоскоп делает аналогичную операцию для изображений без всяких компьютеров (и все еще не захватил мир). И хотя большинство людей всю жизнь делают работу ничуть не сложнее, чем могут современные нейросети, это абсолютно не означает, что нейросети хоть в чем-то достигли уровня человеческого интеллекта (если робот и Эйнштейн оба умеют ковыряться в носу, этот общий признак не делает их равными по интеллекту).
funca
21.06.2024 15:19+4Интеллект - это разработать физическую теорию всего, которую не смог создать Эйнштейн
Интеллект это тратить время на Хабре, обсуждая недостатки ИИ. А разработка теории всего это чушь собачья - ни кто не хочет этим заниматься.
BlackMokona
21.06.2024 15:19+4Это называется бегство от ИИ. Когда ИИ в очередной раз громит очередные красные линии разумности, на которых прочно стояли люди ещё недавно. Линии срочно перерисовываются и возводятся бастионы дальше. Каждый раз когда ИИ решает какую то задачу которая 1000% требует разума, это задача исчезает из списка требующих разумности. Помню в одном споре, человек перенёс за один разговор в течении нескольких часов, эти красные линии раз 30. Я ему просто ссылки кидал, что очередная его красная линия уже пройдена.
N-Cube
21.06.2024 15:19+11Вы написали много слов, которые не имеют смысла - подражаете нейросети? Хоть один результат покажите, где нейросеть превзошла достижения человечества.
И демагогия про вашего знакомого, кто пал ниц от ваших познаний, как-то не к месту. Очевидно, на людей, далеких от технологий и науки, ориентироваться нет смысла, им и калейдоскоп магия. К примеру, если сейчас с помощью нейросетей лекарства разрабатывают - так этим занимались еще десятилетия назад (более того, давно существуют университетские курсы на эту тему для студентов, то есть это и тогда был вовсе не топ технологий) , по сути, с помощью динамического программирования и алгоритма Дейкстры, а сейчас просто данных больше стало. Обработка текста - если вы посмотрите реализацию полнотекстового поиска в СУБД SQLite3, то найдете там те же принципы для нечеткого поиска разреженных лексем (только ресурсы ограничены, потому поиск в пространстве малой размерности выполняется). И так далее. Общее у всех этих нейросетевых методов то, что все они просто рекомбинируют входные данные, в отличие от научных теорий и моделей, которые создают новое знание (например, теория относительности помогла запустить спутники на орбиту, которых не было даже в проекте во время создания теории).BlackMokona
21.06.2024 15:19+1Совсем недавно красная линия была на способностях обычного человека, а теперь на том что превзойти достижения человечества. Насколько сдвинется линия дальше?
funca
21.06.2024 15:19Вы написали много слов, которые не имеют смысла - подражаете нейросети?
Вы, кстати, тоже.
давно существуют университетские курсы на эту тему для студентов, то есть это и тогда был вовсе не топ технологий
Вы путаете лабораторные работы и технологии. Доступные технологии в промышленных масштабах появились совсем недавно. И кстати, доступны они сейчас далеко не всем.
если вы посмотрите реализацию полнотекстового поиска в СУБД SQLite3, то найдете там те же принципы для нечеткого поиска разреженных лексем
Нет, на движке SQLite вы при всем усердии не сможете реализовать GenAI. Разница как между совой и глобусом: их обоих можно отправить в полет, но ловить мышей могу только первые.
L0vkach
21.06.2024 15:19Вы даже содержание относительно несложного комметария не поняли. Не удивительно, что Вы восхищаетесь "умностью" ИИ
funca
21.06.2024 15:19Не удивительно, что Вы восхищаетесь "умностью" ИИ
Меня восхищает движуха, которая сейчас происходит в этой области, и темпы мобилизации ресурсов по всему миру, в частности. Когда одини компании начинают выпускать аппаратные решения, которые раньше не выпускали, другие строят на этой базе целые дата центры, а третьи - раз в полгода делают релизы моделей с сумасшедшими по меркам простого обывателя характеристиками и требованиями... Ну а потом оно помогает выполнить ужасно сложную и ответственную задачу, например написать эксклюзивное поздравление девушкам с 8 марта, спасая весь мужской отдел и галактику.
BlackMokona
21.06.2024 15:19И раньше так было. Сеть размером с планету, миллионы чипов где миллиарды транзисторов сделанных с нанометровой точностью отправляют открытку через весь мир.
venanen
21.06.2024 15:19+3Вы можете называть его как вам угодно. Неугодно ИИ - называйте его нейросеткой. Не нравится нейросетка - называйте по-другому, это не отменяет того факта, что речь шла о том, улучшил ли ИИ мне работу и повысил ли продуктивность? Я ответил что да, привел конкретные примеры.
А дальше вы вообще ушли сильно в сторону - да, ChatGPT новых теорем не изобретет (хотя под вопросом, слышал, что ИИ используется для белковых соединений, но точно не могу сказать), но я от него это и не требую.
Так, например, моя машина имеет адаптивный умный круиз-контроль с удержанием в полосе - что мне иногда облегчает жизнь, особенно в пробках. Было бы странно контраргументом приводить то, что этот круиз-контроль не сможет проехать гоночный трек быстрее профессионального водителя, не так ли?brownfox
21.06.2024 15:19+6Проблема с генерирующими нейросетками в том, что они сдвигают интеллектуальную деятельность человека из области создания контента в область его верификации.
Я в этом году достаточно много времени потратил на изучение "программирующих" моделей и могу уверенно сказать, что генерируемый код далеко не всегда соответствует поставленой задаче, хотя и выглядит правдоподобно. Генерация чего-то чуть более сложного, чем Hello World, требует от автора промпта, по сути, того же программирования, но на естественном, плохо приспособленом для этого языке. Именно поэтому я пока спокоен за своё место в индустрии :)))
Понятен хайп вокруг "гуманитарных" нейросетей - живопись и музыка требуют сложного образования и большого опыта, а творить хочется всем. Поэтому проще поправить косяки на сгенерированной методом проб и ошибок картинке, чем рисовать её с нуля.
Но этот путь, к сожалению, ведёт к технической деградации, т.к., с одной стороны, уравнивает умельца и "неумельца". Зачем пять лет учиться рисовать кубики-тени-фигурки, если нейросетка нарисует за 10 секунд Мону Лизу по твоей просьбе? А с другой стороны, превращает цепочку "визуальный образ в голове - рука - картинка" в более длинную "визуальный образ в голове - цикл из ста вариантов словесных описаний и генераций - картинка".
unC0Rr
21.06.2024 15:19Интеллект - это разработать физическую теорию всего, которую не смог создать Эйнштейн
Так что же, раз этой теории у нас нет, то интеллект у людей отсутствует?
большинство людей всю жизнь делают работу ничуть не сложнее, чем могут современные нейросети
Как минимум, это означает, что современные нейросети уже могут заменить большинство людей. Немалое достижение, не так ли?
не означает, что нейросети хоть в чем-то достигли уровня человеческого интеллекта
Так а где критерий-то этого человеческого интеллекта? Теории всего у нас нет ни от ИИ, ни от людей.
N-Cube
21.06.2024 15:19+5Колесо изобрести - тоже интеллект нужен, но для перестановки слов, описывающих разнообразные колеса, никакого интеллекта не требуется.
Большинство людей во многих странах можно заменить пустым местом - и такие идеи есть давно. Гуглите про всеобщий базовый доход.
Выше я уже предложил вариант - получить от нейросети совершенно новое знание, к примеру, физическую теорию, которую люди пытались, но не смогли создать. Пока и в обозримом будущем никаких результатов в теоретической физике и математике нейросети создавать не в состоянии, в отличие от людей. Заметим, что даже и базовая логика у нейросетей не реализована - ответы формально не валидируются никак, а просто являются вероятностно сгенерированной последовательностью слов. Другими словами, пока нейросеть не способна реализовывать логически корректные рассуждения, пользуясь заданным набором нужных аксиом (которые сама формулирует на основании известных фактов или выбирает из созданных людьми), это просто вариант калейдоскопа. А ваши рассуждения о наличии интеллекта у системы, по дизайну не способной быть логичной, лишены смысла.
Alexey2005
21.06.2024 15:19+1Выше я уже предложил вариант - получить от нейросети совершенно новое знание, к примеру, физическую теорию, которую люди пытались, но не смогли создать. Пока и в обозримом будущем никаких результатов в теоретической физике и математике нейросети создавать не в состоянии, в отличие от людей.
Вы пытаетесь, условно говоря, заставить гуманитариев родить естественнонаучную теорию, а когда они не справляются - делаете далеко идущий вывод о том, что гуманитарии не обладают интеллектом и абсолютно бесполезны.
Чтобы родить физическую теорию, нужна нейросеть-физик, которую не на форумных текстах обучали, а на наборах экспериментальных данных, чтобы она училась видеть физические закономерности. Сделать это не так уж сложно, было бы желание.
Берём, к примеру, полный набор данных, собранных к настоящему моменту на Большом Адронном Коллайдере (а там многие петабайты), обучаем на нём нейронку. В итоге получаем сеть, которая без проблем предскажет вам, какие частицы будут рождаться в тех или иных столкновениях, их свойства, их поведение. И сделает это ничуть не хуже любой современной физической теории.
rPman
21.06.2024 15:19Идея хорошая но к сожалению, в лоб, пока финансово не подъемная, детекторы БАК генерирует петабайты в секунду, а общее количество сохраняемой информации дошло до экзабайта... собственно ученые со всего мира решают эту головоломку о том как из этих данных извлекать пользу и не погрязнуть в мусорных данных, не сомневаюсь, нейронки там тоже используются.
N-Cube
21.06.2024 15:19Теория относительности создана без всех этих данных, и подтверждена значительно позднее, когда данные были получены. Так что создать математическую теорию можно без каких-либо данных, а подтвердить небольшой выборкой для начала.
brownfox
21.06.2024 15:19Да, тут основная проблема - в обучении, точнее, в отсутствии хороших обучающих выборок для фундаментальных физических проблем. Слишком велика неопределённость и слишком мало готовых заведомо правильных примеров экспериментальных данных. А объяснить нейросетке ЛОГИКУ принятия решений физиками не получится в силу отсутствия у нейросетевых ИИ процесса мышления.
Кстати, было когда-то давно в айти другое модное направление - экспертные системы (и сопутствующий им knowledge engineering), где основной задачей было как раз моделирование процесса принятия решений на основе логики и вероятностей.
N-Cube
21.06.2024 15:19+2Художник - гуманитарий или физик, по вашему мнению? Означает ли это, что художник не способен к логике, в том числе, не понимает причинно-следственных связей между использованием разных красок и результатами, светотенью, перспективой и так далее? Разумеется, понимает - а вы, похоже, пытаетесь назвать всех, кроме себя, идиотами! Нейросеть же оперирует вероятностями, так что любая комбинация абсурда возможна.
Cerberuser
21.06.2024 15:19+2Неспособность к логике и, в частности, к пониманию причинно-следственных связей - это в принципе неотъемлемая черта человеческого мышления, независимо от профессии.
Alexey2005
21.06.2024 15:19Означает ли это, что художник не способен к логике, в том числе, не понимает причинно-следственных связей между использованием разных красок и результатами, светотенью, перспективой и так далее?
Понимает. И? Какое отношение это имеет к моему комментарию? Я утверждал, что глупо просить у художника/поэта/писателя создать физическую теорию уровня Эйнштейна. И то, что он на это не способен, вовсе не означает, что он тупее Эйнштейна.
Разумеется, понимает - а вы, похоже, пытаетесь назвать всех, кроме себя, идиотами!
Что-то мне ваша манера ведения дискуссии напоминает... А, точно:
Тов. проф. Выбегалло А.А., перелогиньтесь
— Как-то странно вы рассуждаете, товарищ Киврин, странные у вас аналогии, чужие! Модель идеального человека и какой-то внеклассовый огнедышащий дракон!..
— Г-голубчик, да дело же не в том, ч-что он внеклассовый, а в том, что он п-пожар может устроить…
— Вот, опять! Идеальный человек может устроить пожар! Не подумали вы, товарищ Федор Симеонович!
— Я г-говорю о д-драконе…
— А я говорю о вашей неправильной установке!N-Cube
21.06.2024 15:19+2Самая известная картина в мире - Мона Лиза, авторства Леонардо да Винчи. Известный художник, не так ли, даже не считая сотен его других картин. Давайте поищем у этого художника что-нибудь уровня Эйнштейна в физике - и находим сопромат, интерференцию, рэлеевское рассеяние и еще много всего. Притом заметим, что теория относительности создана работами Минковского, Пуанкаре, Лапласа, Эйнштейна, причем Пуанкаре первым сформулировал принцип относительности, а весь матаппарат разработан Минковским и Лапласом. Да и фотоэффект практически открыт Герцем, красная граница описана Столетовым, поток электронов обнаружен Томсоном... а заслуга Эйнштейна в том, что он применил новую модную теорию Макса Планка к обяснению фотоэффекта. Художник же Леонардо делал открытия уровня Эйнштейна самостоятельно, не опираясь на горы работ предшественников.
Итого, все ваши высказывания про гуманитариев противоречат общеизвестным фактам. Это лично вы не способны на физику, а не гуманитарии. А раз уж вы в своей демагогии обратились к цитатам, то "поздравляю вас, товарищ, соврамши!" (с).
venanen
21.06.2024 15:19Например, я не пишу больше простой и рутинный код, ИИ в IDE мне сам его пишет. Сам понимает, какая мне нужна рекурсия, как собрать строку и так далее - не всегда точно, иногда нужно править, но продуктивность выросла 100%. Еще мне очень нравится возможности вроде создания массива дней недели, где пишешь
['пн',
, а сетка сама дописывает массив. Или когда исправил одну строчку в мок-данных, ИИ сразу предложил вариант исправления остальных строк по образцу (например, массив -> объект). И это я еще далеко не все перечислил.
Друг иллюстратор, например, говорит, что сейчас никто арты с нуля уже не рисует, это долго. Берут MJ/SD, и дорисовывают за ним, исправляя косяки и меняя детали на нужные.
Еще, например, с выходом GPT-4o я начал при необходимости загружать в него договора (например, на аренду машины), и он отлично находит там нестыковки/ловушки. Я использую GPT-4o\Codeseeker для написания простых функций на языках, которые я плохо знаю - например, преобразования dataframe в pandas по нужным мне условиям.
С udio и suno я даже несколько песен добавил себе в плейлист.
С нейронкой 300 от яндекса мне не приходится искать в доклад и конференциях на ютубе нужный мне момент, я вставляю ссылку и получаю весь таймлайн с пересказом.
Не говоря уже о локальных и узких применениях, например, загрузить список новостей и статей по акции и попросить оценить настроения людей, агрегировать персонально для себя новости. А с возможностью запускать локально сетки, которые уже не такие тупые как раньше - возможностей еще больше.
И я удивляюсь, как люди могут не замечать такой прорыв. Для меня это чудо чудное, когда железяка отвечает как человек, знает почти все, умеет отвечать на вопросы. Для меня это как изобретение нормально работающего сенсорного экрана.
mazdai19
21.06.2024 15:19использую чат гпт для быстрой справки. гораздо быстрее выходит чем лезть в доки/гугл/стаковерфлоу
lazy_val
21.06.2024 15:19+2вижу людей вокруг меня, которые стали применять их часто и стали более эффективными уже здесь и сейчас
Можете пожалуйста привести примеры? ну то есть кто стал эффективным и в чем? Спасибо
green_fenix
21.06.2024 15:19+4Я думаю на хабре многие могут сказать что часто пользуются копайлотом - для меня он стал таким же коренным инструментом как форматтер в ide - жить без него естественно можно, но сильно менее удобно. Весьма помогает с эффективностью написания шаблонного кода, которого к сожалению весьма прилично, во всяком случае на моей работе. А время от времени и не шаблонный он тоже весьма грамотно предугадывает.
Чатгпт сам тоже постепенно стал частью моей жизни - спрашивать глупые и не очень вопросы у него гораздо быстрее чем гуглить и просматривать несколько страниц. А еще, как я недавно для себя открыл, он умеет переводить фотографии рукописных надписей на иврите, что для меня очень ценно.
ebt
21.06.2024 15:19+3А вас не смущают возможные галлюцинации? В любой момент эта штуковина может на серьёзных щах выдать вам бред сивой кобылы.
gorlatoff
21.06.2024 15:19+7Ошибки это не какое-то уникальное свойство чат-ботов. На Stackoveflow встречаются неправильные ответы, мы сами часто ошибаемся и.т.д. В любом случае, проверять на правильность обычно быстрее, чем делать самому.
Да и исправлять ошибки они тоже умеют, свои и чужие. И в кодинге пригождалось, и в работе с данными на иностранных языках.
isden
21.06.2024 15:19+2Буквально полчаса назад.
я: расскажи плз, как через netplan сделать алиас интерфейса
chatgpt (отвечает всегда длинными портянками почему-то): нужно перечислить все ip адреса в конфиге, вот так
я: мне нужно именно алиас интерфейса, типа eth1:1
бот: вы можете его сделать вручную
я: мне нужно через нетплан
бот: вы можете указать алиас типа eth1:1 в конфиге
я (сначала обрадовался, а потом вспомнил что вчера весь вечер подробно изучал доки нетплана, и там такого не было): но про такое не написано в документации
бот: вы правы. вы можете перечислить все нужные ip адреса в конфиге.
Спасибо, кэп!
40kTons
21.06.2024 15:19+10вижу людей вокруг меня, которые стали применять их часто и стали более эффективными уже здесь и сейчас
А можно примеров в чём они стали эффективнее, а то я вокруг лишь слышу о людях, которые стали продуктивнее в чём-то, но ниразу их не видел
На днях попросил LLM написать мне простой sh скрипт - писать в цикле echo счётчика цикла раз в секунду. Написать то написал, но скрипт не работал - дело в том, что в разных оболочках разных версий некоторые вариации цикла for не работают. Условно -
for i in 1 2 3 4
сработает, аfor i in $(seq 1 4)
нет, потому что оболочка минималистичная и не распознаётseq
. Как результат - приходится лезть в гугл что бы исправлять написанное LLM, искать статью с разными вариациями loop и перебирать тот код, который подойдёт. И так постоянно - оно вроде что-то разумное выдаёт, но когда начинаешь пробовать, оказывается, что из-за деталей не работает. Для того, что бы выдало что-то рабочее, надо больше погружать LLM в контекст. А пока погружаешь уже проще самому сделать. В процессе работы что с LLM, что без, приходишь к одним и тем же статьям, которые содержат требуемую инфу. Я не заметил упрощения работы. Вопросы из разряда не "выдай мне код", а "опиши как X работает" - тут LLM ещё хуже, лучше самому в инете искать, а LLM может разве что помочь перечислив некоторые темы, которые стоит рассмотреть, но сам он нормально изложить их не в состоянииMoog_Prodigy
21.06.2024 15:19+4Кстати за счет этой особенности оно мне помогло. Знаете же вот это "Пока обьяснял, сам досконально понял". Нужно было мне написать один хитрый скрипт, два дня гугления по теме ничего не дало. Локальный GPT предложил мне использовать curl. Готовый скрипт разумеется не работал, но я вообще до этого не ведал, что curl можно использовать для такой задачи! Изучив справку я немного доработал скрипт и все заработало. А до этого я пытался спрашивать в чатах, как бы это сделать вот эдакое. Все такие : А тебе зачем?
Затем. GPT не задает глупых вопросов, он берет и делает. Возможно, неправильно. Поиск его ошибки - это тоже работа для био-мозгов, а не то чтобы нажал одну кнопку и за тебя все готовенькое сделали.
SystemOutPrintln
21.06.2024 15:19+4Хм, это напоминает метод резиновой уточки, только продвинутый.
Moog_Prodigy
21.06.2024 15:19Похоже, это оно. Но как продвинулась уточка! И получается мы с ней иногда меняемся местами, и уже она код правит и задает вопросы.
Кто бы подумал. Нет, это все равно новое слово в науке и технике!
Myself12
21.06.2024 15:19Если претензии к seq можно было попросить написать на чистом sh, или /bin/bash - x запустить и ему же скормить :-)
asch2022
21.06.2024 15:19+1Как насчет написать "seq не распознается минималистической оболочкой, переделай"? В гугле тоже ответ всегда по первой ссылке правильный находится?
40kTons
21.06.2024 15:19+1Для того, что бы выдало что-то рабочее, надо больше погружать LLM в контекст. А пока погружаешь уже проще самому сделать.
unC0Rr
21.06.2024 15:19Замечу, ректрограды всегда руководствовались такой логикой. "Пока в калькулятор натыкаешь, проще уже вручную костяшки на счётах поперебрасывать". "Пока в эксель вобъёшь, уже проще самому на калькуляторе обсчитать". "Пока эту базу данных слепишь и запросы напишешь, проще самому уже в экселе нафигачить".
Я не говорю, что надо бросаться всё решать в LLM, просто хочу показать, как эта логика работала в применении к старым технологиям.
Johan_Palych
21.06.2024 15:19+1Малазиец Nikhil Suresh отжигает:
https://ludic.mataroa.blog/blog/the-controlled-detonation-of-my-anonymity/I'll let you know if I end up getting f.....g shot in the head by someone in a suit that doesn't like honesty, or if I'm forced into working at KFC. Godspeed, you glorious bastards.
ImagineTables
21.06.2024 15:19может произойти взрыв интеллекта, ИИ начнёт рекурсивно самосовершенствоваться, а нас разберут на атомы, потому что маркетинговый алгоритм решит, что человечество можно превратить в глобнар — новую эпоксидную смолу, на которую есть огромный спрос у инопланетян в соседней галактике для ремонта их аналога кофе-машин
И он ещё говорит, что знает эти технологии. Пусть тогда покажет пальцем, где в схеме AI (любого) заложена принципиальная возможность к рекурсивному самосовершенствованию. Про что он вообще? Про обучение на сгенерированных датасетах?
(Я понимаю, что это перевод. Поэтому и пишу «он». Переводчику спасибо за интересный материал).
alex50555
21.06.2024 15:19+4Есть конечно, reinforcement learning, это как-раз про самообучение.
Но вообще он имеет ввиду понятие технологической сингулярности, которая может произойти в будущем. Это утверждение, что когда мы создадим самообучающийся сильный ИИ, по разуму равный человеческому, то он начнёт саморазваться бешенными темпами и превратиться в сверхразум, который мы перестанем понимать и не сможем контролировать.
Тут подробнее можно почитать:
https://ru.m.wikipedia.org/wiki/%D0%A2%D0%B5%D1%85%D0%BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D0%B8%D0%BD%D0%B3%D1%83%D0%BB%D1%8F%D1%80%D0%BD%D0%BE%D1%81%D1%82%D1%8C
N-Cube
21.06.2024 15:19+1А еще раньше нападения инопланетной сверхцивилизации боялись. Вот только в наблюдаемой Вселенной не заметно существование сверхразума и управления соответствующими энергиями (все наблюдаемые события подчиняются законам природы, и никто сверхновые как лампочки не зажигает и не гасит, к примеру), так что возможность существования сверхразума ничем не подтверждается. Бояться, что люди создадут то, чего вообще не существует во Вселенной - это психическое отклонение, а не наука.
funca
21.06.2024 15:19возможность существования сверхразума ничем не подтверждается
Есть множество людей, кто умнее меня - постоянно с ними встречаюсь. Почему я должен отвергать возможность наличия у них или кого-нибудь ещё сверхразума?
N-Cube
21.06.2024 15:19+1Есть же шкала Кардашева: https://ru.m.wikipedia.org/wiki/Шкала_Кардашёва Кто-то из ваших знакомых способен использовать всю энергию планеты, Солнца и всей галактики? Можете и другие метрики использовать, если желаете, результат будет тем же.
BlackMokona
21.06.2024 15:19Попробую вам пояснить идею Сингулярности на пальцах.
1)ИИ может быть умнее человека или равным ему.
2)Мы можем запустить практически любое соотношение времени между ИИ и реальностью. Например для ИИ пройдет год, а для нас 1 секунда.
3)Мы приказываем ИИ написать свой же код, но лучше. Улучши себя.
4)Улучшенный ИИ запускаем с тем же приказом и так по кругу. Пока не упрёмся в границы мироздания.
Границы могут быть как совсем маленькими. И может оказаться что разум людей это кепка для всей вселенной и лучше разум создать невозможно. А может быть радикально выше, тогда получим непозноваймый сверхразум который молненосно возьмёт под контроль всё и сделает всё что захочет.Cerberuser
21.06.2024 15:19+3Мы приказываем ИИ написать свой же код, но лучше.
...и упираемся в тот факт, что это "лучше" по определению субъективно, а значит, а) не превзойдёт доступного человеку, б) для какой-то части человечества будет не улучшением, а деградацией.
BlackMokona
21.06.2024 15:191)Сейчас есть огромное количество тестов для ИИ, которые крайне бурно совершенствуются и выступают в качестве объективных показателей качества. Именно их можно будет засунуть в модель для тестов и проверок.
2)Если вырастут все тесты, то всем понравится.N-Cube
21.06.2024 15:19+3Объективных тестов даже для человеческого интеллекта не существует, более того, все больше исследований утверждают, что интеллект слонов или осьминогов ничуть не хуже интеллекта человека.
N-Cube
21.06.2024 15:19+2Вы не понимаете - Вселенная бесконечна, значит, если в ней не существуют сверхцивилизации и сверхразум, вероятность их существования бесконечно мала или нулевая (вы можете попробовать доказать, что существуют, хотя мы их не видим - пока этого доказать никому не удалось, но псевдонаучных обсуждений и просто спекуляций на тему много). И раз уж за десятки миллиардов лет жизни Вселенной этого не произошло в миллиардах миров, все обсуждения про опасность создания сверхразума человеческой цивилизацией в ближайшие дни или годы сродни бреду наркомана.
Мы приказываем ИИ написать свой же код, но лучше. Улучши себя.
Вы сейчас говорите, как худшая разновидность менеджера - главное, дать команду, а возможность ее выполнения не имеет значения. Можете еще на дождь покамлать, с тем же успехом.
Alexey2005
21.06.2024 15:19+1Вот только Вселенная (по крайней мере наблюдаемая часть) однородна: все эволюционные процессы происходят практически синхронно в каждом её уголке.
Она на всём своём протяжении разом перешла от состояния плазмы к холодной материи. Одновременно во всём её объёме началось звездообразование. Синхронно стартовало накопление тяжёлых элементов. Синхронно началась эпоха квазаров - и так же повсюду она закончилась.
Логично предположить, что и разум образовался одновременно, т.е. все цивилизации на всём протяжении Вселенной находятся примерно на нашем уровне развития.
Sekekekeke
21.06.2024 15:19+1Не будет никакой сингулярности, так как майнинг знаний нелинеен по ресурсам. reinforecement learning уже уперся в тупик на задаче вставания робота
alex50555
21.06.2024 15:19Есть конечно, reinforcement learning, это как-раз про самообучение.
Но вообще он имеет ввиду понятие технологической сингулярности, которая может произойти в будущем. Это утверждение, что когда мы создадим самообучающийся сильный ИИ, по разуму равный человеческому, то он начнёт саморазваться бешенными темпами и превратиться в сверхразум, который мы перестанем понимать и не сможем контролировать.
Тут подробнее можно почитать:
https://ru.m.wikipedia.org/wiki/%D0%A2%D0%B5%D1%85%D0%BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%81%D0%B8%D0%BD%D0%B3%D1%83%D0%BB%D1%8F%D1%80%D0%BD%D0%BE%D1%81%D1%82%D1%8C
APXEOLOG
21.06.2024 15:19+38Автор выразил свое мнение с позиции дата-сайентиста. Я выскажу свое мнение с позиции прикладного софтверного инженера с довольно обширным практическим опытом применения GenAI в бизнес-продуктах.
Для контекста, я работаю в компании, которая сделала очень сильную ставку на GenAI. Настолько сильную, что например, у нас долгое время был AI-Friday - один оплачиваемый день работы был отведен для всяких исследований, экспериментов и внутренних разработок с использованием GenAI. За последний год я сделал 2 продукта целиком основанных на GenAI, и внедрил GenAI-фичи в еще несколько.
Я считаю, что на данный момент AI сильно перехайплен
Особенно в части "он нас всех заменит" и "он скоро сам себя осознает и начнет сам себя улучшать".
Это все активно раздувается заинтересованными стронами (особенно вендорами LLMок), потому что они делают на этом огромные деньги. Это та же самая ситуация, которая была с VR, AR, Blockchain'ом и всем остальным хайпом который всплывает примерно раз в 3-4 года. Тем не менее, главное отличие GenAI в том, что этот инструмент не требует создания отдельной инфраструктуры с нуля, его можно внедрить в любой существующий проект.
GenAI - это инструмент
Инструмент в первую очередь обработки натурального текста, и во вторую - его генерации (конечно и не только текста, но я сконцентрируюсь именно на текстовых LLM). И относиться к нему нужно соответсвенно - понимать плюсы и минусы, как и где применять (а где - нет). Для меня, как для прикладного программиста, не существовало раньше такой легкой возможности обрабатывать натуральный текст. Например, понять, что "Я хочу купить сигейт винт на два тб" и "Заказывю жесткий диск SEAGATE ST2000DM008" относятся к одному и тому же товару - попробуйте решить эту задачу без LLM (с поддержкой опечаток, сленга, и сотни языков из коробки). Я думаю это можно сделать и без LLM, но это будет намного сложнее, чем просто вызвать API с простеньким промптом.
Генерация текста в принцие не уверен, что раньше была возможна на таком уровне.Сократить текст, оставив только самые основные факты. Сгенерировать нормальное человеческое описание из десятка полей в БД. Создать ответ на сообщение, и т.д.
Реальное применение в бизнесе
В целом, если в продукте кто-то работает с текстом произвольного формата, то это первая точка применения LLM. Самый очевидный пример - техподдержка пользователей. Коллеги добавили LLM в продукт для техподдержки. На основе истории вопросов/ответов и существующей базы знаний, LLM генерировала потенциальный ответ на вопрос. Конечно эффективность напрямую зависела от качества базы знаний и исторических данных, но были клиенты, для которых система генерировала хороший ответ в 20% случаев - оператору оставалось только нажать кнопочку "отправить". Хороший это показатель или нет - зависит от соотношения стоимости LLM и стоимости оператора техподдержки. Но в целом как по мне - вполне неплохой результат для нескольких недель работы пары человек.
Другой пример - один из этапов системы тестирования. В частности, кандидатов просили ответить текстом (в свободной форме) на несколько вопросов и затем LLM анализировала ответы на основе определенных правил, и отсеивала тех, кто вообще ничего по теме не смог написать. Отсеивалось что-то в районе 30% кандидатов, и это было дешевле, чем отсеивать их на следующих этапах.
Использование LLM в повседневной работе
Во-первых, сразу скажу что "AI заменит программистов" - это на данный момент с текущим уровнем LLM невозможно. Мы в команде искренне пытались это сделать, но результаты заставляют желать лучшего. Это подтверждается и тем фактом, что никто до сих пор не предложил рабочей "замены". Есть проекты, которые обещают, но это просто доение инвесторов. Причем я сомневаюсь, что проблема решится просто увеличением размера датасета для тренировки (т.е. GPT5/6/7 и т.д.). Специализированные модели могут иметь успех, но проблема в том, что они обучаются на коде, т.е. они обучаются как писать - но они не обучаются почему надо писать именно так. Не существует в природе десятитомников "Мои 15 лет опыта в разработке ПО - обьяснение почему я пишу эту конкретную строчку кода именно так".
Тем не менее, я нашел для себя несколько сценариев, в которых LLM действительно показывает неплоохие результаты:
Генерация тестов. Если код не слишком уж заумный (а он по-хорошему должен быть максимально простым), то LLM сгенерит неплохой тест под запрошенный сценарий. Конечно, скорее всего придется подправить, добавить ассертов, но примерно 80% кода будет правильным, включая моки. Если заморочиться с промтом или иметь пример, то вообще отлично выйдет.
Всякого рода простой рефакторинг, который не сделает IDE. Например вот недавно я мигрировал проект с AWS SDK v2 на AWS SDK v3 и там LLM отработала замечательно.
Работа в областях, где нет экспертизы. Не так давно мне потребовалось провести анализ данных, чтобы выявить корелляции. К сожалению, об этой области я не знаю ничего. Можно было бы конечно потратить недельку на погружение в тематику, но к счастью я просто попробовал парочку GPT ассистентов на данную тематику и они замечательно справились с задачей (от всей души спасибо дата саентистам, которые написали миллионы питоно кода, который натренировал GPT). Или когда мне нужно что-то подправить в коде на ЯП, с которым я не работал уже лет 15 - быстрее заказать изменение GPT (ну или хотя бы просто спросить варианты), чем идти в гугл.
squaremirrow
21.06.2024 15:19+3Причем я сомневаюсь, что проблема решится просто увеличением размера датасета для тренировки (т.е. GPT5/6/7 и т.д.).
Пока что это правило работает, и нет никаких оснований полагать, что тренд не продолжится. Более того, тысячи исследователей по всему миру прямо сейчас пытаются обучать следующие версии моделей на синтетических данных, сгенерированных текущими сетями.
Специализированные модели могут иметь успех, но проблема в том, что они обучаются на коде, т.е. они обучаются как писать
Нет, все "специализированные" модели все равно начинают с пре-трейна на обширных пластах интернета. Иначе модель просто не научилась бы писать связный текст.
lazy_val
21.06.2024 15:19+3тысячи исследователей по всему миру прямо сейчас пытаются обучать следующие версии моделей на синтетических данных, сгенерированных текущими сетями
А если текущая сеть сгенерила дичь (наподобие добавления клея в сыр) - чему обучатся следующие версии? Или нужен man-in-the-middle который эту дичь будет отсекать?
PrinceKorwin
21.06.2024 15:19+1А если текущая сеть сгенерила дичь (наподобие добавления клея в сыр)
А почему, блин, это считается дичью? Ее попросили предложить способ чтобы сфотографировать пиццу с сыром так, чтобы сыр выглядил красиво.
Вполне норм вариант ИИ предложил. Вы не представляете на какие ухищрения иногда идут фуд фотографы.
P-47
21.06.2024 15:19+1Правильно Вас заминусили, ну такую дичь принять за норму это "высший пилотаж", иных слов объяснению этой ДИЧИ нет.
Xexa
21.06.2024 15:19+5Есть статьи и видео на ютюбе о создании красивых картинок еды для рекламы.
Советую глянуть. Там вполне очевидно и ясно показывают, что картинки созданные из "натурального" не обладают красотой и аппетитностью. Потому используют то, что "дичью" кто-то считает. Считает, но с удовольствием смотрит на картинки не понимая что это "дичь"
aveltmp
21.06.2024 15:19+1Из "реклама и шизнь"
"
На этом форуме, именитый дизайнер А* Л* рассказывал сколько труда, интеллекта и любви к компьютерной технике эпл было вложено в рекламный постер пива. Из зала взял микрофон совсем неименитый дизайнер: "Ваш постер - гно и все это видят. Когда я рекламирую пиво - его хотят попробовать даже маленькие дети. Я беру блендер, наливаю в него пиво пополам с собачьей мочой, сыплю столовую ложку стирального порошка Т, чайную ложку соли и взбиваю. Результат превосходен потому что я знаю, что создаю иллюзию. Я не ограничен нормами морали и требований эстетики. Заказчики видят как хорошо это работает и идут ко мне. А вам чтобы продать свой "шедевр" приходится публично расхваливать свои результаты, объясняя как трудно это было сделать. Потребителю не нужна в рекламе блеклая натуральность поэтессы в полнолуние. Людям нужны яркие краски и эмоции. Моча из блендера и большие потные сиськи это наше всё."
"
riv9231
21.06.2024 15:19+1Я не адепт утверждений что ИИ всех заменит. Вы сначала сделайте, а потом посмотрим, насколько ваш ИИ на самом деле будет способен кого-то заменить.
Но с другой стороны, от больших нейросетей, я уже давно не видел немотивированной дичи. Так что в эту сторону тоже не надо передёргивать. Предпринимаемые усилия явно дают свой результат.
Прямо сейчас я в режиме диалога создают шедевральный скрипт резервного копирования и я понимаю, что если попрошу переписать обработку массивов снимков с bash на SQL то через минуту получу результат, а потом я выберу что быстрее, удобнее, нагляднее и вообще мне больше нравится.
Не знаю о чем тут спорить: автор прав, в целом да, хайп раздут и полно инфоциган. Но прогресс идёт - идёт и это приносит свои плоды.
Кстати, насчет дичи, реально рекламные фотографы делают картинки как правило из несъедобных ингредиентов, так что в данном конкретном случае llm правильно все сделала, а вы не поняли этого. И я уже несколько раз в своей практике сталкивался с на первый взгляд обескураживающими ответами, а потом разберешься, оказывается все правильно было!
invelusion
21.06.2024 15:19потому-что это https://www.theguardian.com/world/2023/aug/10/pak-n-save-savey-meal-bot-ai-app-malfunction-recipes
и это только один из множества подобныйх приложении, а теперь предствте что новые сети учитывают эту информацию для генерации ответов
squaremirrow
21.06.2024 15:19Если сеть сгенерировала дичь - то скорее всего эта же самая сеть может эту дичь распознать и забраковать. Поэтому там не man-in-the-middle, а llm-in-the-middle.
С текстами да, может быть тяжело. Но все что касается задач, которые допускают независимую автоматическую оценку ответа - например написание кода - для такого процесс сбора новой обучающей выборки может быть полностью автоматизирован.
Топик‑стратер сам говорит, что «LLM сгенерит неплохой тест под запрошенный сценарий» — а значит никто не мешает запустить пайплайн типа «формулировка вопроса → реализация в коде → тест кода тестами, написанными LLM». И здесь даже не надо пытаться как‑то исправить код, если тесты проваливаются — достаточно просто сгенерировать миллиарды таких примеров и выбрать из них те, что прошли все проверки.
lazy_val
21.06.2024 15:19Если сеть сгенерировала дичь - то скорее всего эта же самая сеть может эту дичь распознать и забраковать
Пока любую дичь от разных LLM распознают и добавляют в массив обучающих данных люди, которые эту LLM разрабатывают, поддерживают и обучают.
Если есть обратные примеры - пожалуйста приведите или дайте ссылки
lamerok
21.06.2024 15:19+10Да, тоже использую нейросети, чтобы, к примеру, написать деловое письмо, потому что у самого получается не очень. Но мне кажется, тут ест риски.
Можно было бы конечно потратить недельку на погружение в тематику, но к счастью я просто попробовал парочку GPT ассистентов на данную тематику и они замечательно справились с задачей
Первое в чем тут вопрос, если я не разбираюсь в теме, то как понять, что ИИ справился "замечательно" ? С точки зрения меня, как дилетант, может оно и так, но верно ли это с точки зрения науки? Кто в данном случае проверит?
Если люди начнут злоупотреблять этим, то в конечном итоге потеряют навыки и знания по этой теме, и будет все труднее изобретать что то новое. А нет нового, ИИ будет обучаться на своих же ответах, что из этого выйдет, а фиг его знает.
-
Про остальное, например код, тоже самое, ИИ даёт стандартный подход к стандартной задаче, мир может превратиться в однообразный и безальтернативный. С одной стороны это хорошо, меньше времени на выбор, с другой, такое уже проходили, оно как то не очень зашло.
Возможно, я конечно сгущаю тучи и окажусь не прав.
APXEOLOG
21.06.2024 15:19+2Первое в чем тут вопрос, если я не разбираюсь в теме, то как понять, что ИИ справился "замечательно" ? С точки зрения меня, как дилетант, может оно и так, но верно ли это с точки зрения науки? Кто в данном случае проверит?
Да, это абсолютно верный вопрос. Я по итогу перепроверил результат на другой LLM. Шанс, что и она тоже ответил неправильно тоже довольно высок, но совокупность проверок и адекватности обьяснения вычислений дала мне достаточную уверенность.
Если люди начнут злоупотреблять этим, то в конечном итоге потеряют навыки и знания по этой теме, и будет все труднее изобретать что то новое. А нет нового, ИИ будет обучаться на своих же ответах, что из этого выйдет, а фиг его знает.
Это как раз та причина, по которой я не использую LLM для решения нетривиальных задач в моей области экспертизы. Мне важно прокачивать свои скиллы, поэтому LLM выступает как некий джун, которому я поручаю рутинную работу, которую мне просто лень делать.
lazy_val
21.06.2024 15:19я просто попробовал парочку GPT ассистентов на данную тематику и они замечательно справились с задачей
быстро != замечательно
Как проверить правильность и осмысленность предложенного результата если
об этой области я не знаю ничего
nine13
Наконец-то кто-то про это сказал. Напоминает одержимостью блокчейном лет 5 назад.
poige
Просто в блокчейне на.баловоёмкос™ь ниже. ;)
И, чтобы два раза не… это никакой блин не AI. Это можно было бы точнее называть QI (quasi-), но хайп снимать было бы сложнее.
brownfox
В русском языке проще: современный нейросетевой ИИ - это Имитационный Интеллект :)
Разумеется, в нём нет никакого сознания, даже узкоспециализированного, это перевёрнутый перцептрон на стероидах в виде больших данных.
Bakoku
Нанотехнологии, цифровизация экономики - что там ещё из модных попильных тем было?
vasyakolobok77
Насчет нанотехнологий не скажу, но что именно вам смущает в цифровизации экономики?
Я лично вижу повальное внедрение ЭДО (бухгалтерия, кадры, управление предприятиями), вижу развитие ИС для общества (Госуслуги, Электронные медкарты, Электронные дневники).
Хайповые ли это темы? Возможно. Может ли в них быть место неправомерному использованию средств? Может, как и в любой другой сфере. Везде где есть люди есть место мошенничеству и воровству.
invelusion
Industy 4.0 и Industy 5.0 дикий хайп, учитывает что на многих заводох еще только где-то Industy 2.5
Astus
Неуловимый Web 3.0 и метавселенные.