Привет, это команда направления анализа данных Яндекс Практикума.
В этой статье мы расскажем немного об основах машинного обучения: покажем, как подобрать задачу для обучения и таким образом посмотреть на процесс через призму бизнеса. Материал будет полезен не только начинающим дата-сайентистам, но и руководителям, которые задумываются о внедрении машинного обучения в бизнес-процессы.
Статью помогли подготовить:
Сергей Комаров
Специалист по машинному обучению в компании «Ингосстрах» и старший ревьюер на курсе «Специалист по Data Science» в Яндекс Практикуме
Антон Моргунов
Инженер по машинному обучению в «Базис-Центре» и Curriculum Lead курса «Инженер по машинному обучению»
Перед тем как объяснить, где и как можно применять машинное обучение, коротко опишем основные понятия этой статьи: машинное обучение, обученная модель, алгоритм, накопленные данные, закономерность.
Что такое машинное обучение
Благодаря созданию и развитию искусственного интеллекта (ИИ) компьютер теперь может решать множество задач: прогнозировать колебания рынка, предлагать пользователю подходящие товары и фильмы, предсказывать кибератаки и фильтровать спам. Чтобы эти задачи можно было выполнить, специалисты обучают компьютер, то есть занимаются машинным обучением.
Машинное обучение (МО) — это создание алгоритмов, с помощью которых машина может обобщить какой-либо опыт и найти для известных случаев закономерности. Например, ИИ может научиться находить аномалии на снимках КТ или МРТ и определять, здоров ли пациент. По результату МО мы получаем модель, которую можно использовать для автоматизированного или полуавтоматизированного принятия решений.
Обученная модель — это своего рода компьютерная программа, отражающая искомую закономерность. С помощью такой модели можно применять найденную зависимость к новым частным случаям.
Пример:
Обученная модель может определить по истории поиска клиента, заинтересуется ли клиент рекламой компании. Компания «Авито» в 2015 году проводила соревнования по машинному обучению, где с помощью алгоритмов машинного обучения нужно было найти закономерности для пользователя между их историей поиска на сайте и реакцией на объявления с контекстной рекламой. Такую закономерность можно использовать, чтобы показывать рекламные объявления именно тем пользователям, которым эта реклама будет интересна. Это не только повышает эффективность самóй рекламы, но и улучшает опыт пользовательского взаимодействия с сервисом.
Итак, к машинному обучению прибегают, чтобы выявлять полезные закономерности. А для этого, в свою очередь, требуются алгоритмы обучения и накопленные данные об объекте наблюдения.
Суммируя, задача для машинного обучения всегда имеет три составляющие:
закономерность, которая существует в явном и неявном виде;
набор репрезентативных данных, внутри которых прослеживается закономерность;
алгоритмы (или модели), которые на основе данных выявляют закономерность.
Рассмотрим каждую из этих составляющих подробнее.
Как работать с закономерностью
Закономерностью мы будем называть некий набор признаков и их значений, на основании которых можно строить выводы. Признаки могут быть совершенно разными.
Пример:
Возраст человека — признак, который учитывается при расчёте стоимости страхового полиса. Значения этого признака могут с некоторым допущением варьироваться в диапазоне от 1 до 100. Закономерность, скрывающаяся в признаке возраста, может быть такая: чем старше страхующий, тем выше риск проблем со здоровьем.
Хорошо, когда закономерность несложная: её легко обнаружить или уже есть эксперты, которые могут её описать. Но порой встречаются трудности:
Закономерности вообще не существует.
Закономерность слишком сложная, чтобы её обобщить для практического применения. Исчерпывающе описать опыт не получается.
Закономерность меняется с течением времени.
Если закономерность меняется, нужно обновлять и модель с учётом актуального опыта. Например, если онлайн-магазин выходит на рынок другой страны, то новые покупатели могут иметь иные предпочтения и другое поведение. Но это не конец света! Актуализировать текущую закономерность можно в автоматическом режиме — это позволяет обновлять модели так часто, как это требуется.
В каких задачах можно находить закономерности с помощью МО
Есть два «кита» применения МО: прогнозирование процессов, чтобы сделать их более управляемыми и эффективными, и автоматизация рутинных действий. Прогнозировать можно что угодно: от спроса на конкретные товары и услуги до стоимости этих товаров и услуг. Рутинные операции, которые часто выполняются людьми, могут быть переданы компьютеру. Это быстрее и дешевле.
Вспомните ваш опыт, когда вы регистрировали свой паспорт или водительское удостоверение в новом приложении по каршерингу. Буквально за 5 минут после того, как вы сфотографировали свой документ, данные с него переносятся в систему и вам открывается доступ. Эту операцию с высокой долей вероятности выполняют технологии, а не люди.
Но машинное обучение не панацея. Бывают случаи, когда нельзя получить такой прогноз, который был бы полезен бизнесу. Накопленные данные не всегда достаточно подробные, а иногда их вообще никак не получить.
Пример:
Сейчас идёт большая дискуссия о том, можно ли данные о здоровье человека отдавать третьим лицам, будь то работодатель или банк, выдающий кредит. Ведь имея эти данные, компании могут увидеть риски, которые не были им доступны ранее. На основании них будут приниматься такие решения, которые могут не всегда быть в пользу соискателя работы или заёмщика.
Пользу от применения машинного обучения можно измерить в финансовом эффекте, который определяет важность и качественность предсказаний: сократятся ли затраты, вырастет ли прибыль.
Как собрать данные для поиска закономерностей
Данные для МО должны содержать достаточно подробную информацию об уже известных случаях. Если вы попытаетесь создать модель, которая сможет определить, пришло ли нормальное письмо или спам, то данные для обучения модели должны включать исчерпывающий набор и тех и других видов писем.
Сбор данных для решения задачи может занять время: нужно организовать сбор и хранение, проанализировать новую информацию, определить достаточность данных. Чтобы достичь хороших результатов при обучении моделей, могут потребоваться десятки тысяч примеров. Собрать эти данные непросто, но возможно. Иногда можно использовать готовые модели, обученные другими специалистами на собранных ими данных.
Достаточно популярный в профессиональной среде портал Hugging Face содержит более 200 тысяч предобученных моделей для самых разных задач. На Hugging Face вы можете в том числе протестировать готовые предобученные модели. Вы можете посмотреть, например, на результат работы модели toxic-bert. Эта модель определяет, насколько токсичен текст. Если вам нужно определить уровень негатива в комментариях к постам вашей компании, то вот оно, решение. Забирай и подключай =)
Работа с предобученными моделями касается чаще всего простых задач, связанных с автоматизацией. Для более сложных задач готовые модели можно модернизировать, дообучать. Как правило, при этом требуется меньше данных, чем если бы модель для решения задачи обучали с нуля.
Сами данные могут быть разными: тексты, изображения, видео, аудио, таблицы, даже рентгеновские снимки древних манускриптов. С последними связано соревнование с самыми большими на сегодняшний день призовыми деньгами на популярной платформе для соревнований по машинному обучению Kaggle. Да-да, создав качественную модель, вы получите очень достойный гонорар за свою работу. Машинное обучение, в принципе, хорошо оплачиваемая сфера.
Кстати, на Kaggle можно посмотреть, для решения каких реальных задач используют машинное обучение, какие соревнования организуют, и, проведя параллели, найти, где МО может быть полезно вам.
Иногда данные можно дополнительно обогатить информацией из внешних источников, что поможет в поиске закономерностей. Например, найти и скачать нужные изображения в Google Images или Яндекс Картинках. Но в таком случае понадобится обогатить соответствующим образом и те данные, которые вы будете передавать в готовую модель для предсказаний, наладить соответствующие процедуры. Иначе найденную закономерность просто не получится использовать.
Расскажем немного больше о том, какие типы данных можно использовать для поиска закономерностей.
Какие данные можно использовать для поиска закономерностей
Мы уже упомянули ранее, что данные могут быть совершенно разной природы: от таблиц и текстов до изображений и видео. Разберём подробнее принципы МО, которые применимы к любому типу данных, на примере таблиц или, как их ещё называют специалисты, табулированных данных.
Строка в таблице — упорядоченная числовая последовательность фиксированной длины. Почему фиксированной? Потому что количество столбцов в таблице конечное. Другими словами, для каждой строки (или записи в таблице) есть n-ное количество столбцов, характеризующее эту запись. Столбцы — это признаки, или фичи объекта, которому соответствует эта запись в данных, а само число — значение соответствующего признака.
Пример:
У компании появился новый клиент, который с течением времени оставил историю своих покупок и просмотров. Данные об истории этого клиента попадают в таблицу в виде новой строки, или записи. А что насчёт признаков? Признаки, которые описывают клиента и хранятся в таблице, могут быть следующие: локация, где находится пользователь, тип его устройства, просмотренные категории товаров, средняя стоимость покупки, частотность покупок. Информации может быть крайне много. Мы лишь дали ориентир, чтобы вы смогли лучше понять, что есть запись и признаки в табличных данных.
Математически записи об объектах можно рассмотреть как векторы в некотором пространстве. Модель машинного обучения часто не может принять эти векторы в том виде, в котором они находятся в таблице, поэтому их переводят в формат, подходящий для использования алгоритмов машинного обучения. Этот этап называется обработка и трансформация данных (data preprocessing/wrangling). Сравнительно сложная информация, такая как текст, может быть трансформирована различными способами, что даёт специалистам поле для экспериментов.
Когда речь идёт о прогнозировании, признак, предсказание которого предполагает задача, называется целевым признаком, или таргетом (target).
Пример:
Вы хотите предсказать, вернёт ли клиент банка заём. При этом у банка есть информация о займах по множеству клиентов и по тому, был ли возвращён заём. Используя историю клиента и актуальную информацию о нём, вы можете предположить с некоторой вероятностью, выплатит ли клиент долг. Вы подсказываете класс: будет или не будет возвращён заём.
Можно также построить модель, которая предскажет, какой процент от займа клиент вернёт банку, где 0% — не вернёт ничего, и 100% — вернёт полностью. Такого рода задачи называются задачей регрессии.
Когда модель обучена на данных, ей на вход подают набор известных, идентичных тем, что использовались при обучении. На выходе получают предсказание. Сначала это значение неизвестно, иначе предсказывать его было бы нецелесообразно.
Признаки же, наоборот, должны быть известны и доступны. Важно учитывать этот момент при выборе прогнозирующих признаков для обучения модели, оценивая, могут ли они быть определены на момент предсказания для новых частных случаев.
Как выбрать алгоритм для поиска закономерностей
Все задачи машинного обучения можно разделить на несколько типов и исходя из этого выбрать алгоритм для поиска закономерностей.
Обучение с учителем
Обучение с учителем — самый распространённый тип задач в МО. Связан с прогнозированием. Данные в таком случае содержат значения для признаков-предикторов, известных на момент предсказания, и соответствующие им значения целевого прогнозируемого признака (таргета). Другими словами, на этапе обучения модели уже есть исторический набор данных, где тот признак, который предсказывают, доступен.
Пример:
Предсказание возврата займа — задача для обучения с учителем. Вы уже знаете по каждому заёмщику, вернул ли он заём и, если не вернул, сколько именно не было возвращено.
Задачи из класса обучения с учителем делятся на две основные группы: задачи классификации (например, токсичность комментариев) и регрессии (например, заём в банке). Такие задачи уже упоминались выше.
Принципиальное различие между задачами регрессии и классификации заключается в природе предсказываемого признака — число или класс:
Если вы хотите предсказать какую-то количественную, измеряемую величину, например продолжительность поездки в такси, то решается задача регрессии. Посмотрите на задачу из соревнования New York City Taxi Trip Duration — там как раз предсказывали продолжительность поездки в такси.
Если предсказываемое значение нельзя количественно измерить, оно отражает принадлежность к той или иной группе, то такая задача относится к классификации. Пример такой задачи — Homesite Quote Conversion — предсказание покупки клиентом предлагаемого ему тарифа страхования недвижимости. Здесь предсказывается не измеримая величина, а принадлежность к одной из двух категорий: те, кто купили страховку по предлагаемому тарифу, и те, кто отказался от предложения.
Обучение без учителя
Машинное обучение можно использовать не только для предсказаний. Алгоритмы обучения без учителя не предсказывают значение какого-то из признаков, соответственно, здесь нет таргета и предикторов. Эти алгоритмы исследуют структуру данных, взаимосвязи между объектами. Как правило, обучение без учителя используется для аналитики или помогает решить задачи обучения с учителем.
Пример:
Кластеризация — объединение похожих записей в группы, или кластеры — выполняется с помощью алгоритмов обучения без учителя. Кластеризацию часто используют, чтобы группировать похожих между собой пользователей. Тогда клиентам из одного кластера можно будет показывать схожие скидки или рекомендации.
Пример:
Если требуется преобразовать имеющиеся признаки, то алгоритмы обучения без учителя могут трансформировать записи в таблице с данными так, что каждая запись будет представлена меньшим числом признаков (столбцов), но при этом информация не потеряется. Это поможет безопасно сжать данные, что, в свою очередь, экономит оперативную память компьютера при обучении моделей с учителем.
Благодаря методам понижения размерности, можно также визуализировать сложные многомерные данные. Так мог бы выглядеть набор данных для задачи с прогнозированием дефолта по банковскому займу.
Отдельно стоит выделить задачи обнаружения аномалий. Если нужно предсказать какое-то сравнительно редкое явление, например мошенничество в банке, может быть полезно использовать обучение без учителя, а именно алгоритмы детекции аномалий. Эти алгоритмы помогут обнаружить нетипичные объекты, выделяющиеся из общей структуры. На практике такие методы могут использоваться как самостоятельно, так и в комбинации с более распространёнными методами.
Обучение с подкреплением
Всё, о чём рассказывалось в статье ранее, относится главным образом к классическому машинному обучению. В отличие от классического машинного обучения, для обучения с подкреплением не используют входные данные в виде конечного количества пар «описание известного случая — соответствующее значение целевого признака».
Предполагается, что алгоритм, не имея доступа к информации о правильных и неправильных действиях, путём проб и ошибок итеративно взаимодействует с некоторой средой. Цель алгоритма — найти стратегию взаимодействия со средой, которая обеспечит алгоритму максимальный выигрыш (некоторый численный сигнал). При этом действия в среде определяют не только выигрыш, но и могут влиять на саму среду, изменять её.
Наглядный пример обучения с подкреплением рассматривается в этой статье, а погрузиться в теоретические аспекты можно в онлайн-учебнике по машинному обучению от ШАД. Обучение с подкреплением — обширная тема, которая позволяет решать непростые бизнес-задачи. Обычно к изучению обучения с подкреплением переходят тогда, когда уже хорошо усвоены алгоритмы обучения с учителем и без, ведь именно они покрывают наибольшую часть потребностей рынка.
Если вы хотите научиться работать с данными и алгоритмами машинного обучения для решения практических задач, то вы можете освоить новую профессию на курсе «Специалист по Data Science» от Яндекс Практикума.
Комментарии (22)
nikolz
17.08.2023 17:00-1Полагаю, что современные решения ИИ - это компиляторы нарезок из большой массы текстов или картинок из интернета. Успех связан лишь с наличием интернета и вычислительными монстрами.
Успехи применения ИИ в медицине или в прогнозировании рынков очень скромные и мало изменились за последние 50 лет.
Что не так?
Hardcoin
17.08.2023 17:00А ещё можно полагать, что земля плоская. Но зачем? Что ИИ может, а что нет и для каких целей используется - вполне наглядно видно, никакого грифа секретности на достижениях не стоит.
nikolz
17.08.2023 17:00-1Про Землю - это Вам виднее, я не специалист.
Я про ИИ в медицине и рынках. Пока не встретил результатов применения ИИ в этих областях лучше, чем 50 лет назад.
Можете дать ссылку на достигнутые результаты, для опровержения мною сказанного?
IamSVP
17.08.2023 17:00https://habr.com/ru/companies/iticapital/articles/330884/
https://habr.com/ru/companies/first/articles/682516/
в медицине и рынков ИИ хватает. Некоторые задачи решаются быстрее и точнее чем человеком. Тут вопрос не в качестве алгоритмов, а в цене ошибки. В медицине это чел. жизни, на фондовом рынке большие деньги. ИИ нести ответственность не умеет
nikolz
17.08.2023 17:00Если внимательно прочитаете эти статьи то поймете, что это реклама либо результаты получены не в реальном времени, а путем подгонки на истории.
Вот конкретно из этих статей:
из 1 -ой ссылки:
" В марте (2017 год) исследовательская группа из университета Эрлангена-Нюрнберга в Германии разработала ряд алгоритмов, которые использовали архивные данные рынков.
Одна из моделей позволила добиться 73% возврата инвестиций ежегодно с 1992 по 2015 год с учетом транзакционных издержек. "
т е в 2017 году сделали алгоритм по данным истории до 2015 года. А где результаты на после данных истории.
Я на истории получаю результаты в 300 % годовых без реинвестирования. Но это не означает , что так будет в реальности.
------------------
читаем далее:
"Январское (2017 г) исследование Eurekahedge о 23 хедж-фондах, использующих искусственный интеллект, показало, что они демонстрируют намного лучшие результаты, чем те, что управляются людьми.
За последние шесть лет эти фонды добились годовой доходности в 8,44% по сравнению с обычными фондами, показатели которых составили от 1,62% до 2,62%. " Это круто?
2-я ссылка:
"Пациенты, лечение которых осуществлялось по PPD, выходили за пределы минимально необходимых дозировок реже и в течение более коротких периодов времени, чем контрольная группа под руководством терапевта, что позволяет предположить, что уравнение точнее предсказывает следующие дозы. "
Это круто?
Больше данных об успехах в медицине в этой статье нет.
Резюме: Ваши ссылки ничего конкретного про достижения ИИ на рынках и в медицине не содержат.
Можете привести ссылки с примерами конкретных практических применений ИИ на рынках и в медицине? С интересом прочитаю.
IamSVP
17.08.2023 17:00https://habr.com/ru/companies/ods/articles/548788/
https://habr.com/ru/companies/ods/articles/560312/
Вот применение на фондовом рынке
Из медицины лень штудировать весь интернет, я приводил ссылку, там указано что есть целые компании по применению ИИ
https://www.babylonhealth.com/en-gb/ai
как пример в медицине
Примеров практических применений много как видите
nikolz
17.08.2023 17:00"https://habr.com/ru/companies/ods/articles/548788/
https://habr.com/ru/companies/ods/articles/560312/
Это не примеры применения на рынке, а рассказ человека как он пытается что-то применить из того, что знает.
Я такие статьи писал на сайте 15 лет назад.
Где успешность ИИ на рынке, Карл?
--------------------------
Из медицины Вы цитируете рекламу, а не результаты серьезных разработок.
Я не верю в рекламу и пиар в интернете.
Вы хотя бы прочитали, свои ссылки сначала.
Вот что в них написано:
"Huiying Medical, компания по производству медицинского оборудования, базирующаяся в Хуэйчжоу, Китай, утверждает, что разработала решение для визуализации с помощью искусственного интеллекта, которое использует компьютерную томографию грудной клетки для выявления присутствия COVID-19. Компания утверждает, что он может быть полезен в регионах мира, где нет доступа к полимеразной цепной реакции с обратной транскрипцией (RT-PCR), стандартному методу тестирования на COVID-19."
Ну и где здесь успехи ИИ, Карл?
---------------------
Если есть желание узнать об успехах ИИ в медицине,
то читайте , например, здесь:
https://www.mdpi.com/journal/diagnostics/sections/artificial_Intelligence
javalin
17.08.2023 17:00https://health.google/health-research/
Где-то были исследования, ИИ в анализе различных снимков уже лучше среднего доктора. ИИ не подвержен человеческим усталости, раздражении, отвлечении. Он более комфортен в общении. И что не менее важно, он сильно дешевле и удобнее, чем запись к доктору.
Думаю при нашей жизни застанем полностью автоматизированные диагностические центры, с минимум персонала, который будет в основном обслуживающим.
nikolz
17.08.2023 17:00Выша ссылка это банальная реклама.
Результаты диагностики послеоперационного состояния на сердце с помощью систем распознавания известны уже более 50 лет назад. На хабре давал ссылку на книгу того времени под редакцией академика. Примерно в то же время в США вышел тематический сборник статей о применении ЭВМ в медицине, был переведен в СССР, читал его тогда.
Повторю, что новых достижений , кроме рекламы, пока не видел.
-----------------------
И еще...
Приведу пример из прошлой жизни.
В беседе с представителем Гражданской авиации (CCCP) предложил сделать автоматическую систему диагностики технического состояния двигателей самолета.
На что он мне ответил: Автоматическая система - это хорошо. но кто подпишет разрешение на полет?
------------------------
Аналогично: автоматический центр - это хорошо, но в эпоху страховой медицины, кто возьмет на себя ответственность за ошибку в диагнозе и смерть пациента в результате лечения?.
Hardcoin
17.08.2023 17:00А кто возьмет на себя ответственность за смерть клиента в результате поездки на беспилотном такси?
Hardcoin
17.08.2023 17:00Вы сказали, что ИИ - это компилятор нарезок. Это очень узкий взгляд. AlphaZero или Voice2med работают по другому принципу совершенно, но это тоже ИИ. Наличие интернета в этих случаях ни при чём. В этом ваша ошибка.
К тому же ИИ применяется далеко не только в медицине, но и в металлургии, например.
https://habr.com/ru/companies/nlmk/articles/706022/
nikolz
17.08.2023 17:00Вы не доказали , что мое мнение не верно, Вы его просто отвергли. Это Ваше право.
Ваша ссылка на внедрение STT -это не применение ИИ в медицине, а применение распознавание речи в бюрократии. Распознавание речи и текста - это две классических задачи на которых уже более 50 лет упражняются программы распознавания образов. И успех последних лет распознавания речи связан со вторым источником в моем высказывании - вычислительными монстрами, стоимостью сотни миллионов. Результат не намного превосходит результаты 20-летней давности.
----------------------
Я не спрашивал про металлургию ( я читал эту статью и там ИИ вообще не причем там обычная оптимизация и результат спорный ) .
-----------------
Я спросил конкретно то, что меня интересует, и на успехи ИИ в чем указано в статье, про рынки и медицину. Ссылки есть на доказательство успешности ИИ на рынках и в медицине ( а не в бюрократии) ?
Hardcoin
17.08.2023 17:00Вы не доказали , что мое мнение не верно, Вы его просто отвергли. Это Ваше право.
В смысле? AlphaZero - прямой опровергающий пример вашей фразы про нарезки. Я понял ваше требование про медицину, но вы согласны, что как минимум ваша фраза про нарезки неверна?
Результат не намного превосходит результаты 20-летней давности.
Очень странный взгляд. Результаты распознавания речи настолько невообразимо круче, что ваша фраза вызывает только недоумение. Вы пользовались вообще распознаванием двадцать лет назад?
а не в бюрократии
Это новое требование с вашей стороны. Распознавание специфичных медицинских терминов - крайне сложная задача (по меркам 20-летней давности). И это вполне медицинская сфера.
Тем не менее, прямое использование ИИ для постановки диагнозов в России уже есть (в других странах без сомнения тоже). Статьи с описаниями деталей я встречал, но быстро нагуглить не удалось, оставлю это вам, если тема интересна. Общая идея тут:
https://mosgorzdrav.ru/systema-podderzhki-prinyatiya-vrachebnikh-resheniy
на успехи ИИ в чем указано в статье, про рынки и медицину
Статья разве про рынки и медицину? Может мы разные статьи читали?
nikolz
17.08.2023 17:00Про AlphaZero...
Согласен, что неточно написал. Нарезки касаются нейросетей , которые отвечают на вопросы т е синтезируют правдоподобные ответы, например, GPT.
AlhhaZero - это игровая программа.
Вспомним программу игры в шахматы, которая разрабатывалась под руководством Ботвинника (читал в молодости его книгу).
Игровые программы используют накопленные базы данных и логические правила решений , т е это не нейронные сети, а скорее деревья решений.
Да и достижения этих программ в основном базируются на мощности железа.
Но это не ИИ. Попробуйте применить к ним тест Тьюринга.
-----------------
Про это:
https://mosgorzdrav.ru/systema-podderzhki-prinyatiya-vrachebnikh-resheniy
Т е про Систему поддержки принятия врачебных решений.
Это фактически справочно информационная система. Решение - это нарезка фраз из медицинских справочников и учебников. Т е именно то, что я написал.
Так как задача участкового врача сводится к выслушиванию жалоб и направлению согласно запомненным знаниям либо указаниям на прием с узкоспециализированному врачу , а тот направляет на анализы, то все это может делать и программа.
Но такие программы делали и 50 лет назад. Просто тогда вычислительная техника не была столь доступной.
Никаких успехов ИИ в этом нет.
Есть два уровня разработки технических решений. первый - экспериментальный, второй - коммерческий. Второй этап - это бум рекламы и баек о небывалых возможностях нового продукта.
Для программ машинного обучения наступил коммерческий этап.
-----------------
ИИ - это свойство программы создавать новые знания(изобретения) , а не компилировать правдоподобные фразы из справочников .
------------------
Еще добавлю о "щенячьем" восторге GPT писать программы.
Написание программ - это работа переводчика с одного языка на другой. Но вопрос не в том как перевести , а в том что переводим. т е при решении задачи есть два этапа которые решаются до написания программ. Это выбор метода решения и разработка алгоритма решения.
Программы типа GPT неспособны выбрать метод решения. Если я не прав, дайте ссылку.
Hardcoin
17.08.2023 17:00Игровые программы используют накопленные базы данных и логические правила решений , т е это не нейронные сети, а скорее деревья решений.
Вы не разбираетесь в теме, но при этом уверенно и настойчиво рассказываете, как якобы всё устроено. Не надо так делать. Это и выглядит не очень и бессмысленно. AlphaZero - нейронная сеть, это любой может проверить за минуту. Так зачем утверждать обратное? Какой стал смысл? Чего вы этим сможете достичь?
К тому же AlphaZero не использует накопленную базу данных и логические правила решений (если только не притягивать за уши, что сама нейронная сеть их накапливает). То есть полностью неверно. Зачем? Можно же вместо комментария потратить время и прочитать, ознакомиться.
Решение - это нарезка фраз из медицинских справочников и учебников.
Хорошо, что вы так быстро разобрались, как там всё устроено. Как с AlphaZero, да?
Но такие программы делали и 50 лет назад.
Не делали. Ну да ладно, вам нравится в это верить без доказательств.
Написание программ - это работа переводчика с одного языка на другой
Мы на техническом ресурсе. Здесь каждый второй - программист. Тут не прокатит сказать, что программист - это переводчик. Впрочем, переводы - это тоже одно из достижений ИИ. Оно наверняка тоже было 50 лет назад в параллельной вселенной, но в нашей качество автоматических переводов 20 лет назад не годилось вообще никуда.
nikolz
17.08.2023 17:00Я понимаю Ваш сарказм. Неужели вы полагаете, что я не смог прочитать в вики (Это же элементарно, Карл!)
AlphaZero — нейронная сеть, разработанная компанией DeepMind, которая использует обобщённый подход AlphaGo Zero.
Но Вы невнимательно читаете то, что я написал.
Я не знаю AlphaZero так хорошо как Вы, поэтому не рассказываю что там используют, а тем блоее, чего там не используют, как это делаете Вы.
Я говорил лишь о решениях и алгоритмах, которые традиционно использовали и 50 лет и 20 лет назад.
Например:
Deep Blue — шахматный суперкомпьютер[1][2], разработанный компанией IBM, который 11 мая 1997 года выиграл матч из 6 партий у чемпиона мира по шахматам Гарри Каспарова.
В процессе выбора хода ChipTest в основном использовал типовые методы поиска по шахматному дереву, применявшиеся в большинстве шахматных программ — минимаксный алгоритм поиска с альфа-бета-отсечениями и оценочную функцию, дававшую оценку конечным позициям. Аналогичный принцип работы впоследствии использовали Deep Thought и Deep Blue[1].
------------------
А теперь ответьте, чем нейронная сеть лучше решений на основе дерева решений.
Более того, алгоритмы на основе деревьев делали и 50 лет назад. Они не были так эффективны из банальной нехватки вычислительной мощности.
--------------
Вы не угадали, я действительно хорошо разбираюсь в нейронных сетях.
Более того, применял эти подходы в реальной жизни и изложил это в своей диссертации надцать лет назад. поэтому мне забавно читать о том, как хорошо известное 30 лет назад выдают за супер новое и даже за Искусственный Интеллект.
Но Я не пытаюсь Вас в чем-то убедить, я высказываю свое мнение на основе своего опыта и знаний.
------------
Примечание:
посмотрел исходники AlphaZero
И увидел там это:
"выполнил новый этап конвейера контролируемого обучения (чтобы использовать те файлы человеческих игр "PGN", которые мы можем найти в Интернете, в качестве генератора игровых данных). Этот шаг SL также использовался в первой и оригинальной версии AlphaGo, и, возможно, шахматы - это какая-то сложная игра, в которую мы должны предварительно обучить модель политики, прежде чем начинать процесс самостоятельной игры ."
Так что использовали базы данных при контролируемом обучении. Вы не угадали.
----------------
Прикольно, что все это делается на Tensorflow , которому уже лет десять. Новое лишь железо.
Hardcoin
17.08.2023 17:00Я говорил лишь о решениях и алгоритмах, которые традиционно использовали и 50 лет и 20 лет назад.
Возвращайтесь в настоящее. Тут много нового и интересного.
А теперь ответьте, чем нейронная сеть лучше решений на основе дерева решений.
С помощью них можно решить задачу, которую на дереве решений никто не решить не смог.
Они не были так эффективны из банальной нехватки вычислительной мощности.
Сейчас мощность есть. Где же реализации на основе дерева решений? Наверняка вы искали, но найти не смогли, не так ли?
Техническое объяснение, чем нейросеть лучше даже не требуется.
Вы не угадали, я действительно хорошо разбираюсь в нейронных сетях.
Ну явно же плохо. Это же ваш текст?
"AlhhaZero - это игровая программа. Игровые программы используют накопленные базы данных"
Более того, применял эти подходы в реальной жизни и изложил это в своей диссертации надцать лет назад
Вы можете продемонстрировать ваши знания, если хотите. Пока вы этого не сделали. Кандидатская проходная или значимая? Большинство достижений современного ИИ не из советов.
В любом случае, не хочется вас огорчать, но вы, кажется, катастрофически отстали от современной ситуации. Ещё раз повторюсь, 50 лет назад таких достижений не было. Некоторые идеи были заложены тогда, но только маленькая их часть. Те же многослойные сети зависят в первую очередь от алгоритмов, которым десять лет и только во вторую очередь от мощности. Без алгоритмов мощность не поможет.
nikolz
17.08.2023 17:00Очевидно либо я неправильно объяснил, либо Вы не поняли.
Деревья и сети существуют давно.
Решение на основе деревьев эффективнее, так как более компактное, но требует больше знаний у того, кто его проектирует. Нейронная сеть - это банальное произведение матриц и коррекция весовых коэффициентов методом обратного распространения ошибки. Изначально в 60-75 годы был бум сетей. примерно как сейчас. Но потом был тупик. В 80-х предложили метод обратного распространения ошибки и сети снова стали развиваться. Но был тупик с железом.
Сети сжирают много памяти и вычислительной мощности так как они изначально очень тупые и для обучения им надо очень много истории. Деревья изначально уже умные так как основаны на знаниях человечества.
Сейчас благодаря интернету и социальным сетям удалось собрать большую историю и появилось мощное железо. В результате для сетей появилась возможность снова начать бум. Их успех в том, что они не требуют для своего применения наличия знаний у применяющих. Недостаток знаний компенсируется мощностью железа.
Но это тупиковое направление будет развиваться потому, что требования к пользователю все больше деградируют.
-------------------
Но я изначально утверждаю лишь то, что достижения сетей сильно преувеличены и основаны (именно последние достижения ИИ) на базе данных интернета (чаты GPT). Достижения в области шахмат, медицины, рынков, т.е. там где помимо бла-бла нужны более глубокие знания области приложения, достижения сетей , называемых на две буквы ИИ мало превосходят алгоритмы 20 и 50 летней давности. А тем более, если те алгоритмы запустить на новом железе.
Да запустили станцию на Луну. А угадайте в каком году?
Hardcoin
17.08.2023 17:00Деревья и сети существуют давно.
Да. Ракеты тоже существуют давно. Процессоры тоже. Вы отрицаете прогресс в этой области?
Решение на основе деревьев эффективнее, так как более компактное,
В некоторых случаях, при условии, что его можно найти. Найдите решение для генерации картинок или распознавания речи, вместе посмеемся над качеством.
требует больше знаний у того, кто его проектирует
Звучит пафосно, но это бездоказательная ерунда. Сами поймёте, если попробуете подтвердить это чем-то.
банальное произведение матриц
Деревья - это банальный if. Вы представляете, сколько существует if? Старая технология.
Деревья изначально уже умные так как основаны на знаниях человечества.
Вы не знакомы с современными деревьями решений. Их не проектируют вручную, это невозможно. Более того, никто и деревья-то не использует, используют лес. Вместо комментариев почитайте современные достижения в этой области. Там на самом деле много отличных вещей, даже в деревьях.
они не требуют для своего применения наличия знаний у применяющих
Вы хотели сказать, у проектирующих? Попытка их унизить забавная, но бессмысленная. Сделайте что-нибудь, покажите. Это же не требует знаний.
тупиковое направление
Разве?
мало превосходят алгоритмы 20 и 50 летней давности
Вы это уже говорили, помните? Я привел опровержение, вы его проигнорировали, а теперь опять настаиваете. Зачем?
И напомните, в каком году запустили ровер на Марс?
nikolz
17.08.2023 17:00Приведите пример из своей практики.
Относительно TTS.
Пример для генерации речи festival(цепи Маркова). Мне удалось поместить его в SOC объем 2 МБ база 200 МБ на SD карте.
Сравните с TTS на нейросети объемом более ГБ.
Потом расскажите о сравнении.
--------------
По всем Вашим примерам я подробно объяснил свое мнение. Вы же не привели ни одного примера с доказательством превосходства решения на нейросети по сравнению с иными решениями.
Попробуйте обучить какую-нибудь сеть на своем ПК, посмеемся над результатом.
engin
17.08.2023 17:00Познавательная статья. Хочу поделиться своим опытом по работе с GPT.
Темой нашего стартапа был фоеймворк - кодогенератор программного обеспечения в сфере автоматика и робототехнические системы. Платформа - ядро скомпилировано на языке G c интерфейсной консолью визуального ввода инструкций, своего рода софт контроллер на базе ПК с внешнנм комплектом I/O.
Все инструкции сведены к минимуму операций и интуитивно понятны специалистам, не имеющим опыта в скрипт программировании.
Не так давно мы провели эксперимент с чат GPT. Мы внесли в него инструкции по работе с платформой, а так же дали описание принципов подключения драйверами нагрузок и сенсоров, после чего попросили его сгенерировать алгоритм действий разработчика по вводу инструкций на основе алгоритма управления вендинговой системой.
Мы были шокированы результатом. Прежде всего это было выполнено молниеносно, разработчику осталось только как троечнику в СССР перекатать шпаргалку и запустить симуляцию. Это нечто и можно посвятить целую статью.
GospodinKolhoznik
Это мне напоминает относительно распространенный диалог между любым студентом(аспирантом) и его научным руководителем:
-Дайте мне хорошую задачу.
-Молодой человек, но я же вам уже дал задачу.
-Но то плохая задача, она сложная и бесперспективная. Я её не могу решить и даже если я её и решу, это мне не даст ничего. Дайте мне такую задачу, чтобы я некоторое время над ней поработал, а потом решил её и чтобы она меня сделала знаменитым.
-Такой задачи у меня нет. Но даже если бы она у меня и была, я бы её вам не дал, я бы сам её решил и сам бы стал знаменитым.