К старту курса о машинном и глубоком обучении делимся подборкой новостей последних недель из мира ML о том, какой компромисс между желанием получить данные и высокой стоимостью МРТ нашли исследователи, об огромном ускорении расчётов в области материалов солнечных батарей, и о том, в каких случаях ИИ не нужны большие объёмы данных. Подробности и другие новости вы найдёте под катом.
Решение проблемы недостатка данных для ML в медицине
Учёные искали способы предсказать структуру дизайнерских запрещённых веществ, которые помогут медикам подготовиться к ситуации, когда употребляющие их люди появятся в отделениях неотложной помощи. Команда поняла, что приложение машинного обучения упростило бы работу; к сожалению, известно всего 1700 дизайнерских препаратов, которые можно было бы использовать для обучения такой системы. Не теряя надежды, исследователи задались вопросом, можно ли выяснить необходимое для работоспособности системы количество данных или можно ли изменить алгоритм и данные, чтобы уменьшить количество потребляемых данных.
Исследователи создали 8500 моделей и обучили каждую из них на наборах данных разного размера, взятых из 500 000 молекул в упрощённой системе молекулярного ввода. Модели прогнозировали возможные типы молекул. Было обнаружено, что многие модели вполне успешно работают с ограниченным набором данных, а также обнаружили тот факт, что предсказательная сила моделей убывает уже после 10 000–20 000 точек данных. Применив наиболее эффективные модели в исследовании дизайнерских запрещённых веществ, учёные получили правильные примерно в 50 % случаев результаты.
Расчёты в области материалов солнечных батарей сильно ускорились
«Поначалу это, конечно, не ясно интуитивно, но оказывается, что методы ML применимы в задачах, значительно отличающихся от распознавания образов или прогнозирования потребительских нужд», — рассказывает Марко Говони, соавтор исследования и помощник научного сотрудника отдела материаловедения Аргонна.
Технологии разработки преобразующих солнечную энергию материалов требуют понимания того, что происходит при поглощении солнечного света этими материалами и молекулами, и в этом помогает компьютерное зрение. Но моделировать материалы с несколькими типами структур, например границы разделов «твёрдое тело — вода», — это сложная задача.
Исследовательская группа из США из Аргоннской национальной лаборатории Министерства энергетики нашла способ упростить эту задачу. При помощи подхода на основе ML они упростили решение квантово-механических уравнений описания поглощения света твёрдым телом, жидкостью или молекулой. Результаты исследования опубликованы в журнале Chemical Sciences.
В чём хитрость? Признавая, что не все члены квантовомеханических уравнений должны вычисляться одинаково, некоторые выражения вычисляются — или усваиваются — из величин проще, это сильно ускоряет моделирование.
«Самым важным в нашей работе оказалось осознание того, что мы можем повторно задействовать информацию, полученную для данного твёрдого тела или жидкости, не повторяя расчётов для аналогичных систем. Мы придумали сокращающий расчёты протокол переработки», — рассказывает Сиджиа Донг, во время исследования постдокторант в Аргонне, а сейчас — доцент Северо-Восточного университета. Эти протоколы могут сэкономить часы и даже дни моделирования в высокопроизводительных вычислительных архитектурах. Фактически метод позволяет моделировать спектры поглощения сложных систем в 10–200 раз быстрее. Такие системы содержат границы разделов «твёрдое тело — жидкость», например между водой и фотоэлектродом (речь идёт о преобразующем солнечный свет в электричество материале).
«Исследование также дало представление о том, как улучшить основную теорию моделирования, — рассказывает Джулия Галли, старший научный сотрудник отдела материаловедения Аргонна и заместитель директора по стратегии Центра передовых материалов для систем «энергия — вода» (AMEWS) Аргонна. — Эффект от нашей работы оказался масштабнее ожиданий. Принятый нами основанный на данных подход указал новые пути изучения взаимодействия света и материи в ещё более реалистичных и более сложных системах, чем та, которую мы начали изучать».
Сегодня команда рассматривает возможность применения этих упрощений и протоколов переработки к проблемам структур электронов, связанным не только с поглощением света, но и с управлением им для квантового зондирования.
Реконструкция мозга на основе профиля пользователя
Исследователи из Японии предложили систему рекомендаций контента на основе сигналов мозга, полученных, например, с помощью магнитно-резонансной томографии, когда человек подвергается воздействию определённого контента, и, в конечном счёте, исследуя пользователей и контент, строит общую модель активности мозга.
«Получив «окончательную» модель мозга, мы сможем идеально оценить мозговую активность человека, подвергшегося воздействию определённого контента», — рассказывает придумавший эту идею профессор Рёичи Шинкума из Технологического института Шибаура, Япония.
Но снимки МРТ дороги, они предполагают расходы на развёртывание и обслуживание МРТ, оплату труда специалистов и большое число участников исследования. Столкнувшись с этой проблемой, проф. Шинкума и его команда придумали решение: для вывода модели мозга использовать информацию о профиле людей.
В новом исследовании «Человек и кибернетика: система», команда предлагает схему смягчения компромисса между производительностью, связанной с выводом модели мозга на основе информации о профиле, и стоимостью получения этой информации. «Наша схема задействует ML, чтобы смоделировать мозг по выводу модели профиля, — объясняет проф. Шинкума. — Чтобы снизить стоимость сбора информации, мы используем возможности ML по отбору признаков, сокращая этим количество пунктов анкеты, оценивая степень вклада каждого пункта в эффективность умозаключений».
Например, отбор признаков количественно оценивает вклад пункта анкеты баллом важности, сохраняя для вывода только пункты с наивысшими баллами, которые имеют наивысшие баллы важности. Так команда сохраняет высокую производительность умозаключений при одновременном ограничении информационных затрат. Чтобы подтвердить эффективность схемы, команда оценила точность её работы, используя модель мозга, полученную экспериментально, и модель, основанную на реальной информации о профиле. Они обнаружили, что схема достигла почти такого же уровня точности вывода модели мозга, как и в случае с использованием 209 анкет при помощи только 15–20 верхних элементов. Это позволило предположить, что для вывода модели мозга достаточно только 10 % лучших пунктов анкеты.
«Следующий важный шаг — определить комбинации ML и метода отбора признаков для оптимизации работы нашей схемы, — делится взволнованный профессор Шинкума, обдумывая будущие направления исследований их работы. — В то же время нам необходимо снизить общую стоимость вычислений для реальных приложений с большим количеством пользователей».
Искусственные нейросети, отражающие архитектуру мозга человека
Новое исследование показывает, что сети искусственного интеллекта, основанные на связях человеческого мозга, могут эффективно выполнять когнитивные задачи.
Изучив данные МРТ из крупного репозитория Open Science, исследователи реконструировали схему связей мозга и применили её к искусственной нейронной сети. Команда из The Neuro (Монреальский неврологический институт-больница) и Квебекского института искусственного интеллекта обучила ИНС выполнять когнитивное задание на запоминание и наблюдала за её работой. Это уникальный подход.
Предыдущие работы в коннектомике — изучении связей мозга — сосредоточены на описании организации мозга, они не рассматривают, как мозг функционирует и выполняет вычисления на самом деле.
Традиционные ИНС имеют произвольную структуру, эта структура не отражает реальные связи мозга.
Объединяя коннектомику мозга в построение архитектур ИНС, исследователи надеялись узнать, как связи мозга поддерживают когнитивные навыки, и вывести новые принципы проектирования искусственных нейросетей. Оказалось, что нейроморфные нейронные сети выполняют задачи когнитивной памяти гибче и эффективнее других эталонных архитектур. Нейроморфные нейронные сети смогли использовать одну и ту же базовую архитектуру для поддержки широкого спектра способностей к обучению в различных контекстах.
«Проект объединяет две энергичные и быстро развивающиеся научные дисциплины, — рассказывает Братислав Мишич, исследователь из The Neuro и главный автор статьи. — Нейронаука и искусственный интеллект имеют общие корни, но в последнее время они разошлись. Использование нейронных сетей поможет понять, как структура мозга поддерживает его работу. В свою очередь, использование эмпирических данных для создания нейронных сетей позволит выявить принципы проектирования лучшего ИИ. Два метода обогатят друг друга и наше понимание мозга».
Тестирование производительности беспилотников в виртуальной среде
Многие обученные на симуляторах беспилотники имеют ограниченные бортовые вычислительные возможности, поэтому, когда они применяются на реальных роботах, алгоритмы обучения с подкреплением медленнее выполняют прогнозы, что может замедлить БПЛА и уменьшить его отзывчивость, а это, в свою очередь, может повлиять на результат или привести к авариям и столкновениям.
Исследователи из Гарвардского университета и Google Research разработали Air Learning — симулятор с открытым исходным кодом и обучающую среду, где исследователи могут тренировать алгоритмы RL для навигации БПЛА.
«Для достижения истинной автономии в БПЛА необходимо рассмотреть аспекты на уровне системы, такие как выбор бортового компьютера, — рассказал TechXplore один из участвующих исследователей Шриватсан Кришнан. — Поэтому основной целью нашего исследования было предоставление фундаментальных блоков, позволяющих исследователям оценить эти алгоритмы автономии комплексно». В системе Air Learning агенты БПЛА могут подвергаться воздействию сложных навигационных ситуаций и научиться работать в них.
«Air Learning предоставляет фундамент разработки и целостной оценки алгоритмов автономии, — расссказывает Кришнан. — Она предоставляет совместимые с OpenAI генераторы среды, которые позволят исследователям тренировать несколько алгоритмов обучения с подкреплением и внедрять несколько политик на основе нейронных сетей».
«После разработки алгоритмов исследователи смогут использовать встроенное оборудование для подключения встроенного компьютера и оценить, как работает алгоритм автономности, как если бы он работал на реальном беспилотном летательном аппарате с этим бортовым компьютером». «Таким образом можно выявлять различные узкие места производительности на ранних этапах проектирования».
«Мы специально фокусируемся на БПЛА, но считаем, что используемые нами методологии применимы к другим автономным системам, например автомобилям. Учитывая, что бортовые компьютеры — мозг автономных систем, но отсутствует систематическая методология их проектирования. Для эффективного проектирования бортовых компьютеров нам сначала нужно выявить узкие места в производительности; Air Learning предоставляет базовые блоки для понимания узких мест в производительности».
По словам Кришнана при помощи AirLearning для поисков источинков света уже разработан крошечный и полностью автономный летательный аппарат, работающий на микроконтроллере.
А пока DataRobot за 300 миллионов долларов купила стартап, занятый разработкой инструментов внедрения ML в компании, вы можете присмотреться к нашему курсу о машинном и глубоком обучении, чтобы стать специалистом в этой востребованной, разноплановой сфере, или к флагманской специализации в области Data Science, а также к другим курсам, чтобы прокачаться или начать карьеру с нуля:
Data Science и Machine Learning
Python, веб-разработка
Мобильная разработка
Java и C#
От основ — в глубину
А также: