
Продолжаем рассказ о новых технологиях, как они меняют ландшафт киберугроз и как это влияет на бизнес и нас с вами. На очереди технология Edge AI.
Начиная с 2009–2010 годов в мире идет стремительное развитие интернета вещей (internet of things, IoT). Устройства IoT собирают данные и передают их для обработки и анализа в централизованные облачные системы. Однако по мере роста числа таких устройств стали появляться серьезные проблемы.
Во-первых, при большом количестве устройств, каждое из которых генерирует значительный объем данных — например, камер видеонаблюдения с постоянной записью в 4K, — возникает проблема ограниченной пропускной способности. Возникает необходимость в выделенном широкополосном канале. Во-вторых, передача данных от устройства к «облаку» сопровождается временными задержками, которые могут быть критически опасными для приложений в некоторых сферах. Кроме того, в некоторых условиях, например в сельской местности, интернет-соединение может быть медленным или нестабильным, что увеличивает время отклика. В-третьих, отправка данных в «облако» сопряжена с вопросами обеспечения конфиденциальности.
Эти вызовы привели к смене парадигмы обработки данных и стали стимулом для активного развития технологий периферийных вычислений (edge computing), суть которых заключается в обработке данных на конечных устройствах или на локальных серверах в непосредственной близости от источников генерации данных — без их передачи в «облако».
По оценкам компании IoT Analytics, в 2025 году в мире насчитывается более 20 миллиардов подключенных IoT-устройств, а к 2030 году их количество превысит 40 миллиардов. Ежедневно они генерируют большой объем данных, которые необходимо агрегировать и оперативно обрабатывать. Искусственный интеллект позволяет делать это с высокой скоростью и точностью.
Однако до 2019–2020 годов развитие ИИ в основном фокусировалось на ресурсоемких больших моделях, размещенных в «облаке» — на серверах компаний OpenAI, Google, AWS и других. С 2020 года началась технологическая конвергенция IoT, ИИ и периферийных вычислений. Так сформировалось новое направление — edge AI. Это искусственный интеллект, работающий на периферийных устройствах, как можно ближе к источнику генерации данных (смартфону, датчику, роботу и т. д.), без необходимости передавать их в «облако».
В этот же период активно начал развиваться и кластер технологий TinyML, ориентированный на внедрение ИИ-моделей в маломощные устройства (с энергопотреблением в десятки милливатт и менее), такие как микроконтроллеры. Они применяются в медицинских камерах-капсулах, умных слуховых аппаратах, инсулиновых помпах и многом другом.
Как уже упоминалось, edge-устройства могут генерировать большие объемы данных — например, видеопотоки и телеметрию. Даже если данные не передаются в «облако», существуют сценарии, когда они должны быстро поступать на edge-сервер для обработки или передаваться между устройствами, например в системе городского транспорта в мегаполисе. Для этого требуются технологии, обеспечивающие высокоскоростную и надежную передачу данных.
С этой задачей справляются сети 5G, обеспечивая скорость до 10 Гбит/с и стабильную связь в условиях высокой плотности устройств — в отличие от сотовых сетей предыдущих поколений и сетей Wi-Fi. Это особенно важно для производственных предприятий и умных городов: 5G поддерживает до миллиона устройств на 1 км², что невозможно, например, в LTE.
Дополнительно технология network slicing позволяет создавать виртуальные сети, настроенные под требования конкретных сервисов. Это гарантирует приоритет и пропускную способность для критически важных служб, таких как экстренное реагирование или транспортное управление.
Таким образом, по мере развития умных городов и индустрии 4.0 сочетание edge AI и 5G становится ключевым для сценариев, требующих принятия решений в реальном времени. Например, edge AI может обрабатывать данные с камер и лидаров прямо на борту беспилотного автомобиля, а 5G — обеспечивать связь «транспорт — транспорт» (V2V) и «транспорт — инфраструктура» (V2I), повышая безопасность на дороге.

Технологии edge AI: настоящее и будущее
Технологии edge AI условно можно разделить на две группы:
аппаратные — связаны с проектированием оборудования, способного обеспечивать высокую вычислительную производительность при жестких ограничениях по энергопотреблению;
программные — связаны с разработкой моделей ИИ, адаптированных для работы на устройствах с ограниченными ресурсами без существенного снижения точности.
Конструкции аппаратных решений, которые используются для развертывания edge AI, ориентированы на энергоэффективные ИИ-вычисления. В их числе ИИ-ускорители (нейропроцессоры, тензорные процессоры, процессоры компьютерного зрения), оптимизированные под ИИ микроконтроллеры, а также решения на базе микросхем ASIC и FPGA. Отдельную категорию составляют комплексные системы на кристалле (SoC), объединяющие графические процессоры и ИИ-ускорители на одном чипе.
Прогноз. Мы ожидаем, что в течение ближайших пяти лет технологической основой для нового поколения умных периферийных устройств станет RISC-V. Это процессорная архитектура и система команд, распространяемая под свободной лицензией. Она предлагает базовый набор команд с возможностью добавления собственных расширений. Благодаря своей открытости эта архитектура привлекательна как для стартапов, так и для крупных компаний, работающих с edge-решениями. Архитектура RISC-V позволяет создавать компактные ядра с ИИ-ускорителями, работающие с низким энергопотреблением, что критически важно для обработки данных на edge-устройствах.
Потребность в моделях, которые требуют меньше памяти и вычислительных ресурсов и способны работать в средах с ограниченными возможностями, привела к развитию компактных архитектур — легковесных сверточных нейронных сетей (lightweight CNN), таких как MobileNet, ShuffleNet, EfficientNet. В последние годы в задачах компьютерного зрения сверточные нейросети постепенно вытесняются архитектурой Vision Transformer (ViT). Для использования в edge AI на ее основе разрабатываются специализированные облегченные модели, например TinyViT, MobileVi и другие.
В области обработки естественного языка необходимость развертывания ИИ на низкоресурсных устройствах способствовала развитию малых языковых моделей (small languge models, SLM). Они создаются на базе своих больших аналогов с использованием различных методов сжатия: дистилляции знаний (knowledge distillation), квантизации (quantization), прореживания нейронов и связей (pruning), низкоранговой факторизации (low-rank factorization) и других техник. Сегодня к категории SLM обычно относят модели с числом параметров от 1 до 8 миллиардов. В 2023 году начался бум открытых (open source) SLM, появились модели LLaMA, Phi, Mistral и другие. Малые модели не используются в качестве инструментов общего назначения, однако могут успешно справляться с узкоспециализированными отраслевыми задачами.
Прогноз. Мы ожидаем, что в течение ближайших трех-пяти лет малые языковые модели будут активно внедряться в таких отраслях, как сельское хозяйство, промышленность, медицина и робототехника. При этом компании все чаще будут применять модульный подход: вместо одной универсальной большой модели станет использоваться набор специализированных SLM, каждая из которых решает узкую задачу. Такие модели смогут работать параллельно, обеспечивая более гибкое и эффективное выполнение прикладных задач.
С 2016–2017 годов активно развивается технология neural architecture search (NAS), предназначенная для автоматического проектирования эффективных нейронных сетей, в частности для периферийных вычислений. С помощью NAS-фреймворков можно подобрать оптимальные количество слоев, состав блоков и другие параметры модели с учетом заданных аппаратных ограничений.
Для развертывания облачных сервисов и модулей на edge-устройствах используются специализированные платформы, такие как Microsoft Azure IoT Edge, AWS IoT Greengrass и другие. Они позволяют анализировать данные локально на устройствах и периодически синхронизировать результаты с «облаком». Для обучения, оптимизации и развертывания моделей на различных периферийных устройствах используются специальные фреймворки, например LiteRT, PyTorch Mobile, ONNX Runtime.
Прогнозы
Мы ожидаем, что в течение ближайших пяти-семи лет на первый план в развитии edge AI выйдут нейроморфные вычисления — подход, при котором модели и устройства проектируются по аналогии с работой человеческого мозга. Биологические механизмы нейронной активности моделируются с помощью импульсных нейронных сетей (spiking neural networks, SNN), функционирующих на специализированных нейроморфных чипах.
Преимущества нейроморфных вычислительных систем в очень низком энергопотреблении и высокой скорости обработки информации. Например, чипы Loihi 2 от Intel и TrueNorth от IBM потребляют в 15–300 раз меньше электроэнергии по сравнению с традиционными чипами, обеспечивая при этом сопоставимую или даже более высокую производительность. Разработки в этой области ведутся и в России: компания «Мотив НТ» уже 10 лет занимается разработкой нейроморфного чипа AltAI, и к концу текущего года ожидается выпуск новой версии — AltAI-3.
В более отдаленной перспективе (10 и более лет) мы прогнозируем интеграцию нейроморфных и квантовых вычислений, а также их сопряжение с сетями связи шестого поколения (6G). В совокупности эти технологии могут вывести edge AI на качественно новый уровень развития.

Какое влияние тренд оказывает на бизнес
Синергия искусственного интеллекта и периферийных вычислений открывает новые возможности в различных отраслях — от транспорта и медицины до индустрии 4.0 и умных городов. Размер мирового рынка edge AI, по данным компании Precedence Research, в 2025 году составит 25,65 млрд долларов, а к 2034 году может достигнуть 143,06 млрд долларов при среднегодовом темпе роста 21,04%.
Ограниченная передача чувствительных данных в «облако» либо ее полное отсутствие уменьшает риск их компрометации. Если голосовые команды, данные распознавания лиц или показания промышленных датчиков не покидают устройств, это значительно сокращает поверхность атаки и вероятность утечки информации. Кроме того, локальная обработка информации позволяет сократить общий объем данных, передаваемых в облако, что снижает энергопотребление и нагрузку на сеть. И это лишь часть преимуществ, которые дает переход к интеллектуальной обработке данных непосредственно на периферийных устройствах. Ниже мы рассмотрим и другие ключевые выгоды такого подхода.
Надежность и доступность. В парадигме edge AI данные обрабатываются на устройстве, что обеспечивает устойчивую работу системы даже при сбоях или полной недоступности сетевого подключения. Кроме того, технологии edge AI позволяют использовать алгоритмы ИИ в местах с ограниченной или нестабильной связью, например в тропических лесах, на морских буровых платформах или в отдаленной сельской местности, где отсутствует интернет и слабо развита инфраструктура.
Пример. Портативный ультразвуковой сканер Butterfly iQ+ подключается к смартфону или планшету и выполняет УЗИ-сканирование с помощью одного универсального датчика. Используется медиками и спасателями в полевых условиях, включая гуманитарные миссии и чрезвычайные ситуации.
Обработка данных в реальном времени. Обработка информации на устройстве обеспечивает сверхбыстрое принятие решений — скорость, недостижимую при использовании исключительно облачных вычислений. Это особенно важно в таких отраслях, как здравоохранение и беспилотный транспорт, где задержки в миллисекунды могут существенно повлиять на ситуацию.
Пример. Решение NoTraffic для управления дорожным движением в реальном времени использует edge-сенсоры, установленные на светофорах. Система идентифицирует и отслеживает участников дорожного движения, фиксируя их скорость и направление при приближении к перекрестку, и адаптирует работу светофора в зависимости от текущей дорожной обстановки — вместо использования фиксированного расписания.
Предиктивная диагностика оборудования. Традиционная диагностика опирается на периодические ручные проверки, что нередко приводит к позднему выявлению проблем. Edge AI позволяет анализировать данные от оборудования локально и в режиме реального времени, выявляя ранние признаки неисправностей. Это помогает минимизировать сбои, предотвратить дорогостоящие поломки и потенциальные угрозы человеческой жизни, а также продлевает срок службы оборудования или транспортных средств. Таким образом, edge AI становится ключевым компонентом в реализации концепции индустрии 4.0.
Пример. Платформа Siemens Industrial Edge для запуска аналитики, ИИ и цифровых приложений непосредственно на производственном оборудовании предоставляет возможность развертывать кастомные модели для прогнозирования отказов, отклонений и износа компонентов.
Важно отметить, что несмотря на описанные выше преимущества, которые edge AI дает бизнесу, внедрение и использование этих технологий сопряжено с рядом технических трудностей. Прежде всего, речь идет о проблеме совместимости и необходимости стандартизации. Периферийные устройства сильно различаются по аппаратной архитектуре, операционным системам и вычислительным возможностям. В результате одна и та же модель ИИ может работать по-разному на разных устройствах или вовсе не запускаться. Чтобы этого избежать, необходима унификация моделей, коммуникационных протоколов и интерфейсов взаимодействия. Кроме того, критически важно обеспечивать своевременное обновление и переобучение моделей. Без регулярной актуализации на новых данных модели теряют точность, что может привести к неправильным решениям, дорогостоящим ошибкам и потенциально опасным ситуациям. Это особенно актуально для промышленного IoT, где даже незначительные сбои могут нарушить работу целых производственных линий.
Как тренд расширяет ландшафт киберугроз
Переход к edge AI требует переосмысления подходов к обеспечению кибербезопасности. Поскольку системы edge AI генерируют большие объемы данных, включая конфиденциальную информацию, их защита от несанкционированного доступа выходит на первый план.
Все киберугрозы, актуальные для edge AI, можно разделить на три уровня.
Уровень устройств. Этот уровень включает уязвимости, которые возникают в прошивке, памяти, физических интерфейсах, сетевых службах и других элементах умного устройства. Злоумышленники могут воспользоваться небезопасными параметрами по умолчанию, устаревшими компонентами, уязвимостями в используемых open-source-библиотеках и небезопасными механизмами обновления прошивки. Кроме того, становится актуальной угроза клонирования устройства с целью извлечения обратной инженерии встроенной модели ИИ.
Уровень сети. В edge AI выделяют три основных вида сетевых коммуникаций:
device-to-edge: передача данных с устройства на ближайший локальный сервер для обработки ИИ-моделью;
edge-to-cloud: передача результатов локальной обработки данных в «облако» для архивирования, глубокой аналитики, агрегирования или визуализации;
edge-to-edge: обмен данными между устройствами для скоординированной работы или при функционировании в изолированных сетях.
Все эти виды сетевых взаимодействий делают edge AI уязвимым для классических сетевых атак, например для DDoS-атак, спуфинга и атак типа «человек посередине». Для создания безопасных каналов связи следует использовать протоколы защищенной передачи данных, такие как SSL и TLS, и технологию VPN. Необходимо обеспечить аутентификацию и авторизацию устройств, чтобы исключить несанкционированный доступ к API, данным или моделям. Дополнительно рекомендуется реализовать сегментацию сети и проводить регулярный анализ сетевого трафика на предмет аномалий.
Уровень моделей ИИ. Здесь идет речь об атаках на модели: атаки с подменой входных данных (adversarial attacks), атаки с отравлением (model poisoning) и другие.
Тренд на развитие и внедрение edge AI в организациях различных отраслей становится катализатором для развития методов и алгоритмов защиты данных, которые позволят обеспечить баланс между конфиденциальностью, производительностью моделей и эффективностью вычислений. Для защиты обрабатываемой информации в edge AI применяется ряд современных технологий, включая конфиденциальные вычисления, гомоморфное шифрование, федеративное обучение и другие.
Конфиденциальные вычисления (confidential computing). Перед обработкой алгоритмами ИИ зашифрованные данные должны быть расшифрованы в памяти устройства. Это создает угрозу несанкционированного дампа памяти. Защититься от нее позволяет технология конфиденциальных вычислений. Данные обрабатываются в специальной аппаратной доверенной среде выполнения (trusted execution environment, TEE) — изолированной области внутри процессора, которая защищена от доступа со стороны других процессов и операционной системы.
Гомоморфное шифрование (homomorphic encryption). Позволяет выполнять вычисления непосредственно над зашифрованными данными без их расшифрования. Это обеспечивает защиту конфиденциальной информации даже при обработке на уязвимых и слабо защищенных устройствах. Метод позволяет обрабатывать зашифрованные данные в реальном времени без ущерба для производительности, что делает его подходящим для приложений в беспилотном транспорте, системах видеонаблюдения, финансовой отрасли, медицине.
Федеративное обучение (federated learning). Это способ обучения моделей на данных, распределенных по разным устройствам, без необходимости передачи самих данных на центральный сервер. На каждом устройстве обучается локальная модель, после чего на центральный сервер передаются только обновленные после обучения параметры модели. Здесь они агрегируются вместе с параметрами, полученными от других участвующих в обучении устройств. В итоге формируется глобальная модель, обученная на данных со всего парка устройств.
При внедрении технологий edge AI для решения бизнес-задач неминуемо возникают проблемы и трудности обеспечения кибербезопасности, в числе которых:
гетерогенность и распределенность инфраструктуры: из-за разнообразия производителей устройств, их типов и архитектур затруднено внедрение универсальных механизмов защиты, а также усложняются процессы обновлений безопасности;
недостаток телеметрии: в отличие от облачных решений, edge-устройства зачастую не обеспечивают достаточную видимость для специалистов по ИБ, что ограничивает возможности мониторинга угроз и своевременного реагирования на инциденты;
ограниченные ресурсы устройств: низкая вычислительная мощность, малый объем памяти и слабая пропускная способность устройств затрудняют реализацию эффективных защитных механизмов, например поведенческого анализа;
отсутствие полного контроля над процессом обучения: из-за распределенной природы федеративного обучения нет полного контроля над его процессом. Это создает новые векторы атак, включая возможность компрометации центрального сервера, агрегирующего параметры локальных моделей.
Важно подчеркнуть, что несмотря на существующие ограничения федеративного машинного обучения, именно этот подход открыл новые возможности для развития edge AI. Он позволяет организациям сотрудничать и использовать данные с собственных устройств для совместного повышения качества моделей, при этом сводя к минимуму риск утечки конфиденциальной информации. Например, банки могут совместно обучать модели для выявления мошеннических операций, не раскрывая детали транзакций своих клиентов. Аналогичным образом несколько медицинских учреждений могут обогащать общую диагностическую модель, не передавая персональные данные пациентов.
Прогнозы
Мы ожидаем, что в течение ближайших пяти-семи лет федеративное обучение станет ключевой технологией в приложениях, требующих локального обучения моделей непосредственно на устройствах. Этот прогноз соответствует оценкам, согласно которым рынок решений на основе федеративного обучения достигнет 300 млн долларов к 2030 году при среднегодовом темпе роста 12,7%. Особенно перспективной представляется интеграция федеративного обучения с блокчейн-технологиями. В такой архитектуре обновления моделей фиксируются в децентрализованном реестре, а их агрегация может выполняться с помощью смарт-контрактов. Это позволяет устранить ряд известных векторов атак на системы с федеративным обучением и повысить уровень доверия к процессу обучения. В более отдаленной перспективе (10 и более лет) возможно практическое использование квантового федеративного обучения, которое не только повысит уровень защищенности от кибератак, но и ускорит процесс обучения моделей за счет преимуществ квантовых вычислений.

Яна Авезова
Ведущий аналитик направления аналитических исследований Positive Technologies