Как использовать GPU для ускорения аналитической обработки данных / forpes.ru

Главная
Как использовать GPU для ускорения аналитической обработки данных

Как использовать GPU для ускорения аналитической обработки данных +1

12.10.2023 09:00

itglobalcom 2 946 Источник

Графические процессоры могут приносить огромную пользу организациям при условии, если специалисты четко понимают, как работают GPU и для каких задач они оптимально подходят. В этом материале Янник Подлесный, Стивен Симпсон и Хеннинг Соллер рассказали о трех шагах, которые помогут внедрить GPU в работу компании.

Особенности GPU

Центральные процессоры (CPU) десятилетиями были незаменимым инструментом для проведения сложных аналитических расчетов, но не так давно компании все чаще стали использовать в своей работе графические процессоры (GPU) — устройства, которые изначально были разработаны для ускорения рендеринга графики.

GPU, в отличие от CPU, проявляют себя наилучшим образом в векторных вычислениях, которые стали неотъемлемой частью современной науки о данных и, в частности, машинного обучения. Сейчас вычислительные ресурсы критически важны, если учитывать растущие объемы данных, увеличение доли неструктурированной информации и усложнение методов статистического анализа.

Например, процесс секвенирования генома, который раньше на CPU занимал несколько дней, на GPU выполняется всего за несколько минут благодаря возможности графических ускорителей параллельно обрабатывать данные. Более того, разнообразные отрасли могут извлечь пользу из GPU, ускоряя существующие процессы и открывая новые направления для исследований (см. Рисунок 1).

Как внедрить GPU

Использование графических процессоров не всегда ограничивается простой заменой CPU. Для компаний важно глубоко понимать технологию и осознанно выбирать сферы ее применения. Эффективное внедрение GPU в бизнес-процессы можно разделить на три этапа.

Оптимизация работы отдельных проектов.
Повышение производительности ИТ-инфраструктуры.
Инновации в сфере машинного обучения.

Рассмотрим каждый из этих шагов.

Оптимизация работы отдельных проектов

Графические процессоры наиболее эффективны в сложных многозадачных средах, где их способность к параллельной обработке может увеличить скорость работы в десятки раз. Однако компании также могут извлекать пользу из мощности GPU в рамках экспериментов по оптимизации работы отдельных разработчиков или конкретных проектов (см. Рисунок 2).

Организации активно ускоряют итеративные процессы в области машинного обучения, сокращая время цикла в 5–50 раз. Например, при выполнении высокоитеративных задач, таких как обучение моделей, GPU обеспечивают повышенную производительность, точность и скорость.

В качестве примера применения архитектуры на базе GPU можно привести прогнозирование распространения пандемий, таких как грипп. Графические процессоры позволяют масштабировать семантический анализ для качественного взаимодействия на естественном языке. Анализируя данные поисковых запросов, связанных с симптомами гриппа, система может сравнивать разные модели распространения болезни и выбирать наиболее подходящую. Такой подход требует массовой параллельной обработки.

Повышение производительности инфраструктуры

Современные озера данных, инструменты машинного обучения, среды для обучения и развертывания моделей обычно представляют собой смесь технологий разных поколений. Это может стать препятствием для общей производительности, особенно когда необходима высокая скорость обработки. Однако благодаря GPU компании могут хранить датасеты прямо в оперативной памяти графического ускорителя и предоставлять быстрый доступ к данным на всех этапах их обработки. Этот подход является ключевым для оптимизации всей инфраструктуры.

Руководители ИТ-департаментов могут пересмотреть текущую инфраструктуру организации, чтобы максимально использовать возможности GPU. Это позволит создать более согласованный конвейер обработки без ограничений устаревшей архитектуры бизнес-аналитики. В результате можно улучшить производительность за счет минимизации операций копирования данных между различными платформами. В идеале весь процесс обработки может проходить в рамках единой памяти GPU. Открытые исследовательские проекты могут служить примером такого подхода.

Инновации в сфере машинного обучения и Software 2.0

Глубокое обучение — один из ярких примеров использования графических процессоров. Этот раздел машинного обучения фокусируется на создании алгоритмов для формирования искусственных нейронных сетей, которые способны самостоятельно принимать решения без прямого участия человека. GPU отличаются своей масштабируемостью, универсальностью и возможностью многократного использования. Теперь их потенциал можно использовать для автоматической генерации кода на основе ключевых бизнес-показателей. Такой подход получил название Software 2.0.

Модели глубокого обучения чаще всего используют для обработки неструктурированных данных, которые составляют около 70% всей информации. Однако эти модели могут быть эффективными и при анализе структурированных данных, например, табличных. Главное препятствие для применения глубокого обучения к финансовой информации — это ее предварительная обработка: необходимо устранить пропуски, выявить искаженные данные и провести нормализацию. GPU могут оптимизировать этот процесс, особенно в таких областях, как розничная торговля и электронная коммерция.

Графические ускорители активно используют в машинном обучении для профилирования данных, анализа зависимостей, выводов и обеспечения конфиденциальности данных. Например, базовые операции группировки и агрегации данных на GPU могут выполняться в 426 раз быстрее, чем при их отсутствии.

Понимание текущего состояния ИТ-инфраструктуры и возможностей GPU — залог успеха

Руководителям ИТ-департаментов следует начать подготовительную работу с анализа текущего состояния и пропускной способности ИТ-инфраструктуры. Также стоит определить продукты и услуги, которые могут получить наибольшую выгоду от быстрого реагирования на сложные запросы или от усовершенствованных алгоритмов обработки данных. Приложения могут включать в себя все: от базовых запросов для сбора данных в финансовых отчетах до обработки и анонимизации огромных массивов информации.

ITGLOBAL.COM предоставляет облачные серверы с графическими видеокартами NVIDIA A800 на базе 2-х сокетного сервера vStack-R и дисковой подсистемы на Hi-End СХД NetApp. Подробнее узнайте на нашем сайте.

Комментарии (2)

akakoychenko
12.10.2023 09:08
#26051778
+7
Эталонная статья от профессиональных карьеристов из консалтинга. Какие-то цифры без контекста, пафос в каждом абзаце, отсутствие конкретики и мощный call-to-action в конце. Почему-то всегда где-то так и представлял себе способ излагания мыслей от победителей по жизни, растолкавших локтями сотни претендентов на их место, и ставших партнерами в лучшем консалтинге мира.

Darksa
12.10.2023 09:08
#26053944
Что это делает на Хабре? Абсолютно бесполезный маркетинговый bullshit.