Cloudera Data Platform (CDP) представляет собой сдвиг парадигмы в современной архитектуре платформы данных, удовлетворяя все существующие и будущие потребности в аналитике. Она основана на технологиях CDH (Cloudera Data Hub) и HDP (Hortonworks Data Platform) и реализует целостную интегрированную платформу данных - от периферийных систем до искусственного интеллекта, помогая заказчикам ускорить сложные конвейеры данных и "демократизировать" активы данных.
В этой вводной статье я представлю всеобъемлющую структуру, которая отражает преимущества CDP для заинтересованных сторон в сфере технологий и бизнеса. Я разработал эту структуру, чтобы помочь организациям в экономическом обосновании инвестиций в CDP, а также чтобы предоставить механизм для приоритезации инвестиций в аналитику на основе конкретных бизнес-целей (таких, например, как снижение затрат на технологии или ускорение инициатив по стимулированию органического роста).
Структура оценки включает в себя четыре измерения: 1) увеличение стоимости бизнеса, 2) снижение и / или исключение затрат на технологии, 3) оптимизацию затрат на инфраструктуру и 4) операционную эффективность.
Структура бизнес-ценности для CDP:
В следующих разделах я представлю подход к количественной оценке каждого из этих параметров.
Повышение ценности для бизнеса
Эта категория описывает отличительные возможности CDP для ускорения развертывания сценариев использования (и реализации соответствующей бизнес-ценности), которые:
1. Предоставляют разнообразный набор аналитических инструментов для различных сценариев использования на протяжении жизненного цикла данных (потоковая передача данных, инженерия данных, хранилище данных, операционная база данных и машинное обучение).
2. Предлагают собственный механизм интеграции между аналитическими платформами через Shared Data Experience (SDX), чтобы упростить развертывание сложных конвейеров.
3. Предусматривают возможность расширения сценариев использования с помощью различных форматов и типов данных (как структурированных, так и неструктурированных) из нескольких источников.
4. Обеспечивают надежный механизм безопасности и управления с помощью SDX, который помогает масштабировать платформу для растущего числа пользователей и ролей в организации.
Чтобы получить количественную оценку ускорения роста ценности бизнеса, всегда нужно учитывать специфику отрасли и заказчика. Например, в случае крупного поставщика медицинских услуг, внедряющего CDP, я смог продемонстрировать ценность для бизнеса, сформулировав способность ускорять вывод на рынок инициатив неорганического роста, например,
Для будущих продаж и выделения активов, CDP Public Cloud ускоряет разделение активов данных и аналитических рабочих нагрузок в эластичной и масштабируемой облачной среде. Это преимущество обеспечивается Replication Manager - ключевой функциональностью CDP, которая ускоряет миграцию существующих локальных сценариев использования в публичное облако за счет расширения конфигураций безопасности и управления.
Для будущих приобретений CDP будет функционировать как единая зона лендинга всех рабочих нагрузок больших данных приобретаемой организации, причем независимо от платформы, на которой они изначально находились (например, предыдущие версии CDH / HDP, другие облачные хранилища или унаследованные локальные платформы). Учитывая широту возможностей, которые предлагает CDP, это поможет сократить технологическое отставание и ускорить деятельность по интеграции ИТ, что представляет собой ключевой фактор в реализации бизнес-ценности стратегий слияний и поглощений.
Снижение / исключение затрат на технологии
Чтобы помочь клиентам сократить (или полностью исключить) затраты на вспомогательные технологические инструменты, которые используются в сочетании с конкурирующими аналитическими решениями, CDP предоставляет следующие возможности:
Cloudera Control Plane заменяет инструменты мониторинга инфраструктуры, предлагая единую панель для мониторинга кластеров, развернутых в различных локальных и облачных средах.
Apache Ranger (часть Shared Data Experience - SDX) заменяет инструменты обеспечения безопасности данных, предоставляя детализированный механизм политик доступа к данным.
Каталог данных Cloudera (часть SDX) заменяет инструменты управления, облегчая централизованное управление данными (каталогизация данных, поиск / происхождение данных, отслеживание проблем с данными и т. д.).
Workload Manager (часть SDX) заменяет инструменты управления производительностью приложений для работы с большими данными, предлагая собственный механизм для анализа производительности и устранения неполадок конкретных заданий или рабочих нагрузок (например, сбоев при выполнении запросов, задержек выполнения).
SDX действует как уровень абстракции данных, который отделяет активы данных и контекст от базовых уровней обработки и хранения данных. В результате устраняется необходимость использования сторонних инструментов оркестрации / абстрагирования данных, с помощью которых нередко пытаются обеспечить некоторый уровень семантической согласованности между разнородными, изолированными хранилищами данных, характерными для точечных решений.
Области исключения затрат на технологии при использовании CDP:
Оптимизация затрат на инфраструктуру
Инфраструктура является самой высокой стоимостью в уравнении общей стоимости владения ("TCO") для аналитических сценариев использования, развернутых либо в локальном, либо в публичном облаке. CDP помогает клиентам оптимизировать общие расходы на инфраструктуру, предоставляя возможность выбора типа хостинга (публичное облако, локальное или гибридное облако) и поставщика облака (например, AWS, Google или Azure). Такая возможность обеспечивается благодаря Shared Data Experience (SDX), который позволяет плавно переходить от одного типа инфраструктуры или поставщика облака к другому с минимальными усилиями по миграции. В результате CDP помогает клиентам:
Оптимизировать расходы на локальные инсталляции за счет возможности делегирования в облако локальных рабочих нагрузок на основе моделей потребления и экономики инфраструктуры. Таким образом, клиенты могут сократить или даже избежать расширения мощностей центров обработки данных, используя эластичность публичного облака для удовлетворения пиковых потребностей в мощностях или высвобождения локальных мощностей.
Оптимизация расходов на вычислительные ресурсы и ресурсы хранения данных в облаке благодаря модели развертывания в нескольких облаках, которая помогает минимизировать расходы на облако на основе относительных экономических показателей удельной стоимости у разных облачных провайдеров.
Помимо минимизации затрат на инфраструктуру, CDP позволяет организациям избежать привязки к конкретным облачным провайдерам. Это преимущество определяет ценностное предложение платформы данных Cloudera не только в отношении краткосрочных целей сокращения затрат, но и стратегических целей диверсификации провайдеров.
Операционная эффективность
Эта категория отражает полезность, которую Cloudera Data Platform предоставляет заинтересованным сторонам в сфере технологий и бизнеса с точки зрения операционной эффективности для операций на всех этапах жизненного цикла данных. Эти операции можно разделить на следующие категории:
Операции конечного пользователя: CDP ускоряет операции с данными («DataOps») и операции машинного обучения («MLOps»), предоставляя интегрированную технологическую платформу, которая позволяет специалистам по обработке данных, инженерам данных и аналитикам совместно анализировать данные и взаимодействовать с ними, реализовывать конечные результаты, формируя сквозные конвейеры данных и т. д. без задержек интеграции или необходимости иметь дело с разрозненными фрагментами данных.
Операции по обеспечению безопасности и управления данными: платформа CDP предоставляет расширенные возможности безопасности и управления для групп по информационной безопасности и управлению данными. Эти возможности упрощают операции по обеспечению безопасности («SecOps»), такие как управление аутентификацией и авторизацией пользователей. Кроме того, обеспечивается надежное управление данными через Shared Data Experience (SDX), что позволяет централизованно управлять активами данных.
Управление платформой данных: группы администрирования платформы могут использовать преимущества встроенной интеграции всех аналитических структур и средств обеспечения безопасности / управления, поскольку им не приходится иметь дело с разнородными технологиями и осуществлять работы по интеграции (например, настройку собственных механизмов интеграции), управлять зависимостями, нести накладные расходы на настройку и т.д.
Таким образом, платформа данных Cloudera позволяет всем прямым и косвенным пользователям аналитической среды минимизировать усилия, затрачиваемые на задачи, не добавляющие ценности, и сосредоточиться на самом важном: извлечении ценности из данных.
Каждый из четырех критериев, которые я представил, имеет разное значение (или «вес») в зависимости от отрасли и контекста конкретного заказчика. Например, технологическая организация, которая быстро развивает свои предложения в области данных и / или выходит на новые рынки, должна придавать большее значение ускорению создания ценности для бизнеса, тогда как организация, которая ставит цель рационализации затрат, должна сосредоточиться на сокращении или исключении издержек. Разрабатывая стратегию платформы данных для наших заказчиков, я стараюсь подробно сформулировать их бизнес-приоритеты и цели и соответствующим образом адаптировать эту модель, определив правильные параметры ценности и присвоив каждому из них соответствующий вес на основе относительной важности.
ivankudryavtsev
По сравнению с чем?