В прошлом декабре компания HPE объявила о выпуске модульной платформы для вычислений в памяти с использованием технологии in-memory с самыми широкими в мире возможностями масштабирования — HPE Superdome Flex. Это прорыв в области вычислительных систем для поддержки критически важных приложений, аналитики в реальном времени и высокопроизводительных вычислений с интенсивной обработкой данных.
Платформа HPE Superdome Flex обладает рядом характеристик, которые делают ее уникальной в своей отрасли. Предлагаем вам перевод статьи из блога Servers: The Right Compute, в которой рассматривается модульная и масштабируемая архитектура платформы.
Как и большинство поставщиков серверов x86, HPE в своих серверах последнего поколения, включая HPE Superdome Flex, использует новейшие процессоры семейства Intel Xeon Scalable с кодовым названием Skylake. В эталонной архитектуре Intel для этих процессоров используется новая технология UltraPath Interconnect (UPI) с ограничением масштабирования до восьми сокетов. Большинство поставщиков, которые используют эти процессоры, применяют в серверах способ соединения «без склеивания», однако в HPE Superdome Flex используется уникальная модульная архитектура с возможностями масштабирования, превышающими возможности Intel: от 4 до 32 сокетов в одной системе.
Эта архитектура используется потому, что мы увидели потребность в платформах с масштабированием, выходящим за пределы восьми сокетов Intel; особенно актуально это сегодня, когда объемы данных увеличиваются с невиданной скоростью. Кроме того, поскольку Intel разрабатывал UPI прежде всего для серверов с двумя и четырьмя сокетами, серверы с восемью сокетами «без склеивания» сталкиваются с проблемами пропускной способности. Наша архитектура обеспечивает высокую пропускную способность даже при росте системы до максимальной конфигурации.
Модульная архитектура HPE Superdome Flex основана на шасси с четырьмя сокетами с возможностью масштабирования до восьми шасси и 32 сокетов в одной серверной системе. Для использования в сервере доступен широкий выбор процессоров: от недорогих моделей Gold до топовой серии Platinum семейства процессоров Xeon Scalable.
Эта возможность выбора между процессорами Gold и Platinum во всем диапазоне масштабирования предоставляет отличные преимущества в соотношении цена/производительность по сравнению с системами начального уровня. Например, в типичной конфигурации с 6 ТБ памяти Superdome Flex обеспечивает более дешевое и более производительное решение, чем конкурентные предложения с четырьмя сокетами. Почему? Из-за особенностей архитектуры другие производители 4-процессорных систем вынуждены использовать модули памяти 128 ГБ DIMM и более дорогие процессоры с поддержкой 1.5 ТБ на сокет. Это значительно дороже чем использование модулей 64 ГБ DIMM в Superdome Flex с восемью сокетами. Благодаря этому платформа Superdome Flex с восемью сокетами и 6 ТБ памяти обеспечивает в два раза большую вычислительную мощность, в два раза большую пропускную способность памяти и в два раза большие возможности ввода-вывода, и она все равно будет более экономичной, чем конкурентные продукты с четырьмя сокетами и 6 ТБ памяти.
Аналогично, и для 8-процессорной конфигурации с 6 ТБ памяти, платформа Superdome Flex может предоставить менее дорогое и более производительное решение с восемью сокетами. Как? Другие производители 8-процессорных систем вынуждены использовать более дорогие процессоры Platinum, в то время, как Superdome Flex с восемью сокетами может использовать недорогие процессоры Gold, предоставляя такой же объем памяти.
Фактически, среди платформ на основе семейства процессоров Intel Xeon Scalable, только Superdome Flex может поддерживать более экономичные процессоры Gold в конфигурациях с 8 и более сокетами (архитектура Intel «без склеивания» поддерживает 8 сокетов только с дорогими процессорами Platinum). Мы также предлагаем большой выбор процессоров с разным числом ядер, от 4 до 28 на процессор, позволяя соотнести их количество с требованиями к рабочим нагрузкам.
Возможность вертикального масштабирования в рамках одной системы, или scale up, предоставляет ряд преимуществ для критически важных нагрузок и баз данных, для которых лучше всего подходит HPE Superdome Flex. К ним относятся традиционные базы данных и базы данных в памяти, аналитика в реальном времени, ERP, CRM и другие транзакционные приложения. Для этих типов нагрузок проще и дешевле управлять одной вертикально масштабируемой средой, чем кластером с горизонтальным масштабированием; кроме того, это значительно снижает задержки и повышает производительность.
Ознакомьтесь с публикацией в блоге Скорость операций при горизонтальном и вертикальном масштабировании с SAP S/4HANA, чтобы понять, почему вертикальное масштабирование гораздо эффективнее горизонтального (кластеризации) для этих типов рабочих нагрузок. По сути, все дело в скорости и возможности работы на необходимом для этих критически важных приложений уровне.
Высокие возможности масштабирования Superdome Flex достигаются благодаря уникальному чипсету HPE Superdome Flex ASIC, соединяющему отдельные 4-процессорные шасси, как показано на рисунках 1 и 2. При этом все ASIC соединены между собой напрямую (с удалённостью в один шаг), обеспечивая минимальные задержки доступа к удаленным ресурсам и максимальную производительность. Технология HPE Superdome Flex ASIC обеспечивает адаптивную маршрутизацию для балансировки загрузки коммутационной матрицы и оптимизации задержек и пропускной способности, что повышает производительность и уровень доступности системы. ASIC объединяет шасси в кэш-когерентную фабрику-матрицу и поддерживает согласованность кэша во всех процессорах, используя для этого большой каталог с записями состояния строк кэша, который встроен непосредственно в ASIC. Такая схема когерентности играет важнейшую роль, обеспечивая для Superdome Flex способность поддерживать близкое к линейному масштабирование производительности в пределах от 4 до 32 сокетов. Типовые варианты архитектуры «без склеивания» демонстрируют уже более ограниченное масштабирование производительности (в пределах от четырех до восьми сокетов) из-за широковещательной рассылки служебных запросов для обеспечения когерентности.
Рис. 1. Схема соединений коммутационной матрицы HPE Flex Grid сервера Superdome Flex 32-сокета
Рис. 2. 4-процессорные шасси
Аналогично процессорным ресурсам может быть увеличен и объем памяти путем добавления шасси к системе. В каждом шасси имеется 48 слотов DDR4 DIMM в которые могут быть установлены модули памяти 32 ГБ RDIMM, 64 ГБ LRDIMM или 128 ГБ 3DS LRDIMM, что обеспечивает максимальный объем памяти 6 ТБ в шасси. Соответственно, общий объем оперативной памяти HPE Superdome Flex в максимальной конфигурации с 32 сокетами достигает 48 ТБ, что позволяет работать с самыми ресурсоемкими приложениями, использующими технологию in-memory.
Что касается ввода-вывода, каждое шасси Superdome Flex может быть оборудовано корзиной с 16 или 12 слотами ввода-вывода для обеспечения большого количества вариантов установки стандартных карт PCIe 3.0 и гибкой возможности поддержания системного баланса для любых рабочих нагрузок. В любом варианте корзины слоты ввода-вывода подключены к процессорам напрямую без применения шинных повторителей или расширителей, что могло бы увеличить время задержки или уменьшить пропускную способность. Это обеспечивает максимально возможную производительность каждой карты ввода-вывода.
Низкая задержка доступа ко всему пространству разделяемой оперативной памяти — это ключевой фактор высокой производительности Superdome Flex. Независимо от того, лежат ли данные в локальной памяти или в удаленной (в другом шасси), их копия может находиться в кэше разных процессоров в рамках системы. Механизм когерентности кэш-памяти обеспечивает согласованность кэшированных копий в случае, если процесс изменяет данные. Время задержки доступа процессора к локальной памяти составляет около 100 нс. Задержка доступа к данным в памяти другого процессора через канал UPI составляет около 130 нс. Процессоры, обращающиеся к данным, лежащим в памяти другого шасси, проходят путь между двумя Flex ASIC (всегда соединенным напрямую) с задержкой менее 400 нс, независимо от того, в каком шасси находится процессор. Благодаря этому Superdome Flex обеспечивает пропускную способность между двумя половинами матрицы (bi-sectioned) более 210 ГБ/с в конфигурации с 8 сокетами, более 425 ГБ/с в конфигурации с 16 сокетами и более 850 ГБ/с в конфигурации с 32 сокетами. Этого более чем достаточно для самых требовательных и ресурсоемких рабочих нагрузок.
Не секрет, что объем данных увеличивается с невиданной скоростью; это означает, что инфраструктура должна справляться со все более требовательными запросами на обработку и анализ критически важных и постоянно расширяющихся данных. Но темпы роста могут быть непредсказуемыми.
При развертывании приложений, интенсивно использующих оперативную память, вы можете спросить: во что мне обойдется следующий ТБ памяти? Superdome Flex позволяет увеличивать объем памяти без замены оборудования, поскольку вы не ограничены слотами DIMM в одном шасси. Кроме того, с увеличением числа пользователей критически важным приложениям всегда требуется высокая производительность, независимо от объема нагрузки.
Сегодня базам данных, работающим в памяти, требуются аппаратные платформы с низкими задержками и высокой пропускной способностью. Благодаря своей инновационной архитектуре платформа HPE Superdome Flex обеспечивает исключительно высокую производительность, высокую пропускную способность и неизменно низкую задержку даже в самых крупных конфигурациях. Более того, все это вы можете получить для своих критически важных нагрузок и баз данных с весьма привлекательным соотношением цены/производительности по сравнению с системами других производителей.
Об уникальных свойствах отказоустойчивости (RAS) сервера Superdome Flex вы можете узнать из блога HPE Superdome Flex: Уникальные свойства RAS и технического описания HPE Superdome Flex: архитектура сервера и характеристики RAS. Также недавно вышел блог, посвященный обновлениям HPE Superdome Flex, объявленным на HPE Discover.
Из этой статьи вы можете узнать, как HPE Superdome Flex используется для решения задач космологии, а также как платформа подготовлена к memory-driven computing, новой архитектуре вычислений на основе памяти.
Более подробно ознакомиться с платформой можно также из записи вебинара.
Платформа HPE Superdome Flex обладает рядом характеристик, которые делают ее уникальной в своей отрасли. Предлагаем вам перевод статьи из блога Servers: The Right Compute, в которой рассматривается модульная и масштабируемая архитектура платформы.
Возможности масштабирования превышают возможности Intel
Как и большинство поставщиков серверов x86, HPE в своих серверах последнего поколения, включая HPE Superdome Flex, использует новейшие процессоры семейства Intel Xeon Scalable с кодовым названием Skylake. В эталонной архитектуре Intel для этих процессоров используется новая технология UltraPath Interconnect (UPI) с ограничением масштабирования до восьми сокетов. Большинство поставщиков, которые используют эти процессоры, применяют в серверах способ соединения «без склеивания», однако в HPE Superdome Flex используется уникальная модульная архитектура с возможностями масштабирования, превышающими возможности Intel: от 4 до 32 сокетов в одной системе.
Эта архитектура используется потому, что мы увидели потребность в платформах с масштабированием, выходящим за пределы восьми сокетов Intel; особенно актуально это сегодня, когда объемы данных увеличиваются с невиданной скоростью. Кроме того, поскольку Intel разрабатывал UPI прежде всего для серверов с двумя и четырьмя сокетами, серверы с восемью сокетами «без склеивания» сталкиваются с проблемами пропускной способности. Наша архитектура обеспечивает высокую пропускную способность даже при росте системы до максимальной конфигурации.
Соотношение цена/производительность как конкурентное преимущество
Модульная архитектура HPE Superdome Flex основана на шасси с четырьмя сокетами с возможностью масштабирования до восьми шасси и 32 сокетов в одной серверной системе. Для использования в сервере доступен широкий выбор процессоров: от недорогих моделей Gold до топовой серии Platinum семейства процессоров Xeon Scalable.
Эта возможность выбора между процессорами Gold и Platinum во всем диапазоне масштабирования предоставляет отличные преимущества в соотношении цена/производительность по сравнению с системами начального уровня. Например, в типичной конфигурации с 6 ТБ памяти Superdome Flex обеспечивает более дешевое и более производительное решение, чем конкурентные предложения с четырьмя сокетами. Почему? Из-за особенностей архитектуры другие производители 4-процессорных систем вынуждены использовать модули памяти 128 ГБ DIMM и более дорогие процессоры с поддержкой 1.5 ТБ на сокет. Это значительно дороже чем использование модулей 64 ГБ DIMM в Superdome Flex с восемью сокетами. Благодаря этому платформа Superdome Flex с восемью сокетами и 6 ТБ памяти обеспечивает в два раза большую вычислительную мощность, в два раза большую пропускную способность памяти и в два раза большие возможности ввода-вывода, и она все равно будет более экономичной, чем конкурентные продукты с четырьмя сокетами и 6 ТБ памяти.
Аналогично, и для 8-процессорной конфигурации с 6 ТБ памяти, платформа Superdome Flex может предоставить менее дорогое и более производительное решение с восемью сокетами. Как? Другие производители 8-процессорных систем вынуждены использовать более дорогие процессоры Platinum, в то время, как Superdome Flex с восемью сокетами может использовать недорогие процессоры Gold, предоставляя такой же объем памяти.
Фактически, среди платформ на основе семейства процессоров Intel Xeon Scalable, только Superdome Flex может поддерживать более экономичные процессоры Gold в конфигурациях с 8 и более сокетами (архитектура Intel «без склеивания» поддерживает 8 сокетов только с дорогими процессорами Platinum). Мы также предлагаем большой выбор процессоров с разным числом ядер, от 4 до 28 на процессор, позволяя соотнести их количество с требованиями к рабочим нагрузкам.
Важность масштабирования в рамках одной системы
Возможность вертикального масштабирования в рамках одной системы, или scale up, предоставляет ряд преимуществ для критически важных нагрузок и баз данных, для которых лучше всего подходит HPE Superdome Flex. К ним относятся традиционные базы данных и базы данных в памяти, аналитика в реальном времени, ERP, CRM и другие транзакционные приложения. Для этих типов нагрузок проще и дешевле управлять одной вертикально масштабируемой средой, чем кластером с горизонтальным масштабированием; кроме того, это значительно снижает задержки и повышает производительность.
Ознакомьтесь с публикацией в блоге Скорость операций при горизонтальном и вертикальном масштабировании с SAP S/4HANA, чтобы понять, почему вертикальное масштабирование гораздо эффективнее горизонтального (кластеризации) для этих типов рабочих нагрузок. По сути, все дело в скорости и возможности работы на необходимом для этих критически важных приложений уровне.
Неизменно высокая производительность вплоть до максимальных конфигураций
Высокие возможности масштабирования Superdome Flex достигаются благодаря уникальному чипсету HPE Superdome Flex ASIC, соединяющему отдельные 4-процессорные шасси, как показано на рисунках 1 и 2. При этом все ASIC соединены между собой напрямую (с удалённостью в один шаг), обеспечивая минимальные задержки доступа к удаленным ресурсам и максимальную производительность. Технология HPE Superdome Flex ASIC обеспечивает адаптивную маршрутизацию для балансировки загрузки коммутационной матрицы и оптимизации задержек и пропускной способности, что повышает производительность и уровень доступности системы. ASIC объединяет шасси в кэш-когерентную фабрику-матрицу и поддерживает согласованность кэша во всех процессорах, используя для этого большой каталог с записями состояния строк кэша, который встроен непосредственно в ASIC. Такая схема когерентности играет важнейшую роль, обеспечивая для Superdome Flex способность поддерживать близкое к линейному масштабирование производительности в пределах от 4 до 32 сокетов. Типовые варианты архитектуры «без склеивания» демонстрируют уже более ограниченное масштабирование производительности (в пределах от четырех до восьми сокетов) из-за широковещательной рассылки служебных запросов для обеспечения когерентности.
Рис. 1. Схема соединений коммутационной матрицы HPE Flex Grid сервера Superdome Flex 32-сокета
Рис. 2. 4-процессорные шасси
Общая память
Аналогично процессорным ресурсам может быть увеличен и объем памяти путем добавления шасси к системе. В каждом шасси имеется 48 слотов DDR4 DIMM в которые могут быть установлены модули памяти 32 ГБ RDIMM, 64 ГБ LRDIMM или 128 ГБ 3DS LRDIMM, что обеспечивает максимальный объем памяти 6 ТБ в шасси. Соответственно, общий объем оперативной памяти HPE Superdome Flex в максимальной конфигурации с 32 сокетами достигает 48 ТБ, что позволяет работать с самыми ресурсоемкими приложениями, использующими технологию in-memory.
Высокая гибкость ввода-вывода
Что касается ввода-вывода, каждое шасси Superdome Flex может быть оборудовано корзиной с 16 или 12 слотами ввода-вывода для обеспечения большого количества вариантов установки стандартных карт PCIe 3.0 и гибкой возможности поддержания системного баланса для любых рабочих нагрузок. В любом варианте корзины слоты ввода-вывода подключены к процессорам напрямую без применения шинных повторителей или расширителей, что могло бы увеличить время задержки или уменьшить пропускную способность. Это обеспечивает максимально возможную производительность каждой карты ввода-вывода.
Низкие задержки
Низкая задержка доступа ко всему пространству разделяемой оперативной памяти — это ключевой фактор высокой производительности Superdome Flex. Независимо от того, лежат ли данные в локальной памяти или в удаленной (в другом шасси), их копия может находиться в кэше разных процессоров в рамках системы. Механизм когерентности кэш-памяти обеспечивает согласованность кэшированных копий в случае, если процесс изменяет данные. Время задержки доступа процессора к локальной памяти составляет около 100 нс. Задержка доступа к данным в памяти другого процессора через канал UPI составляет около 130 нс. Процессоры, обращающиеся к данным, лежащим в памяти другого шасси, проходят путь между двумя Flex ASIC (всегда соединенным напрямую) с задержкой менее 400 нс, независимо от того, в каком шасси находится процессор. Благодаря этому Superdome Flex обеспечивает пропускную способность между двумя половинами матрицы (bi-sectioned) более 210 ГБ/с в конфигурации с 8 сокетами, более 425 ГБ/с в конфигурации с 16 сокетами и более 850 ГБ/с в конфигурации с 32 сокетами. Этого более чем достаточно для самых требовательных и ресурсоемких рабочих нагрузок.
Почему высокие возможности модульного масштабирования важны?
Не секрет, что объем данных увеличивается с невиданной скоростью; это означает, что инфраструктура должна справляться со все более требовательными запросами на обработку и анализ критически важных и постоянно расширяющихся данных. Но темпы роста могут быть непредсказуемыми.
При развертывании приложений, интенсивно использующих оперативную память, вы можете спросить: во что мне обойдется следующий ТБ памяти? Superdome Flex позволяет увеличивать объем памяти без замены оборудования, поскольку вы не ограничены слотами DIMM в одном шасси. Кроме того, с увеличением числа пользователей критически важным приложениям всегда требуется высокая производительность, независимо от объема нагрузки.
Сегодня базам данных, работающим в памяти, требуются аппаратные платформы с низкими задержками и высокой пропускной способностью. Благодаря своей инновационной архитектуре платформа HPE Superdome Flex обеспечивает исключительно высокую производительность, высокую пропускную способность и неизменно низкую задержку даже в самых крупных конфигурациях. Более того, все это вы можете получить для своих критически важных нагрузок и баз данных с весьма привлекательным соотношением цены/производительности по сравнению с системами других производителей.
Об уникальных свойствах отказоустойчивости (RAS) сервера Superdome Flex вы можете узнать из блога HPE Superdome Flex: Уникальные свойства RAS и технического описания HPE Superdome Flex: архитектура сервера и характеристики RAS. Также недавно вышел блог, посвященный обновлениям HPE Superdome Flex, объявленным на HPE Discover.
Из этой статьи вы можете узнать, как HPE Superdome Flex используется для решения задач космологии, а также как платформа подготовлена к memory-driven computing, новой архитектуре вычислений на основе памяти.
Более подробно ознакомиться с платформой можно также из записи вебинара.