В начале года появилась информация о том, что корпорация Microsoft почти закончила разработку собственного чипа, предназначенного для работы в ИИ-отрасли. Проект получил название Athena, а основное его предназначение — обеспечение работы чат-ботов с ИИ.

Саму разработку компания вела с 2019 года, причём тайно (ну почти, ведь иногда допускались почти что случайные утечки информации о проекте). О том, что в итоге получилось, какие у компании планы на чипы плюс какое всё это будет иметь значение для ИИ-отрасли, — под катом.

Они существуют!

В том, что компания решила разработать собственные чипы, особого сюрприза нет. Ведь Microsoft в партнёрстве с другими компаниями создавала чипы для Xbox и Surface, о чём рассказал Рани Боркар, руководитель направления аппаратных систем и инфраструктуры Azure в Microsoft.

Да, ИИ-процессоры от Microsoft вполне реальны, более того, работают. Причём, насколько можно судить, именно так, как задумывалось. Корпорация разработала не один процессор, а два: один — для обучения больших языковых моделей, чтобы не зависеть от поставщиков чипов, второй — для дата-центров, обеспечивающих работу облачных сервисов компании. Что один, что другой чипы предназначаются для удовлетворения как собственных потребностей компании, ЦОД Azure, так и для предоставления корпоративным клиентам.

Чипы называются Azure Maia и Azure Cobalt. Оба базируются на архитектуре ARM и станут более-менее массово использоваться в дата-центрах компании. Насколько можно понять, компания планирует и заработать, поставляя чипы корпоративным клиентам. Вероятно, заработать можно неплохо, судя по успехам Nvidia, которая также поставляет высокопроизводительные чипы для ИИ-сервисов. Графические чипы от Nvidia быстро стали дефицитным товаром, сейчас в рознице цены на них достигают $60 000 США и даже выше.

Сколько будут стоить чипы редмондской корпорации, пока неясно, но понятно, что много. Что касается Azure Maia 100, то эта разработка предназначена для оптимизации работы с большими языковыми моделями, которые являются основой для самых разных ИИ-приложений. Чип изготовлен по 5-нм техпроцессу, он содержит 105 млрд транзисторов, что примерно на 30% меньше, чем у чипа AMD MI300X AI. Он поддерживает первую в компании реализацию восьмибитных типов данных (типов данных MX) для совместного проектирования аппаратного и программного обеспечения.

Maia — первый серверный процессор с жидкостным охлаждением от Microsoft. Он позволит обеспечить более высокую плотность серверов. По словам Microsoft, это не просто оптимизация, компания перерабатывает концепцию всей своей IT-инфраструктуры.

Сейчас корпорация тестирует этот процессор как с поисковой системой Bing и её ИИ-элементами, так и с продуктами Office AI. Кроме того, этот же чип тестирует и компания Open AI, о которой в последнее время пишут очень много. И не в последнюю очередь в связи со взаимодействием Open AI c Microsoft.

Процессор Cobalt 100, как и говорилось выше, предназначен для оптимизации работы облачных сервисов на платформе Azure. Это 128-ядерный чип, построенный на базе дизайна Arm Neoverse CSS и адаптированный для Microsoft. Корпорация планирует массово задействовать этот ARM-чип в своих дата-центрах, что позволит повысить общую производительность плюс снизить энергопотребление.

«Мы много думали не только о том, как добиться высокой производительности, но и об управлении энергопотреблением, — объясняет Боркар. — Мы приняли несколько тщательно продуманных решений в дизайне, которые добавили возможность контролировать производительность и энергопотребление на ядро на каждой отдельной виртуальной машине».

Чип также тестируется в первую очередь в Microsoft Teams и Microsoft SQL Server. В 2024 году корпорация планирует начать продажу доступа к виртуальным машинам на Cobalt корпоративным клиентам. По словам представителей компании, системы на базе нового процессора на 40% производительнее в некоторых задачах, чем системы, которые используются в ЦОД Microsoft на текущий момент.

Кроме работы над самими чипами компания занимается глубокой оптимизацией своего стека облачных серверов для повышения производительности и мощности с одновременным снижением стоимости эксплуатации таких систем. Разработчики компании заявили, что продумали возможность контроля производительности и энергопотребления для каждого из ядер и каждой отдельной виртуальной машины.

Ну процессоры и процессоры, что такого?

Компания работает в ИИ-отрасли не сама, она — часть группы вместе с такими гигантами, как AMD, Arm, Intel, Meta, Nvidia и Qualcomm. Вместе участники пытаются стандартизировать следующее поколение форматов данных для ИИ-моделей. Как и раньше, Microsoft использует в работе Open Compute Project (OCP).

Благодаря новым чипам и системам на их основе компания планирует быстро разворачивать серверы, обеспечивающие работу ИИ-сервисов без необходимости выделять отдельное место в ЦОД по всему миру. Специально для этого оборудования разработана и своя стойка, в которой есть индивидуальный охладитель теплоносителя.

Оборудование на базе Maia уже тестируется в работе с GPT 3.5 Turbo (та же модель, что и в ChatGPT), рабочие нагрузки Bing AI и GitHub Copilot. Все наработки, полученные компанией в ходе тестирования, будут предоставлены и партнёрам вместе с данными о серверном оборудовании, параметрах работы и т. п.

К сожалению, пока что нет данных тестирования в общем доступе — туда поступает только та информация, которую предоставляет корпорация Microsoft. Но уже известно, что прямо сейчас ведётся работа и над вторым поколением чипов.

Если проект с новой IT-инфраструктурой будет двигаться, как и запланировано, то всё это может оказать сильное и продолжительное влияние на будущее технологий искусственного интеллекта. Это подкрепляется и тем, что корпорация очень тесно связана с OpenAI, которая сейчас является одним из лидеров по ИИ-решениям.

Комментарии (6)


  1. dmitry78
    22.11.2023 14:37
    +1

    Не проходите мимо!

    1. начале года появилась информация о том, что корпорация Microsoft почти закончила " (зачем в конце года новость "начала года?", пруфы в студию)

    прыгая через мысли: " Да, ИИ-процессоры от Microsoft вполне реальны, более того, работают.

    Саму разработкукомпания вела с 2019 года, причём тайно (на клавах есть не только ctrl+c но и пробел,) (походу officeAI не успел подсказать)

    "«Мы много думали не только о том, как добиться высокой производительности, но и об управлении энергопотреблением, — объясняет Боркар. — Мы приняли несколько тщательно продуманных решений в дизайне, которые добавили возможность контролировать производительность и энергопотребление на ядро на каждой отдельной виртуальной машине». " - ядра тоже виртуальные?

    редеры красивые, ИИ творил?


  1. vikarti
    22.11.2023 14:37

    Чем отличается от Amazon'овских ускорителей AWS Inferentia ? У которых уже второе поколение.


    1. Kenya-West
      22.11.2023 14:37

      У ускорителей от Amazon есть один фатальный недостаток...


  1. easyman
    22.11.2023 14:37

    Раньше такой "сервер" называли mainframe


    1. vikarti
      22.11.2023 14:37
      +1

      Разве?

      Мне казалось что нормальный mainframe это - ему диски выдергиваешь а оно не дохнет и продолжает пахать, ему процессоры достаешь прямо из включенного а оно пашет, ему подрываешь датацентр где оно стоит а оно все равно пашет (поскольку Parallel Sysplex по оптике в нескольких десятках км). И все это - полностью штатный функционал.

      Ну как может так и пашет - упор на надежность а не производительность.


  1. Johan_Palych
    22.11.2023 14:37

    Bing Chat so hungry for GPUs, Microsoft will rent them from Oracle
    Microsoft из-за прожорливости Bing Chat пришлось договориться об аренде ИИ-ускорителей NVIDIA у Oracle

    Во вторник компании анонсировали многолетнее соглашение. Как сообщают в Microsoft, одновременное использование компанией как Oracle Cloud, так и Microsoft Azure расширит возможности клиентов и ускорит работу с поисковыми сервисами. Сотрудничество связано с тем, что Microsoft надо всё больше вычислительных ресурсов для заявляемого «взрывного роста» её ИИ-сервисов, а у Oracle как раз имеются десятки тысяч ускорителей NVIDIA A100 и H100 для аренды.