Один чип вместо тысяч серверов, или глобальный конкурент Nvidia / forpes.ru

Главная
Один чип вместо тысяч серверов, или глобальный конкурент Nvidia

Один чип вместо тысяч серверов, или глобальный конкурент Nvidia +5

08.12.2025 07:59

onlyahead 3 1900 Источник

Пока все обсуждали, насколько мощнее стали новые GPU, возникла другая проблема: большие модели не помещаются туда, где их пытаются запускать. Дата-центры дорожают, пропускные сети упираются в физические пределы, а зависимость от облака становится стратегическим риском. О компании, которая предлагает альтернативную инфраструктуру для ИИ.

Cerebras Systems компания, которая пошла против главного правила полупроводниковой индустрии. Вместо того чтобы нарезать кремниевую пластину на сотни маленьких чипов и затем пытаться соединить их проводами, они оставили её целой. Так появился Wafer Scale Engine – самый большой процессор в истории человечества размером с обеденную тарелку.

Это инженерное решение создано с одной целью: убрать коммуникационный налог. Пока конкуренты строят сложные кластеры, где данные теряют время в пути между серверами, Cerebras предлагает систему, где память и вычисления слиты в единый монолит. К нам пришло уже не просто быстрое железо, а принципиально иная философия вычислений.

Заложник геополитики

В конце 2025 года рынок аппаратного обеспечения для И�� столкнулся с парадоксом, который невозможно объяснить стандартной рыночной логикой. Компания Cerebras Systems, демонстрирующая финансовые показатели, о которых мечтает любой единорог Кремниевой долины, неожиданно нажала на стоп-кран в шаге от публичного размещения.

Вместо ожидаемого IPO, которое аналитики называли главным событием года в секторе полупроводников, компания в октябре официально отозвала заявку и закрыла частный раунд финансирования Series G объемом $1,1 млрд.

С чисто экономической точки зрения это решение выглядит абсурдным.
За прошедший год выручка Cerebras выросла на фантастические 535%, достигнув отметки около $500 млн, а список клиентов перестал ограничиваться научными лабораториями, пополнившись такими гигантами, как AWS, Meta* и IBM. Однако блестящий баланс разбился о стену национальной безопасности США. Комитет по иностранным инвестициям (CFIUS) фактически заблокировал выход на биржу, усмотрев в ключевом партнере компании (арабском холдинге G42) потенциальный канал утечки технологий в Китай.

В результате сложилась уникальная ситуация: производитель, чья оценка достигла $8,1 млрд и чьи чипы в конкретных задачах превосходят решения Nvidia на порядки, оказался заложником большой политики. Вашингтон видит в их технологиях стратегический актив, который нельзя выпускать из-под контроля, а инвесторы вынуждены наблюдать, как один из самых перспективных активов индустрии остается в частных руках, получая ликвидность через вторичный рынок и закрытые раунды. Эта история перестала быть просто рассказом про железо – теперь это наглядное пособие о том, как геополитическое противостояние перекраивает карту технологического лидерства.

Архитектура: Одиночный гигант против армии клонов

Попытка сравнить флагманский чип Cerebras WSE-3 с новейшим ускорителем Nvidia B300 (Blackwell Ultra) ставит в тупик любого, кто привык к стандартным метрикам. Формально это конкуренты, но технически они находятся в разных весовых категориях: WSE-3 – это целая кремниевая пластина, функционирующая как единый супер-процессор, в то время как B300 – модуль, спроектированный для работы в составе огромных кластеров. Однако именно в этом различии кроется ответ на вопрос, почему индустрия ищет альтернативы монополии Nvidia.

Фундаментальный водораздел проходит по линии работы с памятью – главной головной боли современных ИИ-систем. Архитектура Nvidia Blackwell опирается на память стандарта HBM3e. В модели B300 её много: 288 ГБ на чип, что позволяет загружать огромные слои нейросетей целиком. Но физику обмануть сложно: HBM-память расположена рядом с вычислительным кристаллом, а не внутри него. Это создает неизбежную задержку (по-научному латентность) при обращении к данным.

Именно здесь кроется ключевой рыночный парадокс и одновременно главная линия обороны Nvidia. Технология HBM стала самым узким местом глобальной цепочки поставок: если TSMC способна произвести практически любой объем логических кристаллов, то производство сложной стековой памяти (которое ведут всего три игрока: SK Hynix, Samsung и Micron) масштабируется крайне медленно. Nvidia, пользуясь доминирующим положением, фактически монополизировала поставки HBM, выкупая квоты на годы вперед, что лишает стартапы физической возможности создать прямой аналог – им просто нечего ставить рядом с процессором. Главное конкурентное преимущество Cerebras заключается в радикальном выходе из этой технологической колеи: благодаря гигантской площади Wafer Scale Engine, вся память интегрирована непосредственно в структуру чипа (SRAM). Это не и устраняет физическую латентность, о которой говорилось выше, и выводит компанию из-под удара глобального дефицита HBM, делая их архитектуру единственной, неуязвимой для ресурсной блокады со стороны Nvidia.

Cerebras пошла радикально иным путем.
В их пластине WSE-3 вся память (44 ГБ) – это сверхбыстрая SRAM, интегрированная непосредственно в вычислительные ядра. Здесь нет шин, по которым данные должны ехать до процессора – они уже на месте.

Это обеспечивает феноменальную пропускную способность в 21 Петабайт в секунду, что примерно в 2600 раз превышает показатели топовых решений Nvidia.

Да, объем памяти меньше, что требует специфического подхода к программированию (так называемый Weight Streaming), но выигрыш в скорости доступа к данным меняет правила игры.

Второй критический аспект – масштабирование.
Современные LLM требуют мощностей, превышающих возможности одного GPU, поэтому инженеры вынуждены объединять тысячи видеокарт в кластеры. Nvidia потратила годы на создание шины NVLink, чтобы заставить тысячи чипов B300 работать синхронно, но проблема коммуникационного налога никуда не делась. Чем больше кластер, тем больше времени и энергии тратится не на полезные вычисления, а на пересылку результатов между серверами и синхронизацию градиентов. WSE-3 решает эту проблему методом грубой силы: 900 000 ядер размещены на едином куске кремния. Между ними нет сетевых кабелей, коммутаторов и оптических трансиверов. Задержки внутри этой системы практически нулевые, что позволяет обучать модели с эффективностью, недостижимой для распределенных систем.

Лучше всего эту архитектурную пропасть иллюстрирует транспортная аналогия. Представьте, что кластер на базе Nvidia B300 – это автопарк из 50 суперкаров Ferrari. Каждая машина обладает потрясающей мощностью, но чтобы перевезти единый тяжелый груз, водителям необходимо постоянно координировать действия по рации: кто тормозит, кто разгоняется, кто поворачивает. Любая помеха в эфире или ошибка пилота замедляет всю колонну. В этом сравнении Cerebras WSE-3 как сверхзвуковой грузовой поезд на магнитной подушке. Ему не нужна координация по рации, все вагоны сцеплены намертво в единую жесткую конструкцию и движутся как монолит. Именно поэтому в задачах инференса (генерации ответов) Cerebras показывает результаты в 20 раз быстрее: пока парк Ferrari согласовывает движение, поезд уже доставил груз.

Арабский кит и американская паранойя

Около 85% всех доходов Cerebras генерирует единственный клиент –технологический холдинг G42 из Абу-Даби. Этот дисбаланс превращает американского производителя чипов из классической рыночной компании в узкоспециализированного подрядчика для конкретного иностра��ного государства.

Партнерство с G42 не рядовая закупка оборудования, а масштабный стратегический альянс стоимостью $1,43 млрд, который фундаментально меняет расстановку сил в индустрии. В рамках этого соглашения развертывается «Созвездие Кондор» (Condor Galaxy) – сеть суперкомпьютеров, которая к 2025 году стала одной из крупнейших в мире. Масштаб проекта поражает: каждый узел сети, например, уже функционирующий CG-3, объединяет 64 системы CS-3 в единый кластер с 58 миллионами ядер, выдающий 8 эксафлопс ИИ-мощности. Общая плановая мощность всей сети из девяти таких центров должна достигнуть 36 эксафлопс. Это инфраструктура национального масштаба, которую ОАЭ строят на территории США, чтобы обойти экспортные ограничения и получить доступ к передовым вычислениям.

Именно этот масштаб и происхождение капитала стали триггером для американских властей. Комитет по иностранным инвестициям США (CFIUS) рассматривает G42 не просто как щедрого инвестора, а как потенциальный шлюз для утечки критических технологий в Китай. Вашингтон опасается, что через эмиратовские структуры доступ к мощностям Cerebras могут получить китайские компании, находящиеся под санкциями. В условиях, когда ИИ-чипы приравнены к вооружению, такая связь может стать токсичной. Блокировка и последующий отзыв IPO Cerebras, вполне вероятно прямое следствие этой настороженности: регулятор поставил ультиматум, требуя либо разорвать связи с ключевым донором, либо оставаться частной компанией под жестким надзором.

Руководство Cerebras пытается диверсифицировать портфель, чтобы показать рынку жизнь за пределами контракта с шейхами. В 2025 году список публичных внедрений пополнился крупными игроками: фармацевтический гигант GlaxoSmithKline, медицинская сеть Mayo Clinic и немецкая Aleph Alpha используют системы для задач, требующих строгой конфиденциальности. Однако, несмотря на статусность этих имен, их финансовый вклад пока не может перевесить чашу весов, на которой лежит миллиардный контракт с G42. Возникает парадоксальная ситуация: у компании есть лучший в классе продукт и бесконечные деньги от якорного заказчика, но путь к публичному рынку закрыт шлагбаумом национальной безопасности.

Энергетический парадокс и Суверенный ИИ

Помимо геополитических интриг и архитектурных споров, у технологии wafer-scale есть козырь, который становится решающим в эпоху глобального дефицита электроэнергии. Современные дата-центры для обучения нейросетей превратились в энергетических монстров, потребление которых сопоставимо с нуждами небольших городов, что вынуждает операторов ЦОД проектировать собственные подстанции.

В этом контексте решения Cerebras предлагают экономику, недостижимую для классических архитектур: согласно внутренним бенчмаркам, их системы расходуют в 44 раза меньше электричества на единицу производительности по сравнению с традиционными GPU-кластерами. Если для достижения вычислительной мощности в один эксафлопс стандартной ферме видеокарт требуются десятки мегаватт и гигантские площади охлаждения, то инфраструктура Cerebras справляется с этой задачей, потребляя менее 500 киловат��. Это превращает их холодильники CS-3 из экзотической новинки в прагматичный инструмент для снижения операционных расходов (OPEX), что критически важно при долгосрочном планировании.

Такая энергоэффективность в сочетании с высокой плотностью вычислений породила совершенно новый сегмент рынка, который аналитики окрестили Суверенным ИИ. Правительства стран, обладающих амбициями и капиталом, больше не хотят арендовать вычислительные мощности у американских облачных гиперскейлеров, опасаясь зависимости, отключений или утечек чувствительных данных. Они стремятся владеть собственной инфраструктурой, печатным станком интеллекта, расположенным в своей юрисдикции и работающим по своим законам. Cerebras идеально вписалась в эту нишу: вместо строительства гигантского кампуса с тысячами серверов и сложной сетевой топологией, государство может развернуть компактный кластер, обеспечивающий национальный уровень вычислений под ключ.

Логика суверенизации движет не только арабскими шейхами из G42, но и новыми, неожиданными игроками на технологической карте. Ярким подтверждением тренда стала сделка, заключенная в ноябре 2025 года с правительством Гайаны. Эта южноамериканская страна, переживающая стремительный экономический рост благодаря нефтяному буму, решила инвестировать сверхдоходы в создание национальной ИИ-инфраструктуры именно на базе чипов Cerebras. Подобные контракты доказывают, что модель работает: технология выходит за пределы корпоративных дата-центров Кремниевой долины и становится инструментом государственного строительства, позволяя странам создавать собственные, полностью изолированные и контролируемые экосистемы ИИ.

Инвестиция в эпоху неопределенности

В 2023 году, когда я только формировал инвестиционную позицию по Cerebras Systems, эта ставка выглядела как классический венчурный риск: поверит ли рынок в экзотическую архитектуру, идущую вразрез с общепринятыми стандартами?

К концу 2025 года ответ получен, и он оказался сложнее любого линейного прогноза. Технологическая гипотеза полностью подтвердилась: подход wafer-scale доказал свою жизнеспособность, перестав быть инженерным курьезом и превратившись в основу для национальной инфраструктуры. Рынок действительно начал дробиться, и эра универсальности, когда один тип чипов решал все задачи, подошла к концу. Теперь для каждой задачи есть свой инструмент: Nvidia остается королем универсальных вычислений, Groq занимает нишу сверхбыстрого инференса, а Cerebras становится безальтернативным выбором для тяжелых тренировок и суверенных дата-центров.

Однако финансовый успех компании теперь зависит не столько от качества кремния, сколько от настроений в Вашингтоне. История с отложенным IPO и вниманием CFIUS показывает, что Cerebras переросла статус простого производителя электроники и вошла в зону стратегических интересов национальной безопасности. Для инвестора это меняет профиль риска: вместо вопроса «Взлетит ли технология?» на первый план выходит вопрос «Разрешат ли ей летать?». Закрытый в 2025 году раунд на $1,1 млрд и агрессивная риторика CEO Эндрю Фельдмана говорят о том, что компания готова играть в долгую, используя частный капитал как подушку безопасно��ти, пока юристы распутывают геополитический узел.

В сухом остатке мы видим актив, который стал заложником собственного успеха и масштаба. Cerebras – это уже не стартап, пытающийся бросить вызов Голиафу, а полноценный инфраструктурный игрок, построивший свою отдельную железную дорогу. По ней уже движутся составы с миллиардными контрактами, и единственное, что может их остановить – не конкуренция со стороны Nvidia, а красный сигнал семафора от американского регулятора. Для тех, кто готов ждать смены политического сигнала, это, возможно, самая интригующая история на современном рынке полупроводников.

И к слову: я веду блог о технологичных компаниях, которые привносят в мир инновации, и успешно реализуют себя на бирже, на pre-IPO и IPO-стадиях и рассказываю где их можно купить.

А с вами был Александр Столыпин.
Увидимся в будущем!

*Компания Meta Признана экстремистом в РФ

Комментарии (3)

kryvichh
08.12.2025 08:22
#29221376
Не совсем понятно, как IPO компании Cerebras повысило бы риски утечки технологий в Китай? Та же Nvidia торгуется на бирже, и тем не менее они подчиняются американскому регулятору.

Тем более это не такой и рокет-сайенс. Активно разрабатываются фотонные и квантовые вычисления, и это будет гораздо круче и энергетически эффективнее и решений Cerebras, и NVidia.
1. onlyahead Автор
  08.12.2025 08:22
  #29221426
  Попробую ответить на оба вопроса: первый сложнее, но я его постарался подробно описать в статье.
  
  Про IPO и риски. Дело не в самом факте торгов на бирже, а в структуре бизнеса, ведь у Nvidia диверсифицированный портфель клиентов. У Cerebras 85% выручки и миллиардные инвестиции зависят от одного игрока (Арабский G42). Регулятор (в их случае CFIUS) увидел риск не в публичности, а в том, что ключевой партнер (G42) может стать прокси для передачи технологий в Китай. Блокировка IPO - это способ давления: США требуют очистить цепочку поставок и капитал от связей с Китаем до того, как компания станет публичной. это вопрос контроля над единственным каналом сбыта.
  
  Теперь про фотонику и кванты. Звучит отлично в теории, но весь наш дьявол в таййминге. Квантовые вычисления пока не оптимизированы под матричные операции (основа LLM), а полностью фотонные процессоры все еще мягко говоря далеки от серийного производства масштаба Nvidia или Cerebras. Они решают проблему сегодняшнего дня: дефицит энергии и скорости для обучения моделей уровня GPT-5. Пока фотоника выйдет на коммерческую арену (в чём, я кстати, не сомневаюсь, и не отношу это к фантастике. вопреки очень распространённому мнению) индустрия успеет сжечь еще гигаватты электричества. Wafer Scale это решение здесь и сейчас. Мост в будущее с текущими знаниями, пока мы ждем новой физики.

saag
08.12.2025 08:22
#29221656
У такой пластины должен быть медный блин радиатора охлаждения с двумя ручками, а еще смеялись над советскими микросхемами:-)