Основатель DeepSeek, «техно-безумец», угрожает доминированию США в гонке ИИ / forpes.ru

Главная
Основатель DeepSeek, «техно-безумец», угрожает доминированию США в гонке ИИ

Основатель DeepSeek, «техно-безумец», угрожает доминированию США в гонке ИИ +1

14.05.2025 05:28

nikolz 7 5100 Источник

Внезапное появление этой компании показывает, что китайская промышленность процветает, несмотря на попытки Вашингтона замедлить её развитие.

Основатель DeepSeek Лян Вэньфэн встретился с председателем КНР Си Цзиньпином в Пекине в феврале.
*Фотограф: Флоренс Ло/Reuters*

Из-за своего худощавого телосложения и сдержанного стиля общения Лян Вэньфэн на встречах может показаться застенчивым или даже нервным. Основатель DeepSeek — китайского стартапа, который недавно перевернул мир искусственного интеллекта, — склонен к сбивчивой речи и продолжительным паузам. Но новые сотрудники быстро учатся не принимать его задумчивость за робость. Как только Лян воспринимает детали обсуждения, он задаёт точные, сложные для ответа вопросы об архитектуре модели, затратах на вычисления и других тонкостях систем ИИ DeepSeek.

Сотрудники называют Лян lǎo bǎn, или «босс», что является общепринятым знаком уважения к начальству в Китае. Необычным является то, насколько сильно их lâobân вдохновляет молодых исследователей и даже стажёров браться за крупные экспериментальные проекты, регулярно заглядывая к ним в кабинет, чтобы узнать новости, и подталкивая их к рассмотрению необычных инженерных решений. Чем более технический разговор, тем лучше, особенно если он приводит к реальному повышению производительности, о чём Лян лично рассказал на их внутреннем канале Lark. «Он настоящий ботаник», — говорит один из бывших сотрудников DeepSeek, который, как и многие другие люди, давшие интервью для этой статьи, попросил об анонимности, потому что не имел права публично говорить о компании. «Иногда мне казалось, что он понимает исследования лучше, чем сами исследователи».

Лян и его молодая компания стали известны на международном уровне в январе, когда выпустили R1 — модель ИИ, которая произвела фурор. R1 обошла доминирующих западных игроков в нескольких стандартизированных тестах, которые обычно используются для оценки эффективности ИИ, но DeepSeek утверждала, что построила свою базовую модель примерно за 5% от предполагаемой стоимости GPT-4 — модели, лежащей в основе ChatGPT от OpenAI.

Результаты тестирования привели к падению цен на рынках США на 1 триллион долларов и вызвали острые вопросы о стратегии США по использованию экспортного контроля для замедления развития ИИ в Китае. Amazon и Microsoft поспешили добавить модели DeepSeek в свои облачные сервисы наряду с конкурентами из Meta и Mistral AI. «По сути, за выходные интерес к DeepSeek вырос настолько, что мы начали действовать», — говорит Атул Део, который курирует рынок языковых моделей Amazon.com Inc.

DeepSeek прочистил затуманенное окно, через которое американцы смотрели на китайскую индустрию искусственного интеллекта: окутанную тайной, которую легче представить в виде преувеличенного призрака, но, скорее всего, более пугающую, чем они готовы признать. До появления этого стартапа многие американские компании и политики придерживались утешительной мысли, что Китай всё ещё значительно отстаёт от Кремниевой долины, что давало им время подготовиться к возможному равенству или помешать Китаю когда-либо его достичь.

Реальность такова, что Ханчжоу, где базируется DeepSeek, и другие китайские центры высоких технологий кишат маленькими драконами ИИ, как часто называют стартапы в сфере ИИ. Популярность сложных чат-ботов от местных стартапов, таких как MiniMax и Moonshot AI, стремительно растёт, в том числе в США. Семейство больших языковых моделей Qwen от Alibaba Group Holding Ltd. стабильно занимает верхние строчки в рейтингах LLM от Google и Anthropic; генеральный директор Baidu Inc. Робин Ли в апреле хвастался, что поисковый гигант может разрабатывать модели, которые не уступают DeepSeek, но стоят даже дешевле благодаря новому суперкомпьютеру, собранному на собственных чипах. Компания Huawei Technologies Co. также получает похвалу за продукты, которые она разработала для конкуренции с оборудованием компании Nvidia Corp., чьи графические процессоры (GPU) используются в самых передовых моделях искусственного интеллекта в США и Европе.

Примечание: Chatbot Arena — это платформа с открытым исходным кодом для оценки ИИ с помощью человеческих предпочтений, разработанная исследователями из LMArena

Не так давно Коммунистическая партия Китая подрезала крылья тому, что, по её мнению, вышло из-под контроля, — технологическому сектору. Были инициированы антимонопольные расследования и проверки на соответствие требованиям к данным, такие знаменитости, как соучредитель Alibaba Джек Ма, исчезли из поля зрения общественности, а на социальные сети, экономику свободного заработка и игровые приложения были наложены новые ограничения. Теперь КПК поддерживает отечественную технологическую отрасль перед лицом иностранного вмешательства. Президент Си Цзиньпин направляет ресурсы на развитие искусственного интеллекта и полупроводников, поощряя высококвалифицированных специалистов в Китае и призывая к созданию «независимой, контролируемой и совместной» экосистемы программного и аппаратного обеспечения.

По иронии судьбы, недавние успехи Китая также обусловлены геополитическими ограничениями, направленными на замедление развития его ИИ. Вэй Сун, аналитик Counterpoint Technology Market Research, говорит, что разрыв в развитии ИИ между США и Китаем теперь измеряется месяцами, а не годами. «В Китае есть коллективная этика и готовность интенсивно работать, что приводит к превосходству в исполнении», — говорит Сун, отмечая, что вынужденная нехватка чипов Nvidia привела к появлению новых инноваций в области ИИ. «Эта динамика создаёт своего рода дарвиновское давление: выживают те, кто может делать больше с меньшими затратами».

Там, где Китай видит инновации, многие в США продолжают подозревать злоупотребления. В апрельском отчёте двухпартийного комитета Палаты представителей утверждалось, что между DeepSeek и правительством Китая существуют «значительные» связи, и делался вывод, что компания незаконно украла данные OpenAI и представляет «серьёзную угрозу» национальной безопасности США. Дарио Амодей, генеральный директор Anthropic, призвал к усилению экспортного контроля в США, утверждая в блоге на 3400 слов, что DeepSeek, должно быть, контрабандой провезла значительное количество графических процессоров Nvidia, в том числе самые современные H100. (Bloomberg News недавно сообщил, что власти США выясняют, не обошла ли DeepSeek экспортные ограничения, закупая запрещённые чипы через третьих лиц в Сингапуре.)

Посольство Китая назвало заявления комитета Палаты представителей «необоснованными». Компания Nvidia заявила, что чипы DeepSeek соответствуют требованиям к экспорту и что дополнительные ограничения могут пойти на пользу китайским полупроводникам. Представитель производителя чипов заявил, что принуждение DeepSeek к использованию большего количества чипов и сервисов из Китая «пойдёт на пользу Huawei и иностранным поставщикам инфраструктуры ИИ».

Компания, находящаяся в центре этих дебатов, по-прежнему остаётся загадкой. DeepSeek гордится тем, что её технология искусственного интеллекта находится в открытом доступе, но при этом ничего не рассказывает о своей внутренней работе или намерениях. Компания раскрывает сверхподробную информацию о своих исследованиях в публичных документах, но не предоставляет базовую информацию об общих затратах на создание своего ИИ, текущем составе своих графических процессоров или происхождении своих данных.

«Мы не знаем, каковы истинные мотивы DeepSeek. Это своего рода чёрный ящик»

Сам Лян давно известен как человек настолько необщительный, что некоторые лидеры китайской индустрии искусственного интеллекта в частном порядке называют его «технобезумцем» — вариация прозвища, которое дают эксцентричным предпринимателям с огромными амбициями. За последние 10 месяцев он не дал ни одного интервью прессе, и мало кто знал, как он выглядит, пока не появилась фотография его мальчишеского лица в очках во время недавнего совещания с премьер-министром Китая Ли Цяном. Лян и его коллеги не ответили на неоднократные запросы о комментариях к этой статье, за исключением автоматического ответа от одного из сотрудников, в котором говорилось, что запрос обрабатывается: «Спасибо за ваше внимание и подержку DeepSeek!» — говорилось в её электронном письме.

Лян Вэньфэн — Лян в январе.Источник: Zuma Press

Чтобы лучше понять, как работает компания и как она вписывается в более масштабные планы страны в области ИИ, Bloomberg Businessweek поговорил с 11 бывшими сотрудниками Liang’s, а также с более чем тремя десятками аналитиков, венчурных инвесторов и руководителей, близких к китайской индустрии ИИ.

Отсутствие публичного присутствия позволило критикам, таким как Амодей и глава OpenAI Сэм Альтман, заполнить пустоту клеветой, которая находит отклик у американской аудитории, склонной видеть в китайских технологиях скрытую угрозу. Но даже те, кто по-прежнему настороженно относится к DeepSeek, вынуждены признать неоспоримое мастерство его ИИ. Дмитрий Шевеленко, исполнительный директор Perplexity AI Inc., говорит, что ни одному сотруднику его компании, которая занимается разработкой поискового продукта на основе ИИ, не удалось связаться с кем-либо из DeepSeek. Тем не менее, Perplexity использует технологию DeepSeek, размещая её только на серверах в США и Европе и обучая её удалять любые наборы данных, указывающие на цензуру со стороны КНР. Perplexity назвала его R1 1776 (отсылка к году основания США), что Шевеленко описывает как дань уважения свободе. «Мы не знаем, каковы истинные мотивы DeepSeek, — говорит он. — Это своего рода чёрный ящик».

Компания DeepSeek предполагала, что её ИИ может вызвать обеспокоенность за рубежом. В виртуальной презентации, которую не заметили на конференции разработчиков Nvidia в марте 2024 года, Дели Чен, исследователь в области глубокого обучения в DeepSeek, рассказал о том, как ценности должны быть «отделены» от больших языковых моделей и адаптированы к разным обществам. На одном из слайдов Чен показал прототип DeepSeek для настройки этических стандартов, встроенных в чат-ботов, которыми пользуются люди разного происхождения. Одним нажатием кнопки разработчики могут установить законность таких вопросов, как азартные игры, эвтаназия, секс-работа, владение оружием, употребление каннабиса и суррогатное материнство. «Всё, что им нужно сделать, — это выбрать подходящие им варианты, и тогда они смогут пользоваться модельным сервисом, адаптированным специально под их ценности», — объяснил Чен.

Поиск таких эффективных обходных путей всегда был культурной нормой в DeepSeek. Лян и его друзья изучали различные технические дисциплины в Чжэцзянском университете в середине 2000-х годов — машинное обучение, обработку сигналов, электронику и т. д. — и, по-видимому, ради забавы (и, знаете ли, ради денег) разрабатывали компьютерные программы для торговли акциями во время мирового финансового кризиса.

После окончания учёбы Лян продолжил самостоятельно создавать системы для количественной торговли, заработав небольшое состояние, прежде чем объединиться с несколькими своими университетскими друзьями в Ханчжоу, где в 2015 году они запустили компанию High‑Flyer Quant.

В первых объявлениях о вакансиях говорилось о привлечении лучших специалистов из Google и Facebook, а также о поиске «гиков» в области математики и программирования с «необычным блеском» Шелдона, неуклюжего главного героя ситкома «Теория Большого взрыва». Они обещали бесплатные закуски, стулья «Херман Миллер», вечера покера, офисную культуру, которая позволяла носить футболки и тапочки, а также, с долей финтех-культуры, возможность работать с «милыми, тихими девушками, родившимися в 1990-х» и «остроумной богиней, вернувшейся с Уолл-стрит».

Пекинский офис DeepSeek.Фотограф: Питер Каттералл/AFP/Getty Images

Как и в случае с DeepSeek, High-Flyer культивировал атмосферу таинственности — в своём первом посте в социальных сетях Лян упоминался только как «мистер Л» — и в то же время стремился к своего рода «докажи-что-говорю» прозрачности. Каждую пятницу High-Flyer публиковал графики доходности своих 10 оригинальных фондов в китайском суперприложении WeChat. До того, как летом 2016 года еженедельные данные стали доступны только зарегистрированным инвесторам, средняя годовая доходность портфеля составляла 35%.

В конечном итоге в активы High-Flyer поступили миллиарды долларов, а инвестиционно-исследовательская группа выросла до более чем 100 сотрудников. В 2019 году Лян начал активно набирать сотрудников в подразделение искусственного интеллекта, чтобы анализировать огромные массивы данных и выявлять недооценённые акции, незначительные колебания цен для высокочастотной торговли и макротренды, которые упускали из виду отраслевые инвесторы. К началу пандемии Covid-19 он и его команда создали высокопроизводительную вычислительную систему из взаимосвязанных процессоров, работающих в тандеме. Такая система называется кластером. Для этого кластера High-Flyer, по его словам, приобрела 1000 чипов Nvidia 2080Ti, которые обычно используются геймерами и 3D-художниками, и ещё 100 графических процессоров серии Volta. (Графический процессор Volta, также известный как V100, был первым процессором Nvidia, оптимизированным для ИИ.) В то время как предыдущей, более компактной вычислительной архитектуре High-Flyer требовалось два месяца для обучения новой модели экономического анализа, новому оборудованию требовалось менее четырёх дней для обработки того же объёма данных.

Эти финансовые модели были впечатляющими, но гораздо менее масштабными, чем универсальные модели, которые создавали в США такие компании, как OpenAI. Лян настаивал на создании значительно более мощного суперкомпьютера, состоящего из новых на тот момент графических процессоров Nvidia A100, усовершенствованной версии V100. Бывший инженер High-Flyer, участвовавший в проекте, говорит, что Лян был «самым активным пользователем» растущего кластера. По его оценкам, 80% вычислительной мощности, используемой для разработки моделей, приходилось на его имя пользователя. Этот бывший инженер говорит, что Лян, казалось, был одержим глубоким обучением, называя его «своим дорогим хобби». Вкладывать сотни миллионов долларов в такую инфраструктуру ИИ, вероятно, было чрезмерной роскошью для финансовой компании, но Лян получал более чем достаточную прибыль, чтобы позволить себе это. «В то время для Ляна это были небольшие деньги, — вспоминает инженер. — Больше вычислительной мощности, более качественные модели, больше прибыли от торговли».

По крайней мере, на это была надежда. Компания High‑Flyer, которая на тот момент управляла активами на сумму около 14,1 миллиарда долларов, принесла извинения в письме от декабря 2021 года заинтересованным сторонам за череду неутешительных результатов. Компания обвинила в спаде свои системы искусственного интеллекта, которые, по её словам, делали удачные инвестиции, но не смогли вовремя выйти из этих сделок из-за волатильности, вызванной пандемией. Несмотря на это, компания решила буквально удвоить инвестиции в ИИ: в январе 2022 года High-Flyer сообщила в социальных сетях, что приобрела 5000 процессоров Nvidia A100, каждый из которых обычно стоит десятки тысяч долларов. В марте компания объявила, что этот кластер расширился до 10 000 процессоров, всего за шесть месяцев до того, как Nvidia предупредила, что новые ограничения США могут повлиять на экспорт таких процессоров в Китай.

Неясно, какая часть этой инфраструктуры в конечном итоге предназначалась для количественной торговли, а какая — для дорогостоящего хобби Лянга. Следующей весной, примерно через пять месяцев после того, как OpenAI представила ChatGPT, он выделил DeepSeek в независимую исследовательскую лабораторию. В отдельных офисах в Ханчжоу и Пекине финансы больше не были в центре внимания. В манифесте, изобилующем банальностями, High-Flyer поклялся избегать посредственности и решать самые сложные задачи, связанные с революцией ИИ. Его конечная цель — искусственный общий интеллект.

В течение 2023 года лаборатория DeepSeek работала над созданием ИИ-помощника по написанию кода, чат-бота с общими знаниями и генератора 3D-изображений из текста. Лян привлёк инженеров из High-Flyer и нанял ещё больше специалистов из пекинского офиса Microsoft Corp. и ведущих китайских технологических компаний и университетов. Бо «Бенджамин» Лю, который в сентябре того же года присоединился к компании в качестве студента-исследователя, прежде чем начать работу над докторской диссертацией, говорит, что Лян часто поручал стажёрам важные задачи, которые в других местах выполняли бы старшие сотрудники. «Возьмём меня в качестве примера: когда я пришёл в компанию, никто не работал над инфраструктурой RLHF» — инфраструктурой, необходимой для поддержки важной технологии, известной как обучение с подкреплением на основе обратной связи от человека, — «поэтому он просто позволил мне это сделать, — говорит Лю. — Он доверит вам делать то, чего никто раньше не делал». (Это доверие принесло DeepSeek дополнительную выгоду: компания платила стажёрам 140 долларов в день и предоставляла ежемесячную субсидию на жильё в размере 420 долларов. Это щедрое вознаграждение в Китае, но примерно треть от того, что получают стажеры в компаниях, занимающихся искусственным интеллектом, в США, и крошечная доля от того, что зарабатывают штатные инженеры в Кремниевой долине.)

По словам двух бывших исследователей DeepSeek, Лян с самого начала сделал огромную ставку на sparsity - методику более эффективного обучения и проведения LLM за счет разделения их на специальности. Когда вы задавали вопрос первоначальному участнику ChatGPT, весь его LLM-мозг активизировался, чтобы определить идеальный ответ, независимо от того, просили ли вы сумму 2 + 2 или рецепт пирога. Разреженная модель, напротив, позволила бы лучше использовать ресурсы, будучи разделенной на "экспертов”, при этом только релевантные из них активировались бы в ответ на любое конкретное приглашение.

Редкий подход может привести к огромной экономии на вычислительных затратах, но он становится чрезвычайно сложным. Если вопрос не обрабатывается достаточным количеством мозговых контуров или отправляется не в те доли мозга, качество ответа ухудшится. (Например, математический мозг знает, как использовать число Пи в формуле, но не знает, что входит в рецепт пирога.) Лян увидел прогресс в этой области у Google и французского «единорога» Mistral, которые в декабре 2023 года выпустили разреженную модель, разделённую на восемь экспертов, при этом каждый запрос активировал двух наиболее релевантных экспертов в зависимости от контекста. Он сплотил свою команду для разработки моделей с большим количеством экспертов, что потенциально может привести к усилению галлюцинаций и фрагментации знаний ИИ. «Это вызвало серьёзные внутренние дебаты», — говорит бывший сотрудник DeepSeek.

За этим последовали и другие прорывы, каждый из которых публиковался и привлекал всё больше внимания китайских конкурентов. Затем, в конце 2024 года, DeepSeek выпустила V3, модель ИИ общего назначения, которая была примерно на 65% больше, чем аналог Meta Platforms Inc., который на тот момент был самой большой доступной моделью LLM с открытым исходным кодом. Но именно длинная исследовательская статья о V3 привлекла внимание руководителей Google, OpenAI и Microsoft примерно за месяц до того, как DeepSeek стала широко известна благодаря своей модели R1. Одна шокирующая статистика, которая бросилась в глаза в PDF-файле: DeepSeek подразумевал, что общая стоимость разработки V3 составила всего 5,6 миллиона долларов. Скорее всего, эта сумма относится только к финальному этапу обучения — процессу доработки данных, который превращает предыдущие прототипы модели в полноценный продукт, — но многие восприняли это как безумно низкий бюджет для всего проекта. Для сравнения: совокупное обучение самых передовых моделей может стоить 100 миллионов долларов и более. Амодей из Anthropic даже предсказал (ещё до появления DeepSeek), что обучение каждой модели следующего поколения будет стоить от 10 до 100 миллиардов долларов.

Леандро фон Верра, руководитель отдела исследований популярной платформы искусственного интеллекта Hugging Face Inc., которая составляет рейтинги LLM, говорит, что «архитектурная инновация» DeepSeek — не самое поразительное в этой модели. Самым большим открытием, которое он сделал, ознакомившись с исследовательской работой, стало то, что компания, должно быть, разработала высококачественные данные — либо тщательно очищенные из интернета, либо полученные другими способами, — чтобы воплотить V3 в жизнь. «Без очень мощных наборов данных моделям будет не хватать производительности», — говорит фон Верра. «Из отчёта становится ясно, что у DeepSeek один из лучших наборов данных для обучения LLM. К сожалению, в отчёте набор данных занимает половину страницы из 50 страниц».

DeepSeek быстро развивался, потому что Лян считал открытый исходный код неотъемлемой частью своей философии. Он считал, что сокрытие запатентованных технологий и взимание платы за мощные модели — подход, принятый ведущими американскими лабораториями, включая OpenAI и Google, — ставит краткосрочное преимущество выше долгосрочного успеха. Сделать свои модели полностью общедоступными и по большей части бесплатными было самым эффективным способом для DeepSeek ускорить внедрение и привлечь стартапы и исследователей, которые могли бы использовать его технологии. Лян надеялся, что это запустит маховик потребления продукта и обратной связи. Как DeepSeek написала в объявлении о своём первом публичном LLM почти два года назад, процитировав изобретателя операционной системы Linux с открытым исходным кодом: «Слова ничего не стоят, покажите мне код».

«По сути, им не нужны эти деньги. Из-за всей этой шумихи вокруг «Шести маленьких драконов» люди бросают им деньги»

В пасмурное апрельское воскресенье в оживлённом международном аэропорту Сяошань в Ханчжоу прибывающих встречают цифровые рекламные щиты, рекламирующие услуги искусственного интеллекта от Alibaba, ByteDance и Huawei. В современном терминале робот-гуманоид с синими волосами приветствует пассажиров взмахом руки. Снаружи стартап по производству беспилотных автомобилей тестирует небольшие беспилотные грузовики для перевозки грузов по взлётно-посадочной полосе. Несмотря на шумиху вокруг DeepSeek, жители Запада, кажется, забывают, что это лишь один из многих драконов искусственного интеллекта, поднимающихся над многочисленными китайскими аналогами Кремниевой долины. В одном только Ханчжоу, мегаполисе с населением 12,5 миллионов человек, DeepSeek входит в элитную группу технологических стартапов, известных как «Шесть маленьких драконов».

В живописном районе Уэст-Лейк находится Game Science, популярная студия, создавшаяBlack Myth: Wukong, самую продаваемую игру в жанре экшн, которая прославилась использованием методов машинного обучения для придания компьютерным персонажам большей реалистичности. Неподалёку находятся две робототехнические компании и «единорог», специализирующийся на 3D-пространственном программном обеспечении. Также неподалёку находится компания Zhejiang Qiangnao Technology Co., которая известна как BrainCo и представляет собой китайскую версию Neuralink Corp. Это можно проследить на примере стартапа, созданного в Гарвардском университете аспирантом китайского происхождения Бичэн Ханом, который сейчас разрабатывает бионические конечности и технологии для управления компьютерами с помощью мозговой активности в своей дочерней лаборатории в Ханчжоу. Одна из протезных рук BrainCo с искусственным интеллектом в настоящее время выставлена в выставочном центре China Artificial Intelligence Town, ещё одном развивающемся технологическом центре в Ханчжоу.

По словам человека, присутствовавшего на одной из сессий, в последние недели руководители BrainCo проводили экскурсии по выставке. Посетители часто хотят инвестировать, но, судя по всему, эти умники не слишком нуждаются во внешнем капитале. «По сути, им не нужны деньги, — говорит управляющий фондом, который посетил экскурсию. — Из-за всей этой шумихи вокруг «Шести маленьких драконов» люди бросают им деньги».

За всеми этими стартапами стоит правительство президента Си Цзиньпина. Генеративный искусственный интеллект, робототехника и другие высокотехнологичные разработки определяют государственную повестку, которая в первую очередь направлена на «самостоятельность и укрепление» страны, как выразился Си Цзиньпин на недавнем заседании Политбюро, согласно официальному китайскому информационному агентству «Синьхуа». «Мы должны признать недостатки и удвоить наши усилия, чтобы всесторонне продвигать технологические инновации, промышленное развитие и приложения на основе искусственного интеллекта».

Драконы прислушиваются, и не все они такие маленькие. Главный кампус конгломерата Alibaba стоимостью 300 миллиардов долларов, обширная территория с собственным озером, находится в районе Ханчжоу примерно в 40 минутах езды на машине к западу от Западного озера. Недавно компания пообещала выделить 53 миллиарда долларов на строительство дополнительных центров обработки данных ИИ в ближайшие три года, и, как говорят, её новейшие флагманские модели Qwen3 конкурируют с DeepSeek по производительности и эффективности затрат. За пределами Китая Alibaba обычно воспринимается как компания, занимающаяся электронной коммерцией, но в 2022 году её подразделение, занимающееся искусственным интеллектом и облачными технологиями, было выделено в отдельный центр на окраине Ханчжоу. В конференц-залах большие экраны подсвечиваются «информацией об отрасли», которая обновляется каждые 72 часа и содержит сведения о последних достижениях конкурентов, таких как DeepSeek и OpenAI. В туалетах есть даже еженедельная обновляемая версия, напоминающая о том, что искусственный интеллект развивается, даже когда природа требует участия людей-технологов.

В апреле этого года Ма, неуловимый соучредитель Alibaba, который практически исчез во время подавления Коммунистической партией Китая технологического сектора страны почти пять лет назад, вновь появился в кампусе компании, чтобы отпраздновать 15-летие её облачного подразделения. В своей редкой речи Ма сказал, что хочет, чтобы ИИ служил людям, а не господствовал над ними, по словам нескольких человек, которые её видели. Участники, которые также смотрели прямую трансляцию из офисов в Гонконге и Токио, говорят, что были воодушевлены триумфальным возвращением Ма.

Это стало напоминанием о том, что такие звёзды технологического рока, как Ма, по-видимому, снова в фаворе у Коммунистической партии Китая, и к ним присоединяются такие перспективные молодые люди, как Лян, даже несмотря на то, что блеск технологических лидеров в США меркнет. В Китае растёт национальная гордость, и он стремится показать, что может преодолеть препятствия, созданные Западом. Джордж Чен, управляющий директор базирующейся в Гонконге консалтинговой компании Asia Group LLC, говорит, что ведущие китайские инженеры начали возвращаться домой после работы в США в Apple, Google, Microsoft и других ведущих компаниях. Хотя враждебное отношение со стороны администрации Трампа является частью этого, их также подталкивает ощущение, что реальная деятельность может переместиться на восток. «Кремниевая долина больше не является привлекательным местом для работы китайских специалистов», — говорит Чен.

Кай-Фу Ли, основатель другого китайского единорога, 01.AI, идет на шаг дальше. Сам ветеран Apple, Google и Microsoft, Ли говорит, что следующее поколение талантов не пойдет по его пути через американские компании, прежде чем создавать свои собственные в Китае. “Эти молодые инженеры по ИИ в основном доморощенные”, - говорит он. “Успех DeepSeek, наряду с успехом других новых стартапов в области искусственного интеллекта, мотивирует все больше молодых талантов участвовать в возрождении искусственного интеллекта в Китае”.

Лян Вэньфэн (в центре) на симпозиуме в Пекине в феврале. — Лян (в центре) на симпозиуме в Пекине в феврале.Фотограф: Флоренс Ло/Reuters

Ни одна технологическая компания в Китае сегодня не вызывает такого восхищения, как DeepSeek. Во время визита в Ханчжоу со своей семьёй в апреле 27-летний учёный-компьютерщик из Канады Кирби Фунг провёл для своей семьи экскурсию по альма-матер Лянга, Чжэцзянскому университету. Фунг учился там по программе обмена и хотел показать своим бабушке, дедушке и младшему брату, что он учился в том же месте, что и Лян. «Очень круто объяснять своим друзьям в Канаде, что парень, создавший DeepSeek, учился в моей школе», — говорит Фунг.

Туристы и инфлюенсеры из социальных сетей также регулярно посещают штаб-квартиру DeepSeek, расположенную в комплексе из четырёх башен с видом на знаменитый Великий канал в Китае. Туристы ищут Лян Цзюня в местных магазинах, в том числе в элитном ресторане в здании DeepSeek, где иногда обедают сотрудники. (Хозяйке приходится сообщать, что он никогда не заходит.)

Люди, знакомые с Лянгом, говорят, что он делит своё время между Ханчжоу и пекинским офисом DeepSeek, расположенным на пятом этаже стеклянной башни в местном технологическом центре. Там программисты в возрасте около 20 лет работают за столами с регулируемой высотой, а в кладовой есть энергетические напитки, лапша быстрого приготовления Kang Shi Fu и палочки лацяо. Там есть доска, на которой сотрудники могут оставлять заявки на дополнительную еду. «Я немного поправился после того, как несколько месяцев обедал и ужинал там», — говорит один недавно уволившийся исследователь.

Лян редко соглашается на встречи с посторонними, иногда даже появляясь в виде голографической проекции для тех немногих, кого он принимает. Он отклонил приглашение на влиятельный Парижский саммит по искусственному интеллекту в этом году, на который приехали Альтман из OpenAI, генеральный директор Alphabet Inc. и Google Сундара Пичаи и множество премьер-министров и президентов.

В то время как Китай празднует успех DeepSeek, США относятся к нему как к незнакомому организму, который таинственным образом появился в системе водоснабжения, и изучают его на предмет того, является ли он безвредным или злокачественным. Критики обвиняют DeepSeek в том, что он контролируется Коммунистической партией Китая, ворует данные о тренировках у американских конкурентов и участвует в какой-то масштабной шпионской кампании или психологической операции, направленной на подрыв гегемонии ИИ в Кремниевой долине. «DeepSeek — это прямая связь между американским технологическим сектором и государством слежки Коммунистической партии Китая, которая угрожает не только конфиденциальности американских граждан, но и нашей национальной безопасности», — говорит представитель комитета Палаты представителей США, расследующего деятельность DeepSeek.

DeepSeek, однако, позиционирует себя как обычный стартап — продукт «чистой гаражной энергии», как было сказано в февральской публикации на X. В конце концов, он работает в том же кампусе в Пекине, что и Google, недалеко от «Бургер Кинг» и двух «Тим Хортонс». То, что индустрия искусственного интеллекта до сих пор не обращала особого внимания на DeepSeek, не означает, что за кулисами происходит что-то подозрительное. «Мир ИИ не ожидал появления DeepSeek, — говорит Арно Бартелеми, партнёр венчурной компании Alpha Intelligence Capital, которая инвестировала в OpenAI и SenseTime. — А стоило бы».

Бартелеми говорит, что настоящий урок, который можно извлечь из DeepSeek, заключается в том, насколько эффективно китайские технологические компании превращают ограничения, в которых они работают, в преимущество. «В Китае много умных людей, которые внедрили множество инновационных решений с гораздо меньшими вычислительными требованиями», — говорит он.

Действительно, в мае 2023 года, по совпадению в том же месяце, когда была основана DeepSeek, генеральный директор Nvidia Дженсен Хуанг заявил Businessweek, что чрезмерное регулирование Китаем со стороны США только подтолкнёт его к тому, чтобы превзойти в инновациях тех, кто стоит у него на пути. Назвав экономическое влияние эффективным инструментом национальной безопасности, он подчеркнул, что непредвиденные последствия государственного вмешательства будут серьёзными. «Лишиться трети рынка технологической отрасли — это катастрофа, — сказал он, имея в виду риски, связанные с ограничением экспорта американских технологий в Китай. — Они будут процветать без конкуренции. Они будут процветать и экспортировать свои товары в Европу и Юго-Восточную Азию».

«Вы должны помнить о том, как далеко вы можете зайти в конкуренции, — продолжил Хуан. — Внезапно реакция становится очень непредсказуемой. Люди, которым нечего терять, реагируют весьма неожиданно».

Дженсен Хуан выступал на конференции Nvidia в марте. — Дженсен Хуанг из Nvidia заявил, что контроль над экспортом может в конечном итоге укрепить Китай.Фотограф: Дэвид Пол Моррис/Bloomberg

Комментарии (7)

cupraer
14.05.2025 05:56
#28301956
Очень надеюсь, что «lǎo» из «lǎo bǎn» произносится как «У́е».

HappyTorka
14.05.2025 05:56
#28302006
И США, и Китай, прекрасно понимают то, что, к о первый достигнет в этой отрасли, если можно так сказать сингулярности, тот и победит. Имхо

HabraReaderZH
14.05.2025 05:56
#28302584
Пока в США печатали бабки и думали о прибыли в Китае вложились в образование. И теперь вчерашние студенты проверяют на прочность гигантов LLM индустрии.

alexhu
14.05.2025 05:56
#28303274
В Китае растёт национальная гордость, и он стремится показать, что может преодолеть препятствия, созданные Западом.

Это мнение издательства блумберг, в реальности правят партийцы ( там при власти далеко не одна партия). А на встрече в феврале (фотография сверху статьи) как раз председатель мягко и отечески раздалбывал не понимающих реалии оболтусов, что бы они задумались о том, где они живут и почему так слабо прислушиваются к генеральной линии партии и так мало делают инноваций и научных прорывов. На встрече благодарили за нужные указания, а в реальности для начинающих стартапов не остаётся вариантов, кроме кремневой долины.
1. cupraer
  14.05.2025 05:56
  #28303670
  А есть хоть одна причина верить в то, что блумберг ошибается, а нойнейм из интернетов — прав?
  1. alexhu
    14.05.2025 05:56
    #28304426
    В статье блумберг пишется про угрозу возрождающегося дракона. а ситуация такова, что уже почти два года как это засыхающий дракон.
    
    Не так давно Коммунистическая партия Китая подрезала крылья тому, что, по её мнению, вышло из-под контроля, — технологическому сектору.
    
    Дискуссии по этом вопросу давно протекли из изолированного интернета, они сами называют это причиной отставания.

Entens
14.05.2025 05:56
#28305164
Chatgpt: Использование эмоционально заряженных выражений, противопоставление стран, акцент на успехах одной стороны и подчёркивание недостатков другой могут влиять на восприятие читателя и формировать определённое мнение. Важно подходить к таким материалам критически и учитывать возможные цели и мотивы их публикации.

Автор, не забывай, ты пишешь на хабре, а не на пикабу

Основатель DeepSeek, «техно-безумец», угрожает доминированию США в гонке ИИ +1

Комментарии (7)

cupraer

HappyTorka

HabraReaderZH

alexhu

cupraer

alexhu

Entens