Мы в Beeline Cloud продолжаем рассказывать историю китайского опенсорса. В предыдущей статье мы поговорили о том, как Linux привезли в Поднебесную на дискетах и какую роль сыграли университеты в распространении открытого программного обеспечения.
Сегодня обсудим, как менялась китайская опенсорс-экосистема в период с 2010 по 2020 год, и что помогло стране догнать (и во многом опередить) западных коллег.

Опенсорс как новый опыт
В середине 2000-х экономика Китая стремительно росла; особенно заметен был подъем ИТ-сектора — во многом благодаря специалистам, вернувшимся из-за рубежа. Поменявшийся экономический и технологический климат подтолкнул профессионалов, ранее уехавших на Запад, к возвращению на родину. Среди них были такие известные фигуры, как основатели Baidu Робин Ли и Эрик Сю, а также Чжан Тун, бывший директор Big Data Lab, входящей в состав корпорации. Все они привезли с собой опыт и знания, полученные в США. При этом многие вернувшиеся запускали собственные стартапы: в период с 2000 по 2006 год в Китае ежедневно появлялись две новых ИТ-компании, основанные такими «репатриантами».
На фоне активной государственной поддержки и накопленного опыта сотрудников китайские интернет-компании быстро набирали обороты и наращивали аудиторию. Однако на тот момент их инфраструктура была построена в основном на решениях западных вендоров. Например, в Alibaba использовали стек IOE (IBM, Oracle, EMC) — «золотой стандарт», на который опирались многие ИТ-компании того периода. Очевидно, что стремительный рост пользовательской базы привел к увеличению расходов на содержание инфраструктуры, и бизнес начал переходить на открытые решения, чтобы сократить затраты и при этом не потерять в темпах роста.
Чтобы облегчить миграцию на опенсорс, корпорации приглашали специалистов с соответствующим опытом работы в западных организациях. Так, в той же Alibaba наняли специалиста из Microsoft Research Lab, который возглавил переход со стека IOE на открытые платформы. В итоге компания отказалась от вендорских серверных продуктов и выстроила систему хранения на базе MySQL. Новый стек оказался дешевле и проще в обслуживании, и уже в 2013 году в дата-центрах Alibaba отключили последний сервер IBM. Более того, компания продолжила развивать инфраструктуру на базе open source и нередко принимала решения, на которые конкуренты не осмеливались пойти. Так, в Alibaba стали использовать Kubernetes практически с первых дней его релиза. Тогда как конкурент компании — JD.com — начал внедрять этот оркестратор лишь спустя год после публикации исходников.
К середине 2010-х опенсорс стал неотъемлемой частью технологической стратегии ИТ-компаний в Китае. Практика привлечения зарубежных специалистов также закрепилась — в том числе в аппаратной сфере. Один из показательных примеров — проект Scorpio, в рамках которого Baidu, Alibaba и Tencent совместно с Intel, Dell и NVIDIA разрабатывали опенсорсные серверные стойки. Проект быстро разросся — к развитию стандартов питания и аппаратных интерфейсов добавилась работа над микромодульными дата-центрами — и к команде присоединилась Китайская академия информационных и коммуникационных технологий.
Помимо проекта Scorpio, в Alibaba вместе с западными коллегами работали над опенсорсным процессором Xuantie на базе открытой архитектуры RISC-V. Это был микрочип, ориентированный на использование в ИИ-системах и пограничных серверах для интернета вещей. В итоге проект привел к созданию одного из наиболее высокопроизводительных процессоров с архитектурой RISC-V на сегодняшний день.
Выход на Гитхаб
GitHub сыграл ключевую роль в развитии китайского опенсорса, став площадкой для обмена опытом с международным сообществом. Сегодня он остается одним из ключевых иностранных ресурсов, доступных в стране. В 2018 году Китай вышел на второе место по активности на площадке (если судить по количеству форков и коммитов). В 2020 году почти 10% из 56 млн контрибьюторов на GitHub были из Поднебесной. И даже на сегодняшний день список самых активных пользователей на площадке возглавляет разработчик из Китая. Неудивительно, что платформа стала домом для значимых проектов, созданных китайскими программистами.
Примером может быть распределенный аналитический движок Apache Kylin, представленный сотрудниками научно-исследовательской лаборатории шанхайского подразделения eBay. Проект выпустили в 2014 году под лицензией Apache 2.0, а в 2015 он добрался до «высшего уровня» в фонде Apache Software [проекты высшего уровня — это зрелые проекты, обладающие активным сообществом и прошедшие «инкубатор» Apache]. Сегодня Apache Kylin используется крупными компаниями за пределами Китая — например, Amazon и другими.
Еще один примечательный азиатский проект из экосистемы Apache — SkyWalking. В 2015 году разработчик Шен Ву задумал создать инструмент, который помог бы ему скоординировать деятельность шести поставщиков китайского телеком-гиганта China Unicom (он задумывался как пет-проект, на основе которого его знакомый мог бы научиться программированию). Но в итоге Ву написал распределенную систему мониторинга производительности приложений, которую теперь используют компании разных масштабов — вплоть до Huawei и Alibaba.
Среди заметных китайских разработок на GitHub числятся несколько СУБД. Например, TiDB, которая является одним из самых быстрорастущих китайских проектов. Ее разработали специалисты стартапа PingCAP, основанного выходцами из азиатских корпораций. К 2018 году молодая компания, по сути, стала китайским Oracle — за рубежом ее продукты используют в Pinterest, Plaid, Bolt.
Еще один примечательный проект в этой сфере — OceanBase — разработка Alibaba, возникшая в период отказа от инфраструктуры IBM. В 2019 проект побил рекорд бенчмарка TPC-C (нужен для проверки скорости OLTP-аналитики), став самой производительной СУБД в мире. Проект передали в open source, чтобы развивать его совместно с комьюнити — в компании считали, что не смогут самостоятельно раскрыть весь его потенциал. Вскоре OceanBase у себя внедрили филиппинский сервис мобильных платежей GCash и китайская платежная платформа Alipay.
Открытые сообщества закрепили результат
Несмотря на большое количество тематических сообществ пользователей Linux, о которых мы рассказывали в прошлый раз, в Китае долгое время не хватало действительно крупного комьюнити, которое могло бы стать центром притяжения для разработчиков open source. Ситуация изменилась в 2014 году с появлением добровольческой организации Kaiyuanshe, которая занялась системным продвижением принципов открытого кода в стране. Его участники проводили конференции, посвященные открытой разработке, куда съезжались ведущие спикеры из индустрии: от представителей Linux Foundation до генерального директора GitHub.

Со временем организация стала медиатором между китайской и международной open source-экосистемами. Представители сообщества регулярно выпускают отчеты о развитии опенсорса в Азии, помогают зарубежным разработчикам лучше понять китайский рынок, а внутри страны — обучают коллег базовым практикам открытой разработки: как правильно обращаться с пул-реквестами, строить сообщества вокруг проектов. Комьюнити Kaiyuanshe постепенно стало международным: к нему присоединились разработчики из Японии, Тайваня и Польши. Уже в 2016 году организация стала членом Open Source Initiative. Джек Ю — один из учредителей Kaiyuanshe и руководитель Ubuntu Kylin называл это большим шагом для организации: «Теперь мы сможем активнее вкладываться [в открытую среду] и наводить мосты между Китаем и международным сообществом». Kaiyuanshe продолжает действовать и сегодня — ее волонтеры помогали составлять лицензии для ИИ-систем вроде DeepSeek, QWEN и Kimi, а также давали их создателям советы, как продвигать свои продукты за пределами Китая.
Kaiyuanshe был не первым, но наиболее крупным и успешным сообществом, но были и другие — например, OSChina, сформированное в 2008 году. Его участники запустили базу данных, включающая более 100 тыс. опенсорсных проектов со всего мира, но по-настоящему внимание к сообществу привлек запуск сервиса Gitee — альтернативы GitHub — в 2013 году. Позже на ее основе начали строить независимую национальную платформу для хостинга открытого исходного кода. В каком-то смысле, это попытка правительства сократить зависимость китайских разработчиков от GitHub на случай ограничений. Об этих и других государственных инициативах, а также активном развитии китайских больших языковых моделей поговорим в следующей — заключительной в серии — статье.
Beeline Cloud — безопасный облачный провайдер. Разрабатываем облачные решения, чтобы вы предоставляли клиентам лучшие сервисы.
Что еще почитать в нашем блоге на Хабре и на нашей DIY-площадке:
spagetti3d
Статистика по GitHub показывает рост вклада китайских разработчиков. Стоило бы дополнить её данными по языкам программирования или доменам AI, DB, cloud, чтобы картина была объёмнее
beeline_cloud Автор
Спасибо! В следующей части как раз будет фокус на системах ИИ и проч., в том числе с наиболее актуальной статистикой.