Размышления об OpenAI / forpes.ru

Главная
Размышления об OpenAI

Размышления об OpenAI +8

16.07.2025 10:26

olegchir 3 1900 Источник

15 ИЮЛЯ 2025

Три недели назад я покинул OpenAI. Я присоединился к компании еще в мае 2024 года.

Хочу поделиться своими размышлениями, потому что вокруг OpenAI много шума, но мало рассказов из первых рук о том, каково это — работать там изнутри. Мало кто говорит, как всё это ощущается.

У Нэбила Куреши есть отличный пост «Размышления о Palantir», где он рассуждает о том, что делало Palantir особенным. Хочу сделать то же самое для OpenAI, пока впечатления еще свежи. Никаких коммерческих тайн здесь не будет — просто мысли об одной из самых интересных организаций в истории в крайне любопытное время.

Скажу сразу: никакой личной драмы в решении уйти не было — наоборот, я долго сомневался. Сложно делать прыжок от основателя стартапа к работе в компании на 3000 человек. Хочется начать что-то новое, хочется перезагрузиться.

Вполне возможно, что меня затянет обратно. Сложно представить, что можно создать что-то более значимое, чем AGI, а LLM — это явно технологическая инновация десятилетия. Мне повезло увидеть некоторые разработки изнутри и поучаствовать в запуске Codex.

Очевидно, это не мнение компании — это мои личные наблюдения. OpenAI — большое место, а это мой маленький и скромный взгляд на него.

Культура

Первое, что нужно знать об OpenAI — это приоритет скорости роста. Когда я присоединился, в компании было чуть больше 1000 человек. Год спустя — более 3000, и я был в топ-30% по стажу. Почти все в руководстве теперь делают кардинально другую работу, чем 2-3 года назад.

Естественно, при таком масштабировании все ломается: коммуникации, структура отчетности, процессы поставки продуктов, управление людьми, найм и так далее. Команды сильно различаются по культуре: одни спринтят на пределе постоянно, другие нянчатся с большими запусками, третьи работают в более размеренном темпе. Единого UX в OpenAI не существует, а исследования, прикладные разработки и выход на рынок работают с совершенно разными временными горизонтами.

Необычная особенность OpenAI в том, что всё, и я имею в виду ВСЁ, работает через Slack. Электронной почты нет. За все время я получил примерно 10 писем. Если вы неорганизованны, это будет невероятно отвлекать. Если настроите каналы и уведомления, станет вполне рабочим способом вести дела.

Shameless plug.
Подписывайтесь на мою телегу: @tg_1red2black.
Там есть всякое интересное про нейронки.

OpenAI невероятно децентрализована и организационно построена «снизу вверх», особенно в исследованиях. Когда я только пришел, стал спрашивать про план на следующий квартал. Ответ был: «такого плана не существует» (хотя теперь уже существует). Хорошие идеи могут прийти откуда угодно, и часто заранее неясно, какие из них окажутся наиболее плодотворными. Вместо грандиозного «мастер-плана» прогресс итеративный и открывается по мере того, как новые исследования приносят плоды.

Благодаря этой децентрализованной и построенной «снизу вверх» культуре, OpenAI очень меритократична. Исторически, лидеры в компании продвигаются в первую очередь на основе способности генерировать хорошие идеи и воплощать их. Многие невероятно компетентные лидеры в других компаниях никуда не продвинулись, потому что не очень хорошо выступали на общих собраниях и не очень любили политические играмы. В OpenAI это менее важно, чем в других компаниях. Лучшие идеи действительно побеждают.

Есть сильный фокус на активные действия (можно сразу делать, а не торчать на совещаниях). Нередко похожие, но не связанные команды сходились на одинаковых идеях. Я начал работать над параллельным (но внутренним) проектом, похожим на ChatGPT Connectors. Мы сделали, наверное, 3-4 разных прототипа Codex прежде чем решить, какой из них будем запускать в прод. Эти усилия обычно предпринимают несколько человек без спроса разрешения. Команды быстро формируются вокруг перспективных идей.

Андрей (лид Codex) говорил мне, что исследователей стоит воспринимать как «мини-директоров». Благом считается склонность работать над своим проектом и смотреть, что из него получится. Следствие: большинство исследований делается через увлечение исследователя конкретной проблемой. Если что-то считается скучным или «решенным», над этим, скорее всего, работать никто не будет.

Хорошие менеджеры-исследователи безумно влиятельны и при этом крайне редки. Лучшие умеют объединять разные доселе несвязанные исследовательские направления и собирать
из них модель, обученную более большим и важным вещам. То же касается отличных менеджеров проектов (PM).

EM-ы в ChatGPT (engineering managers, менеджеры инеженеров), с которыми я работал (Акшай, Риццо, Сулман), были одними из самых хладнокровных людей, которых я видел. Такое ощущение, как будто они в жизни уже все повидали. Большинство работали довольно автономно, но нанимали хороших людей и старались обеспечить им успех.

OpenAI меняет направление молниеносно. Это то, что мы очень ценили в Segment — гораздо лучше делать правильную вещь по мере получения новой информации, чем держаться курса просто потому, что таков план. Удивительно, что такая большая компания как OpenAI сохраняет этот подход — Google явно этого не делает. Компания принимает решения быстро, и решив двигаться в каком-то направлении, идет ва-банк.

На компанию обращено огромное внимание. Мне как человеку, привыкшему к B2B-энтерпрайзу это было шоком. Я регулярно видел новости в прессе о том, что еще не было объявлено внутри компании. Говорил людям, что работаю в OpenAI, и получал в ответ не обьективную реакцию на свои успехи, а уже сформированное мнение о компании. Несколько пользователей Twitter прямо сейчас держат армию ботов, которые читают наши твиты и пытаются догадаться, какую фичу OpenAI запустит следующей.

Как результат, OpenAI переполнена духом секретности. Я не мог рассказать никому подробности своей работы. Есть несколько рабочих пространств Slack с разными правами доступа. Данные по выручке и затратам охраняются особенно строго.

В OpenAI к задачам относятся намного более серьезно, чем можно ожидать, частично потому, что ставки очень высоки. С одной стороны, заявленная цель — создание AGI, и много что нужно сделать правильно. С другой стороны, мы строим продукт, которым сотни миллионов пользователей пользуются для всего — от простых медицинских советов до реальной терапии. С третьей стороны, компания конкурирует на самой большой арене в мире. Мы внимательно следили за Meta, Google и Anthropic — и я уверен, они делали то же самое. Все крупнейшие правительства в мире наблюдают за этой сферой с острым интересом.

Как бы OpenAI ни поносили в прессе, все, кого я встречал там, реально стараются делать правильные вещи. Учитывая потребительский фокус, это самая заметная из больших лабораторий, и следовательно, она получает больше всего критики.

При этом не стоит воспринимать OpenAI как единый монолит. Я думаю об OpenAI как об организации, которая начиналась как Лос-Аламос. Это была группа ученых и изобретателей, исследующих передний край науки. Эта группа случайно породила самое вирусное потребительское приложение в истории. А затем выросла — с амбициями продавать свое решение и правительству, и обычным людям. Сотрудники с разным стажем и из разных частей организации имеют очень разные цели и взгляды. Чем дольше вы там работаете, тем больше смотрите на вещи через призму «исследовательской лаборатории» или «некоммерческой организации, работающей во имя общего блага».

Больше всего я ценю то, что компания «идет своим путем» в плане распределения преимуществ ИИ. Передовые модели не зарезервированы для какого-то корпоративного уровня с годовым соглашением. Любой человек в мире может зайти в ChatGPT и получить ответ, даже не авторизовавшись. Есть API, который можно использовать после регистрации — а ведь большинство API моделей (даже самых современных или проприетарных) сразу же начинают использовать стартапы. А ведь всё могло бы быть совершенно иначе. OpenAI заслуживает огромной благодарности и признания за всё это — и что эти ценности все еще в ДНК компании.

Безопасность более приоритетна для OpenAI, чем можно подумать, читая Zvi или Lesswrong. Большое количество людей работает над развитием систем безопасности. Но учитывая природу OpenAI, я видел больше фокуса на практических рисках (разжигание ненависти, злоупотребления, манипулирование политическими предрассудками, создание биооружия, самоповреждения, prompt injection), чем на теоретических (взрыв интеллекта, стремление к власти). Это не значит, что никто не работает над последними — определенно есть люди, сосредоточенные на теоретических рисках. Но с моей точки зрения всё это не в фокусе. Большая часть работы не публикуется. Возможно, OpenAI действительно должна больше делать для её освещения и популяризации.

В отличие от других компаний, которые свободно раздают мерч на каждой ярмарке вакансий, OpenAI редко раздает что либо (даже новым сотрудникам). Вместо этого, иногда случаются «дропы», где можно заказать товары в наличии. Первый же такой дроп обрушил магазин Shopify, они не выдержали спроса. Был внутренний пост о том, как отправлять правильные json-запросы к сайту магазина, чтобы обойти эти проблемы.

Почти всё — погрешность по сравнению со стоимостью GPU. Чтобы дать представление: маленькая нишевая функция, построенная как часть продукта Codex, имела такие же затраты на GPU, как вся наша инфраструктура Segment (у нее был не тот масштаб, что у ChatGPT, но сквозь нее проходила приличная часть интернет-трафика).

OpenAI — возможно, самая пугающе амбициозная организация, которую я когда-либо видел. Можно подумать, что одного из топовых потребительских приложений планеты достаточно, но нет. У компании есть желание конкурировать в десятках других областей: API как продукт, глубокие исследования, железо, агенты для программирования, генерация изображений и еще несколько неанонсированных. Плодородная почва для воплощения идей!

Компания много внимания уделяет Твиттеру. Если вы твитнете что-то связанное с OpenAI, и твит станет вирусным, велики шансы, что кто-то прочитает и серьезно рассмотрит это. Мой друг шутил: «настроения в Твиттере — основное топливо для работы компании»! Для потребительской компании, возможно, это не так уж неправильно. Конечно, все еще нужно много аналитики по использованию, росту пользователей и удержанию — но вайбы в Твиттере примерно так же важны.

Команды в OpenAI гораздо более подвижны, чем в других местах. При запуске Codex нам нужна была помощь нескольких опытных инженеров ChatGPT, чтобы успеть к дате запуска. Мы встретились с несколькими EM-ами ChatGPT, чтобы попросить помощи. На следующий день у нас было два крутых человека, готовых погрузиться и помочь. Никакого «ожидания квартального планирования» или «перетасовки headcount». Все прошло очень быстро.

Ты часто видишь руководство и оно активно вовлечено в работу. Это может быть очевидно для такой компании как OpenAI, но каждый руководитель казался довольно включенным. Мы регулярно видели gdb, sama, kw, mark, dane и других в Slack. Свадебных генералов и заочных лидеров нет.

Код

OpenAI использует гигантский монорепозиторий, который написан в основном на Python (хотя есть растущий набор Rust-сервисов и несколько Golang-сервисов для таких вещей, как сетевые прокси). Это создает много странно выглядящего кода, потому что на Python можно писать очень по-разному. Вы столкнетесь и с библиотеками, созданными для максимального масштабирования 10-летними ветеранами Google, и с одноразовыми Jupyter-ноутбуками свежеиспеченных PhD. Практически все работает вокруг FastAPI для создания API и Pydantic для валидации. Обязательных правил по стилю кода не существует.

OpenAI запускает все на Azure. Смешно, что есть ровно три сервиса, которые я считаю надежными: Azure Kubernetes Service, CosmosDB (документное хранилище Azure) и BlobStore. Нет настоящих эквивалентов Dynamo, Spanner, Bigtable, Bigquery, Kinesis или Aurora. Из-за этого, ты реже думаешь в единицах автомасштабирования. Реализации IAM обычно гораздо более ограничены, чем в AWS. И есть сильная склонность к разработке собственных решений.

Если говорить о кадрах (по крайней мере, в разработке), есть большая текучка кадров из Meta в OpenAI (Meta — запрещенная в России организация!). Во многом, OpenAI напоминает раннюю Meta: сверхпопулярное приложение для потребителей, только-только зарождающаяся инфраструктура и желание двигаться максимально быстро. Большинство талантливых инфраструктурных инженеров, которых я там видел, пришли из Meta + Instagram, и были довольно сильными.

Сложите всё это вместе, и увидите множество ключевых частей инфраструктуры, которые напоминают решения Meta. Была даже внутренняя реимплементация TAO. Делались специальные усилия по консолидации auth identity на граничных серверах. Уверен, было множество других таких инициатив, о которых я не знаю.

Интеграция с чатом очень глубока. С тех пор как ChatGPT взлетел, много кодовой базы структурировано вокруг идеи чат-сообщений и диалогов. Эти паттерны настолько запечены в структуру и кодовую базу компании, что при попытке их игнорировать, никто вам не поможет, а проблем вы огребете знатных. Мы немного отклонились от этих механизмов в команде Codex (больше опираясь на уроки из responses API), но использовали много предыдущих наработок.

Код побеждает. Вместо центрального архитектурного или планирующего комитета, решения обычно принимает команда, которая собирается выполнять работу. Результат — сильный приоритет на реальные действия, частенько - изобретение дублирующих друг друга велосипедов. Я видел с полдюжины библиотек для таких вещей как управление очередями или управление циклом работы агентов.

Было несколько областей, где быстро масштабированная инженерная команда и недостаток инструментов создавали проблемы. sa-server (бэкенд-монолит) был чем-то вроде свалки. CI ломался чаще, чем можно ожидать — учитывая, что этот код заливается прямо в master-ветку. Тест-кейсы, даже работающие параллельно и учитывающие подмножество зависимостей, могли занимать ~30 минут на GPU. Это не нерешаемые проблемы, но хорошее напоминание, что такие проблемы есть везде, и они, вероятно, станут хуже при быстром масштабировании. К чести внутренних команд, много усилий идет на улучшение этой ситуации.

Другие вещи, которые я изучил

Что такое большой бренд для потребителей. Я не понимал этого до работы над Codex. Все измеряется в «про-подписках». Даже для такого продукта как Codex мы думали об онбординге в первую очередь относительно индивидуального использования, а не команд. Это немного сломало мой мозг, учитывая преимущественно B2B/энтерпрайз-бэкграунд. Включаешь фиче-флаг — и получаешь трафик с первого дня.

Как обучаются большие модели (на высоком уровне). Весь спектр от «экспериментов» до «инженерии». Большинство идей начинается как мелкомасштабные эксперименты. Если результаты выглядят многообещающе, их включают в более крупный релиз. Экспериментирование — это, в равной степени, настройка основных алгоритмов и настройка микса данных с тщательным изучением результатов. В большом масштабе релиз выглядит почти как инженерия больших распределенных систем. Будут странные крайние случаи и неожиданные вещи. Вам нужно их отладить.

Как делать математику на GPU. Нам нужно было спрогнозировать требования к пропускной способности для запуска Codex, и это был первый раз, когда я реально занимался бенчмарком GPU. Суть в том, что нужно начинать с требований к задержке (общая задержка, количество токенов, время до первого токена), а не делать анализ "снизу вверх" того, что GPU может поддерживать. Каждая новая итерация модели может кардинально изменить паттерны нагрузки.

Как работать в большой кодовой базе, написанной на Python. Segment была комбинацией микросервисов и была в основном на Golang и TypeScript. У нас не было такого спектра задач и объема кода, как у OpenAI. Я много узнал о том, как масштабировать кодовую базу вместе с ростом количества индивидуальных разработчиков. Нужно чаще подстраховываться и реализовывать идеи «работает по умолчанию», «держать master чистым» и «сложно использовать неправильно».

Запуск Codex

Большая часть моих последних трех месяцев в OpenAI была связана с запуском Codex. Это определенно один из ярких моментов моей карьеры.

Чтобы задать контекст: в ноябре 2024 OpenAI поставила цель на 2025 год запустить кодинг-агента. К февралю 2025 у нас было несколько внутренних инструментов, которые отлично использовали модели. И мы чувствовали давление запустить агента специально для программирования. Очевидно, модели достигли точки, где стали действительно полезными для кодинга (посмотрите на взрыв инструментов для вайб-кодинга на рынке!).

Я вернулся досрочно с отпуска по уходу за ребенком, чтобы поучаствовать в запуске Codex. Через неделю после возвращения у нас было (слегка хаотичное) слияние двух команд, и начался бешеный спринт. От старта (стартом будем считать первые строки реально написанного кода) до финиша весь продукт был построен всего за 7 недель.

Этот спринт по созданию Codex был, вероятно, самым напряженным периодом работы почти за десятилетие. Большинство ночей я работал до 11 вечера или до полуночи. Дома у меня новорожденный ребенок, а значит, просыпаться нужно вместе с ним в 5:30 каждое утро. Снова в офис к 7 утра. Работали на большинстве выходных. Мы все напряглись как команда, потому что каждая неделя была на счету. Напомнило мне времена YC.

Сложно переоценить, насколько невероятным был такой темп. Я не видел организаций больших или малых, которые бы шли от идеи до полностью запущенного + свободно доступного продукта в такие сроки. Масштаб тоже был не маленький: мы построили контейнерную среду выполнения, сделали оптимизации скачивания репозиториев, дообучили кастомную модель для работы с редактированием кода, обработали все виды git-операций, ввели совершенно новую поверхность API, включили доступ к интернету и получили продукт, который в целом был приятен в использовании.

Говорите что хотите, но у OpenAI все еще есть дух дикого стартапа.

Хорошая новость в том, что правильные люди могут творить чудеса. Мы были senior-командой из ~8 инженеров, ~4 исследователей, 2 дизайнеров, 2 маркетологов и одного проджект-менеджера. Без этой команды всё бы провалились. Никому не нужно было детально рассказывать, что им нужно делать. Но нужна была хорошая координация. Если вдруг посчастливится работать с кем-то из команды Codex, знайте: каждый из них — невероятный, фантастический человек.

Ночью перед запуском пятеро из нас не спали до 4 утра, пытаясь развернуть основной монолит (это многочасовое мероприятие!). Затем снова в офис к 8 утра на объявление запуска и прямую трансляцию. Мы включили фиче-флаги и стали наблюдать, как льется трафик. Никогда не видел продукт с таким моментальным всплеском просто от появления нового пункта меню в левой боковой панели. Такова сила популярности ChatGPT.

Что касается формы продукта, мы остановились на полностью асинхронном форм-факторе. В отличие от инструментов вроде Cursor (на тот момент, теперь поддерживает похожий режим) или Claude Code, мы нацелились на то, чтобы пользователи могли запускать задачи и позволить агенту работать в собственной среде. Наша ставка была на то, что в конце концов, пользователи должны относиться к кодинг-агенту как к коллеге: они отправляют сообщения агенту, он получает время на работу, а затем возвращается с готовым PR (pull request, запросом на слияние).

Это было сродни азартной игре! Сейчас мир в странном состоянии, где модели уже достаточно хороши, но не идеальны. Они уже могут работать минуты подряд, но еще не часы. У пользователей сильно различающиеся степени доверия к возможностям моделей. И мы даже не уверены, каковы истинные возможности этих моделей.

В долгосрочной перспективе я верю, что большинство программирования будет похоже на Codex. Пока что, интересно посмотреть, как сложится судьба существующих сейчас в этой области продуктов.

(удивительно, но) Codex действительно хорош в работе с большой кодовой базой и понимании того, как в ней ориентироваться. Самое больше различие, которое я видел по сравнению с другими инструментами, — способность запускать множество задач одновременно и сравнивать их результат.

Недавно видел, что есть публичные цифры, сравнивающие PR (pull requests, запросы на слияние), сделанные разными LLM-агентами. Только по публичным данным, Codex создал 630 000 PR. Это около 78 тысяч публичных PR на инженера за 53 дня с запуска (можете сами догадаться о множителе приватных PR). Не уверен, что когда-либо работал над чем-то настолько масштабным и значимым в жизни.

Последние мысли

Если честно, изначально я опасался работать в OpenAI. Не был уверен, каково это — пожертвовать свободой, иметь босса, быть гораздо меньшей частью гораздо большей машины. Не рассказывал об этом публично, вдруг это окажется неуместным.

Я хотел получить три вещи от этой работы:

развить интуицию о том, как обучаются модели и как развиваются их возможности
работать и учиться у потрясающих людей
запустить отличный продукт

Думаю, этот год работы в OpenAI — одно из лучших решений в жизни. Сложно представить, где еще можно было бы больше узнать.

Если вы основатель стартапа и чувствуете, что ваш стартап никуда не движется, вам стоит либо 1) глубоко переосмыслить, как можно делать еше больше попыток, либо 2) пойти в одну из больших лабораторий. Сейчас невероятное время для создания чего-то нового. И одновременно, невероятное время, чтобы заглянуть в будущее.

Как я вижу, путь к AGI — это гонка трех лошадей: OpenAI, Anthropic и Google. Каждая из этих организаций пойдет разным путем на основе своей ДНК (потребитель vs бизнес, vs мощной инфраструктуры + данных). Работа в любой из них будет крутым, расширяющим сознание опытом.

Комментарии (3)

Prikalel
16.07.2025 11:50
#28580736
ясно

Oceanshiver
16.07.2025 11:50
#28582122
Так а чего он ушел-то, раз так классно всё
1. olegchir Автор
  16.07.2025 11:50
  #28582868
  Выгорел, потому что хочется стабильности и планирования, а не дикого стартапа.

Размышления об OpenAI +8

Культура

Код

Другие вещи, которые я изучил

Запуск Codex

Последние мысли

Комментарии (3)

Prikalel

Oceanshiver

olegchir Автор