Что бы я сделал, если бы сегодня начинал учить Data Science / ML? / forpes.ru

Главная
Что бы я сделал, если бы сегодня начинал учить Data Science / ML?

Что бы я сделал, если бы сегодня начинал учить Data Science / ML? +34

15.06.2025 19:15

boterxxx 39 22000 Источник

Machine Learning и Data Science — это одни из самых популярных и востребованных направлений в IT. Но вместе с этим — они и одни из самых сложных для входа. Здесь огромное количество тем, инструментов, библиотек, подходов и постоянно появляющихся технологий.

Из-за этого многие новички начинают обучение с энтузиазмом, но через пару месяцев теряют интерес. Причины могут быть разные: слишком много теории, мало практики, нет чёткого плана или понимания, зачем вообще всё это нужно.

Эта статья — не очередной «гайд по ML для новичков». Это мой личный взгляд на то, как бы я подошёл к обучению, если бы начинал с нуля уже сегодня , учитывая свой опыт работы в крупных компаниях, проваленные проекты, ошибки и победы.

Кратко об авторе

Я уже успел отработать в Яндексе, ВК, Сбере, отучиться в МФТИ и на протяжении всей карьеры занимаюсь компьютерным зрением и ML. В начале пути наделал уйму ошибок:

Долго не мог определиться с направлением
Вообще не понимал, что от меня буду ждать на собесах
Боялся конкуренции: казалось, что вакансий мало, а требования слишком высоки для новичков
Разочарование, когда казалось, что я ничему не научился за последние несколько месяцев

Именно поэтому я решил написать эту статью — чтобы поделиться своим опытом и показать, как можно начать с нуля и дойти до реальной работы , минуя типичные ловушки.

Определись с мотивацией

Первое, что нужно сделать, прежде чем погружаться в Machine Learning или Data Science — понять свою цель. Это одна из самых бурно развивающихся областей в IT. Объём знаний необходимых для прохождения собеседований огромен, и он растёт год за годом.

И если ты выбрал эту сферу наобум, без чёткого понимания, зачем ты это делаешь — велик шанс, что ты бросишь обучение на полпути.

Легко не будет — но это того стоит

Готовься много и упорно зубрить. Готовься к тому, что обучение потребует времени, усилий и терпения. Никаких «за месяц станьте ML-инженером» — это миф. Но если подойти правильно, можно пройти путь от новичка до Junior или Middle специалиста за реальное время, с реальным результатом.

Сядь и реши, точно ли ты хочешь в эту сферу? Может лучше пойти в более привычное направление разработки на Go/Python?
Найди свою собственную долгосрочную мотивацию, зачем ты будешь изучать машинное обучение в течение полугода-год, до нахождения первой работы

Моя история: как я нашёл свою мотивацию

Когда я только начинал, я наткнулся на примеры компьютерного зрения: алгоритмы, которые умеют находить объекты на картинках, следить за ними, определять действия, даже описывать изображения текстом.

Для меня это был настоящий вау-эффект .

Мне чисто для себя стало интересно разобраться в том, как это устроено, как самому обучить нейросети делать такие крутые вещи.

Меня и до сих пор удивляет и дико забавляет, то что можно делать с помощью нейросеток, я ни дня не скучаю от своей работы, поэтому в начале пути, мне было просто весело этим заниматься.

Навык 1

И самое первое, что вам необходимо освоить это конечно же Python.

Без базового понимания синтаксиса и структуры кода ты не сможешь ни обучить модель, ни обработать данные, ни даже запустить чужой проект с GitHub.

Многие новички пытаются сразу прыгнуть в теорию ML или нейросети, но спотыкаются уже на уровне элементарного скрипта, который загружает датасет.
Именно поэтому начинать нужно с Python — не с глубокого погружения в ООП или метаклассы, а с практического минимума, который позволит тебе двигаться дальше.

Синтаксис — это основа. Ты должен свободно ориентироваться в конструкциях for, if, while, уметь писать функции. Эти вещи встречаются буквально в каждом скрипте, будь то предобработка данных или логика обучения модели.

Структуры данных — это инструменты, которые определяют, насколько эффективно ты можешь работать с информацией. Списки, словари, кортежи — они используются повсеместно. Например, словари удобны для хранения параметров модели, списки — для батчей данных, а кортежи — как неизменяемые структуры часто применяются внутри фреймворков вроде PyTorch или scikit-learn.

Работа с файлами — ты постоянно будешь сталкиваться с необходимостью считать .csv, прочитать .json с гиперпараметрами или сохранить результаты в .txt

? Вот мой список лучших материалов для старта:

? Проверь себя - Вопросы с собеседований:

Что произойдёт, если изменить список внутри кортежа, который был ключом в словаре?
Какая сложность по времени у вставки/поиска в списке vs в связном списке?
Как работает декоратор @property и зачем он нужен?
В чём разница между __new__ и __init__?

Освоение этого навыка займёт у вас скорее всего от 2 до 4х недель

❌ Игнорируй бесполезные советы

Одна из самых частых ошибок новичков — это следование советам, которые звучат логично, но на практике ведут к выгоранию и потере мотивации.
В интернете полно статей вроде: «Как стать ML-инженером за 6 месяцев», где первым пунктом стоит «выучи матанализ, алгоритмы и LeetCode».
Не делай этого.

Алгоритмы? Не сейчас

Да, понимание базовых алгоритмов полезно. Но не на старте.
Когда ты только начинаешь путь, тратить недели на сортировки, графы и динамическое программирование — это как учить грамматику языка, прежде чем научиться говорить хотя бы пару фраз.
Тебе не нужно знать, как работает алгоритм Кнута-Морриса-Пратта, чтобы обучить модель классификации текстов или запустить YOLO для детекции объектов.

Математика потом

Многие считают, что без глубокого понимания матана, линейной алгебры и теории вероятностей нельзя заниматься ML. Это миф.
На самом деле, большая часть современных библиотек и фреймворков уже реализует сложные формулы за тебя.
Понимать, что такое матричное умножение или функция активации — полезно.
А вот выводить формулу градиентного спуска на бумажке — не обязательно.

Это не означает, что математика вообще не нужна. Она важна, когда ты переходишь на более продвинутый уровень — например, начинаешь оптимизировать архитектуры нейросетей или разрабатывать свои собственные модели.
Но в начале пути она чаще становится преградой, чем помощником.

LeetCode — это не про ML

LeetCode — отличный инструмент для подготовки к интервью в крупные IT-компании.
Но он не учит тому, что реально требуется в работе ML-инженера .
Решение сложных задач на бинарные деревья, перестановки и оптимизацию памяти — это скорее тест на стрессоустойчивость, чем реальный навык для работы с данными.

Если ты хочешь просто начать делать проекты, разбираться в моделях и понимать, как устроена реальная работа — забудь про LeetCode на первые пару месяцев.

Что делать вместо всего этого?

Переходи к практике, как можно быстрее. Решай и реализуй реальные практические МЛ задачи, как только ты увидишь первые результаты, твой мозг получит положительно закрепление

Ты потрудился - получил результат

А значит стал ближе к своей цели - получению оффера

Навык 2

Когда ты освоишь Python, следующий шаг — понять, что такое Machine Learning и как он работает на практике .

Многие думают, что ML — это про сложные формулы и нейросети. На самом деле, большая часть работы в этой сфере — это работа с данными, выбор модели и оценка её качества.
И начинать нужно не с глубокого обучения, а с базовых задач и моделей.

Основные типы задач:

Классификация — определение категории. Например: спам или не спам, кошка или собака на картинке.
Регрессия — предсказание числа. Например: сколько будет стоить квартира, или сколько времени пользователь проведёт на сайте.
Кластеризация — поиск групп в данных. Например: выделение групп пользователей с похожим поведением, если заранее неизвестно, какие они.

С этими типами задач ты будешь сталкиваться постоянно, особенно на старте.

Как понять, хороша ли модель?

Не все модели одинаково полезны. Иногда кажется, что всё работает отлично, а на деле — модель просто угадывает.

Вот почему важно знать метрики — числа, которые показывают, насколько хорошо работает твоя модель.

Например:

accuracy — процент правильных ответов. Но он обманчив, если классы несбалансированы (например, 95% случаев — "нет", и модель всегда отвечает "нет").
precision и recall — покажут, насколько точна модель при поиске нужного ответа.
F1-score — удобная свёртка этих двух метрик.
Для регрессии часто используют MAE или RMSE — они говорят, насколько в среднем модель ошибается в своих числовых предсказаниях.

Эти метрики несложно понять, но очень важно уметь их использовать правильно.

? Вот мой список лучших материалов для старта:

? Проверь себя - Вопросы с собеседований:

Нужно ли нормировать данные прежде, чем подать в их в линейную регрессию?
Когда использовать MAE, а когда MSE?
Что такое boxplot и как найти выбросы в данных, метод 3-х сигм?
Возможно ли такое, что Precision=19%, Recall=92%, Accuracy=10%?
Что такое F2 мера, F3 мера, F100500 мера?

Освоение этого навыка займёт у вас скорее всего от 3х до 5 месяцев

Навык 3

Подходим к концу. Третий навык в моем списке это SQL - синтаксис для составления запросов к базам данных, это одна из самых простых технологий для освоения, от вас требуется знание всего лишь базовых аспектов

Отличие left join от cross join
Что такое транзакции
Составление сложных запросов с разными условиями

Освоить SQL на достаточном для собеса уровне можно за 1-2 недели

Навык 4

И последний, четвертый навык — это как можно скорее переходить к практике и заниматься реальными задачами. Именно через практическую работу вы быстрее всего приблизитесь к тому, чтобы стать настоящим, уверенным в себе специалистом.

Вам нужно научиться решать те самые задачи, с которыми вас будут просить работать на реальной работе. Речь о бизнес-задачах — именно за них и платят зарплату.

Идеи для пет-проектов легко найти на YouTube и GitHub. Там уже есть огромное количество материалов, примеров и готовых решений, которые другие люди создавали во время своего обучения и делились ими с сообществом. Это сильно облегчает начало пути и помогает не терять мотивацию.

Вот, в принципе, и всё. Я рассказал о ключевых навыках, распространённых проблемах и мифах, с которыми я сам сталкивался на пути изучения Machine Learning. Надеюсь, этот опыт поможет и вам освоить эту сферу и дойти до своей цели.

Про интерактивный сборник материалов по ML

Про CLIP модели и базу к Computer vision собесам

Вопросы с ML | Computer vision собесов
Читай у меня в телеграм канале

AI, больно! | Рома Филонов

t.me

Комментарии (39)

proxy3d
15.06.2025 21:38
#28439528
Судя по вакансиям расклад все таки другой

1) Яндекс, подавляющее кол-во вакансий от HR это RAG проекты. Хотя описано про ML/AL как только начинаешь общаться, оказывается RAG.

2) Сбер, часть чисто ML по метрикам оценки разных систем, типа онлайн кинотеатра (условно). Большая часть это чисто RAG, langchain в обвязке Сбера. ML метрики для обучения LLM моделей. Ни новые архитектуры, ни новые решения или r&d.

3) Тинькофф - RAG и недавно присылали, что собираются делать систему на базе открытой для обучения ИИ управлять компом или приложением (забыл). Замахнулись на то, что сами слабо понимают. Опять взять опенсоурс и обучать.

4) ВК - тоже по-моему в основном RAG предлагают под соусом AI/ML. Либо считать ML метрики в разных системах.

5) МТС точно не помню, что то пытались они в синтез речи. Но судя по результатам , вышло хреново.

То есть все сводится к тому, что обучать в лучшем случае готовые решения. Но чаще всего работа с RAG. Или делать обвязку вокруг готовых ACR, TTS. Ничего нового.

В целом, сетки конечно есть, пытаются то VITs для синтеза речи обучить, то tacatron2. Тоже с остальным. То есть в реальности, работа в том, что делать обвязки, готовить данные по ML метрикам, внедрять RAG и так далее.

Это не хорошо не плохо. Наверное продуктовые компании так и должны делать. Но реальным AI/ML исследованиями заниматься там все равно не будешь. В лучшем случае оптимизировать текущие, перебирая токенизаторы и гиперпараметры, считая метрики для бенчмарок.

На фоне DeepMind или deepseek это выглядит очень печально.
1. einhorn
  15.06.2025 21:38
  #28439900
  Вспоминаются критерии при отборе в гугл
  
  Внедрял RAG в 2023 году = +10 очков
  
  Внедрял RAG в 2025 году = -10 очков
  1. SlavikF
    15.06.2025 21:38
    #28439914
    А где посмотреть эти критерии?
    
    einhorn
    15.06.2025 21:38
    #28439940
    Где-то на реддите видел
    
    Запомнилась только эта часть
1. einhorn
  15.06.2025 21:38
  #28439918
  Если серьезно, то ничего плохого в повсеместном написании обвязок и RAGов нет
  
  Практика показывает, что индустрия пока что не научилась нормально продукционализировать ИИ. Вот взять даже гугл - войсоверы и автосубтитры на ютубе - полное говно; над ИИ-саммари в поиске постоянно стебутся. Видать, толковых "внедрителей RAGов" им все-таки не хватает
  
  Плюс, вы привели в пример российские компании. О каком серьезном R&D может идти речь, когда мощные GPU вообще нельзя завозить в страну?
  1. akod67
    15.06.2025 21:38
    #28440242
    Поясните пожалуйста мысль про полное г субтитров на ютубе. Включаю периодически английские, не сказал бы, что полное.
    
    einhorn
    15.06.2025 21:38
    #28440316
    Он справляется только на английском в спокойных видео, да и то ошибок намного больше, чем у виспера 2022 года
    
    Не справляется с музыкой и громкими фоновыми звуками: сразу начинает выдавать дичь. С фильмами работать не способен
    
    Пунктуация часто отсутствует
    
    Работает только на нескольких самых популярных языках. Чем дальше - тем хуже. На русском уже ужасно. На каком-нибудь японском абсолютно несмотрибельно ни при каких условиях. На армянском - просто не умеет
    
    Очень часто ютуб считает, что видео слишком сложное для транскрибации, и не делает субтитры вообще
    
    Иногда ошибается даже в распознавании языка: принимает армянский за турецкий (они даже не родственны, хотя турецкий повлиял на армянский в ходе истории), а украинский за русский
    
    Вдобавок, очень криво переводит субтитры. Сейчас можно переводить намного лучше
    
    В общем, виспер 2022 года просто на голову выше, а ведь с тех пор ASR развивалось: ElevenLabs Scribe намного лучше виспера на сложных языках
    
    Перевод с японского
    
    Tim1970
    15.06.2025 21:38
    #28440798
    Украинский и есть региональный диалект русского. Всё правильно ИИ понимает
    
    tasyrkin
    15.06.2025 21:38
    #28442926
    Можете подсказать, где в России на подобного типа 'диалекте'? Так как Россия централизована, русский практически один и тот же ат Калининграда до Владивостока. Посмотрите на Германию, вот там обилие диалектов
    
    einhorn
    15.06.2025 21:38
    #28443460
    אַ שפּראַך איז אַ דיאַלעקט מיט אַן אַרמיי און פֿלאָט
    a shprakh iz a dyalekt mit an armey un flot
  1. proxy3d
    15.06.2025 21:38
    #28440566
    Ни чего не имею против RAG. Речь шла о том, что из себя представляет на сегодня рынок AI/ML в России. Подавляющее число это RAG (который тоже требует метрик) либо расчет ML метрик для статистики. То что раньше считали в Excel, различные мат методы статистики, теперь перешло в ML. Но ML в продуктовых компаниях, где надо найти метрики по заказам ВкуссВилл и другие подобные, очень поверхностно затрагивает тему машинного обучения. А так вакансии RAG это сегодняшние вакансии AI/ML во всех крупных компаниях в РФ, недавно HR из СберЗдоровье писал, тоже RAG.
    
    Мое личное мнение, что RAG это не совсем AI/ML, это что то среднее. Так как это работа с готовыми фреймворками LangChain (или подобных) с их API, а не с нейронками. Но при этом надо знать различные ML метрики, хотя их набор небольшой для оценки результата. Поэтому отчасти RAG можно отнести к ML.
    
    Что касается R&D, то это не так. Речь не про просто обучение на готовых открытых моделях, как это делает Сбер или Тинькофф, а как DeepMind именно исследования. Тут не нужны видеокарты. Да и у Сбера приличное кол-во видеокарт, они сдают в аренды GPU сервера облачные. Здесь дело в самом подходе, приоритетах, мышлении.
    
    einhorn
    15.06.2025 21:38
    #28443792
    Тут не нужны видеокарты
    
    Еще как нужны. Эксперименты на маленьких масштабах далеко не всегда дают достаточное представление о том, как все будет работать на больших. Не говоря уже о том, что для вау-эффекта а-ля Сора (который нужен для инвестиций) нужно обучить большую модель. Плюс, нужен выход на зарубежные рынки, чтобы в итоге окупать свои R&D
    
    Да и у Сбера приличное кол-во видеокарт, они сдают в аренды GPU сервера облачные.
    
    Технологии GPU не стоят на месте. Самые новые видеокарты Сберу не продадут, а на старых Сбер не выдержит конкуренции с западными моделями
    
    Российский ML сейчас - просто бледная тень самого себя образца 2021 года. Путин убил российский ML (да и IT в целом), точно так же, как Гитлер убил немецкую науку, на тот момент лучшую в мире
    
    proxy3d
    15.06.2025 21:38
    #28447164
    Вы путаете фундаментальные исследования и оптимизацию и производственные масштабирование продуктов. Для того, чтобы разработать трансформер, достаточно 1 нормальной видеокарты и работы. Чтобы разработать модель гиппокампа - deepmind не нужно было сотен видеокарт, так как они исследовали соответствие обучаемой модели и нейронов у крысы.
    
    Откуда вы вообще взяли про видео карты? Причем тут обучение модели на открытых моделях и исследования? Вы пишете об оптимизации, дообучении - это сбер и яндекс как раз и делает на открытых моделях, внося косметические изменения. Я же говорю про R&D. Я говорю о том, что надо работать над разработкой "станков", а вы пишите - что не могут разработать станки, так как заводы не построены, площадей для этого нет, чтобы много станков поставить. Что вы собрались масштабировать? Если вы не занимаетесь исследованием и разработкой. Закупка чужих станков на свой завод - это не R&D, это производство продукта. Это нормальное явление. Но дело не видеокартах, а в подходе. "Плохому танцору яйца мешают", так что дело не в видеокартах, а мозгах.
    
    Российский ML сейчас и до - не было. Был продуктовый AI/ML, а R&D и это разные вещи. Вам про исследования, а вы про производство. Вы путаете понятия R&D и разработку продукта.
    
    Flokis_guy
    15.06.2025 21:38
    #28449554
    Тут палка в двух концах, исследовать теоретически архитектуру можно, да, и на простых данных посмотреть будет ли они работать и скейлиться, но увы, мир работает так, что нужно показать что-то более стояще, что бы на это действительно обратили внимание. И вот тут нужны GPU.
    
    Но в целом я согласен, лучше компаниям не подъедать объедки, а создавать что-то новое.
    
    proxy3d
    15.06.2025 21:38
    #28450874
    Речь не про исследовании архитектуры. Речь о фундаментальных исследованиях. Это тоже самое как сказать, исследовать закон Ньютона можно, но без Варп-двигателя это не нужно. А вот без топлива на нейтрино с гелием-3 нет смысла браться. Вот так это звучит. Я столько раз слышал эти левые оправдания, я бы начал фотографировать, но без зеркалки за 200 тыс руб и объектива к нему еще за 200 тыс начинать бесполезно. Один в один. И дай этим людям такой фотик, он либо будет пылиться или они придумают новый аргумент.
    
    Почему другим это не мешает? И зачем надо, чтобы другие обращали внимания? Или вы думаете, что у китайского DeepSeek карточек было больше чем у Сбера или денег больше? У DeepSeek прежде всего были мозги. А сейчас Сбер использует их открытую модель и дообучает. Мозги - вот главный ресурс и наши компании и большинство тех кто занимается AI/ML в РФ, им явно не обладают.
1. 40kTons
  15.06.2025 21:38
  #28440060
  Вялотекуще интересовался ии ещё году в 19-20. Потом написал диплом по мл. Думал в мл перекатиться из разработки, но пока думал случился бум gpt, и стало казаться что в ближайшие годы работа в ml будет чем-то вроде адаптации llm под свои нужды и создании сервисов вокруг llm, а это не показалось чем-то интересным. Так и не перекатился в мл

apcs660
15.06.2025 21:38
#28439876
Сейчас начал раскопки RAG, копаю примерно месяц.10 лет примерно занимался написанием поисковых корпоративных систем по классике. Работа на заказчика закончилась но привычка, как говорится, осталась. Идеи на полке тоже. Решил освежить знания, немного отойти от колеи и сразу попал на RAG.

RAG по сути, есть трех типов: vanilla, это когда в лоб ищем по knn векторам составленным из кусков текста. Подобный поиск встроен в Solr/Elastic.

Hybrid Rag - когда ищем применяя knn и классический поиск по фразам и ключевым словам а затем пытаемся отранжировать и соединить результаты поиска. Как вы извлекли ключевые слова и фразы, это отдельная песня. Бывает так, что нужно отделить поиск по метаданным от поиска по контенту, и создать маппинг от онтологии в NLP запросе к полям метаданных в базе или индексе.

И третий, он же немного второй способ, RDF хранилища, SPARQ, использование graph db как хранилища и если ресурсы позволяют, нейросети для обработки и хранения связей графа знаний.

Сразу после сокращения создал проект на гитхабе, пригласил туда коллегу из QA (нас кучно сократили, отвалился клиент жирный), создал организацию на гитхаб чтобы работать в группе. Учебное окружение должно напоминать рабочее. Может еще кого подтяну из знакомых.

С недельку помучал ChatGPT, придумал себе имя для домена и заодно продукта. За небольшие деньги зарегал пару доменов, . Dev с SSL (18 баксов) и . аi (140), чтоб застолбить, заодно нормальную почту корпоративную.

Все нужно делать по настоящему, даже когда учишься. Потихоньку пилим в песочнице то что уже делали раньше но в силу NDA не могли утащить - создаю базу, улучшаю код с учетом опыта. Делаю необходимый минимум но по феншую чтоб не краснеть когда выложу в открытый доступ. Потихоньку набьем руку, затем начну прощупывание клиентов с которыми работал, попробую на контракт заскочить.

Питон если честно, раздражает, но делать нечего - учу. Он меня как Бейсик, немного выбешивает. Что то сложное поставить - надо anaconda + mamba, это просто ужасно.

Проектов масса, по RAG заинтересовал haystack. Лонгчейн, ллм индекс, пара векторных баз типа milvus, тоже мимо не пройдут.

На литкод зашел и вышел. Одной книжки по алгоритмам достаточно полистать, и пару листингов или публикаций, зачем больше то знать на обычной работе? 90 процентов разработчиков в запарке применяют наивные алгоритмы или готовые библиотеки и все на этом

поймал себя на мысли, что устал кодировать. Начал почитывать пару книг по корпоративной архитектуру и это мне зашло намного лучше чем программирование. Авторы поумнее как то показались, меньше тупой бравады и думать пытаются. Все как в реальных больших проектах - много шишек и компромиссов. Наверное пора с кодинга уходить.

Через полгода примерно подкуюсь, демо проекты закончу, буду готов но работу начну прощупывать примерно через месяц - новье конечно нужно знать но по Легаси работы море никто не отменял принцип "сначала продай а потом сделай", это норма сейчас.
1. ababo
  15.06.2025 21:38
  #28439974
  Что то сложное поставить - надо anaconda + mamba, это просто ужасно.
  
  Пробовали pixi? Если нет, то очень рекомендую.
  1. apcs660
    15.06.2025 21:38
    #28440654
    Спасибо, попробую

sergeyns
15.06.2025 21:38
#28441078
Я бы пошел на электрика учится... судя по расценкам на авито, доходы от сбора щитков и монтажа розеток не меньше чем у сеньеров...
1. sobeskiller
  15.06.2025 21:38
  #28441942
  Тссс... Пусть дураки и дальше прут в это айти...
1. ManulVRN
  15.06.2025 21:38
  #28442298
  Судя по информации в интернете, у айтишников 300к/нсек.
  1. sergeyns
    15.06.2025 21:38
    #28442668
    Ну по соседним постам - 300к это уже далеко не у всех айтишников, а по словам знакомых с ремонтом - хороший электрик за 20к/день - это очень не дорого (точнее таких уж и нет, они дороже) и к таким очередь на месяцы вперед
  1. sobeskiller
    15.06.2025 21:38
    #28446844
    Судя по информации в интернете, у айтишников 300к/нсек.
    
    В интернетах не врут! (c)

egaoharu_kensei
15.06.2025 21:38
#28441982
Хочу добавить очень полезный источник для изучения ML, который когда-то я сделал сам (это не реклама и абсолютно бесплатно). Это серия статей на Хабре с созданием ML-алгоритмов с нуля, что будет очень полезно, особенно новичкам. Вот ссылка на статью https://habr.com/ru/articles/804605/

Сейчас профессия ML-щика движется в очень необычном направлении: если раньше нужно было заморачиваться с поиском моделей, данных, изучением и реализацией архитектур, то сегодня существует множество готовых базовых решений, которые достаточно немного затюнить, чтобы получить уже приемлемый результат. Это очень сильно упрощает жизнь не только маленьким компаниям, но и трудоустройство в них: даже не разбираясь как это все устроено изнутри, можно сделать чат-бота или tts в пару кликов с помощью того же hugging face. Хорошо это или плохо - это уже вопрос риторический.

Настоящий же хардкорный ML, когда мы с нуля пишем тот же flash attention на triton или cuda, разрабатываем с нуля и обучаем свои архитектуры трансформеров, и т.д. - это очень сложный и дорогой путь (research), который могут себе позволить только крупные компании (и то не все), не говоря уже про то, что для него порог входа расположен совершенно на ином уровне. Это как раз тот случай, когда нужно хорошо знать матан, алгоритмы, тонкости ЯП, паттерны и так далее, поэтому если у вас нет особой любви к ML, то я бы не рекомендовал этот путь, поскольку он занимает очень много сил и времени (говорю из опыта).

К слову про research, а именно про research engineering...в ближайшем будущем я планирую опубликовать на Хабре статью с реализацией ChatGPT с нуля (с теорией и кодом), показав как устроены изнутри и создаются его компоненты: токенизатор, flash attention, GPT, RL (PPO) и так далее (спойлер: большая часть проекта уже сделана).
1. denakol
  15.06.2025 21:38
  #28442504
  Спасибо за серию статей, будет интересно увидеть следующую!
  
  Прочитал ваш курс, и пару других по ML год назад, и по сути остался в обычной разработке как раз по описанным причинам, нет причины углубляться, если для использования и простых знаний достаточно, а для хардкорных задач то и нет, да и бизнес не хочет особо тратиться. Без проблем получилось внедрить "ML" поиск на текущей работе, а больше уже и не надо) Менять работу чтобы работать с RAG моделями не привлекло от слова совсем.
  1. egaoharu_kensei
    15.06.2025 21:38
    #28442614
    На самом деле кроме RAG есть еще много чего интересного и сложного, просто компаний, которые это могут предоставить, в СНГ очень мало :) На нашем рынке это Сбер и Яндекс. Например, я видел вакансии от Яндекса по ML, где требуется писать оптимизированные CUDA ядра, реализовывать алгоритмы из научных статей и т.д., но их немного от общего числа.
    
    Согласен с вами полностью, что нет смысла переходить из обычной разработки, особенно если и в ней все получается. Сейчас прикладной ML разработчик больше похож на продвинутого юзера hugging face и, как мне кажется, этот тренд будет только расти и это может привести к упадку вакансий на рынке ML, поскольку зачем нанимать такого специалиста, если и обычный разработчик сможет посмотреть пару туториалов, полистать доку и запустить готовую модельку, которой будет достаточно для простых проектов с головой. Возможно я ошибаюсь, но мне кажется, что все к этому и идет.
    
    einhorn
    15.06.2025 21:38
    #28443762
    поскольку зачем нанимать такого специалиста, если и обычный разработчик сможет посмотреть пару туториалов, полистать доку и запустить готовую модельку, которой будет достаточно для простых проектов с головой
    
    А потом удивляемся, почему люди так подозрительно относятся к ИИ-решениям
    
    Я надеюсь, что будет ровно наоборот: просто запустить стандартную модель сможет каждый; но специалист, который знает весь текущий зоопарк моделей, умеет правильно их применять, комбинировать и файнтюнить, будет цениться на вес золота
    
    egaoharu_kensei
    15.06.2025 21:38
    #28444182
    Я с вами согласен, что хорошо бы иметь в штате специалиста, который держит руку на пульсе в этом громадном зоопарке моделей, но тут дело в другом. ML можно разбить на 2 категории: рисерч и бизнесовый. Рисерч, в свою очередь, тоже разделяется на 2 категории: research science (те, кто изучает текущие подходы, придумывает на бумаге как их улучшить или вообще разработать что-то новое) и research engineering (это те, кто это реализует эти концепции в готовые алгоритмы, фреймворки, делает удобные и расширяемые интерфейсы, а также какие-то базовые обученные модели и т.д.).
    
    На практике это означает следующее: есть ребята из таких компаний типа hugging face, openai и т.д., которые вкинули кучу денег, что-то придумали и сделали из этого продукты, которыми пользуется подавляющее большинство. Чтобы сделать что-то подобное, нужно не только много-много денег, а еще и толковые специалисты, которые смогут этим заниматься (они стоят в разы дороже обычных ML-щиков), поскольку с этой точки зрения ML гораздо сложнее технически, чем бизнесовый (где нужно пользоваться готовыми решениями), хотя и в бизнесовом хватает своих приколов, но это уже другая история, как говорится. Это первый момент.
    
    Отсюда вытекает второй момент, который заключается в том, что большинство компаний небольшие и у них нет таких возможностей, но зато у них есть возможность использовать готовые решения от крупных компаний почти за просто так, которые даже из коробки работают неплохо. Если это не компания, продуктами которой пользуются миллионы или где нужен каждый процент точности, то такого решения более чем достаточно.
    
    Отсюда возникает вопрос: стоит ли нанимать отдельно ml разработчика, который во всем этом разбирается, и платить ему 5к зелеными или же с этим может разобраться на базовом уровне, например, backend разработчик, которому можно будет доплатить 500 долларов? Будут ли готовы компании к такому? Проще говоря, стоит ли забивать гвозди перфоратором? Здесь чисто экономический вопрос. Если проводить аналогию, то это можно сравнить с обслуживанием авто в сервисном центре и у гараже у дяди Васи. Как показывает жизнь, большинство выбирает второй вариант :)
    
    Подход, который описываете вы, лучше подходит для средних и крупных компаний, где уже бизнес более серьезно завязан на ML, но опять же, таких компаний гораздо меньше. Я бы тоже хотел надеяться, что на описанных вами специалистов будет расти спрос, но происходящее говорит об обратном. Возможно я ошибаюсь, но мне кажется, что ситуация выглядит именно так и дальше в этом плане будет хуже. Я уверен, что вы и так это знаете, просто если возвращаться к вопросу изучения ML сегодня, то, на мой взгляд, стоит очень хорошо взвесить все "За" и "Против" нужно ли в него вкатываться, а если все-таки нужно, то насколько это нужно делать глубоко из-за ситуации на рынке. Просто может оказаться так, что вы учили ML глубоко и долго, а в большинстве компаний это не нужно. Стоит ли так рисковать? Это уже вопрос риторический.
    
    Не подумайте что я пессимист по поводу нашего ML. Скажу даже больше: я просто с огромнейшим интересом хоть прямо сейчас согласился бы поработать над отечественным продуктом, разработанным и созданным с нуля, чтобы его можно было вывести на уровень с тем же ChatGPT и DeepSeek, особенно если бы это еще был open source.
    
    einhorn
    15.06.2025 21:38
    #28444314
    Если это не компания, продуктами которой пользуются миллионы или где нужен каждый процент точности, то такого решения более чем достаточно.
    
    Вот это главный тезис, с которым я не согласен
    
    Сегодня куча компаний внедряет ИИ, и очень много людей жалуются на качество после внедрения ИИ. Вот недавно была история с Duolingo. Если бы у них были нормальные NLP-шники, то огромного количества негатива можно было бы избежать
    
    Проблемы с внедрение ML-решений следующие
    
    Неумение измерять качество
    
    Незнание о существовании какой-то модели, лучше всего подходящей для решения задачи
    
    Ленивый/неумелый промтинг: люди просто берут первый результат, который их устраивает; когда можно было бы немного посидеть и сильно улучшить решение просто за счет промтинга
    
    Для носителей английского: монолингвальность; непонимание, как устроены другие языки
    
    Жадность: предпочтение более дешевых моделей
    
    Часто отсутствие алгоритмического постпроцессинга вывода LLM
    
    Кроме того, сейчас очень много негатива к ИИ просто потому что это ИИ - для кое-кого (в основном художников) распространение ИИ очень сильно бьет по доходам, вот они и сопротивляются; и они пытаются создать вокруг ИИ социальную стигму. В такой атмосфере лучше всех ценится такой ML-специалист, который сможет предоставить результат, неотличимый от человеческого - а вот это реально сложно
    
    И вообще, если вы бекендеры будете лезть в мой ML, я тоже буду лезть в ваш бекенд :) Сейчас такое время, когда сеньору нужно быть не просто фуллстеком, но еще и ML-щиком вдобавок
    
    egaoharu_kensei
    15.06.2025 21:38
    #28444438
    Я с вами полностью согласен, но давайте немного проясню ситуацию. Во-первых, я тоже занимаюсь ML, а не backend'ом :) Во-вторых, ту ситуацию, что я описал по поводу использования готовых решений не ML-щиками - это не моя позиция, которую я поддерживаю, а реальные факты, которые я беру из опыта. Вы сами сказали следующее: "Сейчас такое время, когда сеньору нужно быть не просто фуллстеком, но еще и ML-щиком вдобавок " и это не просто так.
    
    Дело в том, что сейчас очень необычное время, когда все (или почти все) экономят, особенно небольшие компании, у которых бюджет сильно ограничен. В таком случае главное получить минимально приемлемую рабочую версию продукта, продать заказчику и двигаться дальше, и это на самом деле выгодно обеим сторонам: заказчик хочет заплатить как можно меньше, а исполнитель потратить как можно меньше денег на разработку. Здесь девиз примерно такой: "Более-менее работает, ну и ладно: зато недорого.".
    
    Если раньше для этого надо было нанимать или хотя бы временно привлекать со стороны ML-щика, который стоит дорого, и который долго пытался что-то сделать и не всегда хорошо (было мало готовых моделей, их было сложно тюнить, мало данных и т.д.), то сейчас с этим все гораздо проще. Вместо этого теперь проще обратиться за консультацией к ML-щику со стороны, а потом уже делать то что он скажет силами других разработчиков, потыркав пару дней тот же hugging face. Другими словами, в этом случае ML перекочевал из разработки в консалтинг: если раньше ко мне обращались небольшие компании с просьбой что-то сделать, то теперь это просто что-то стиле в "А не могли бы вы рассказать как и где лучше делать это и вот это". С точки зрения экономии средств для небольших бизнесов это явно плюс.
    
    А ведь все дело как раз в том, что большинство компаний небольшие, да и к тому же качество готовых решений только расчет, а пользоваться ими становится проще, поэтому этот тренд и растет. Ситуация с ML похожа не девопс: есть отдельные специалисты, но все же каждый разработчик должен быть знаком с докером. Также и здесь.
    
    Компаний, готовых предложить очень сложные и интересные ML задачи, на нашем пространстве очень мало, а тренд на использование готовых решений только растет и к тому же это становится проще технически. При изучении ML , а именно насколько глубоко и долго нужно погружаться в эту область, лучше учитывать такие моменты. Это основная мысль, которую я хотел донести.
  1. einhorn
    15.06.2025 21:38
    #28443618
    Без проблем получилось внедрить "ML" поиск на текущей работе, а больше уже и не надо)
    
    У ML есть специфика: сделать с 95% точностью = один вечер; улучшить точность до 98% занимает неделю, до 99% - месяц; а добиться точности 99.5% вообще невозможно
    
    ML - вещь несложная, пока стандартная модель из коробки выдает приемлемую точность
1. iskateli
  15.06.2025 21:38
  #28444240
  подписался, очень интересно будет почитать

WebPeople
15.06.2025 21:38
#28442004
А какие должны быть базовые навыки, чтобы приступить к обучению? Понятно, что все не перечислить, но хотя бы самое важное.

Просто бывает такое, что человек сам не замечает, что у него уже есть приличный "багаж" знаний и навыков за спиной, поэтому он может писать, что "математика потом", ООП потом и т.д. Потому что напрямую все это не пригодилось, т.к. все уже есть "готовое" в библиотеках. А ведь просто развернуть какую-нибудь готовую нейросетку из опенсорса на своем железе - может стать непреодолимой задачей для новичка. И то что мелочь для одного, то для другого проблема
1. boterxxx Автор
  15.06.2025 21:38
  #28444044
  Ничего не надо, чтобы приступить нужно лишь желание

Tim_23
15.06.2025 21:38
#28442036
Про дата саенс ничего не сказали )

Я бы начал с цифровой обработки сигналов , классических книг п этой теме. Согласен с тем что многие курсы , которые обещают за полгода научить чему то , это трата времени . Тут поможет только опыт , а начинать надо с простой и примитивной базы .
1. boterxxx Автор
  15.06.2025 21:38
  #28442696
  А почему надо начинать с цифровой обработки сигналов?

nomhoi
15.06.2025 21:38
#28442216
Что бы я сделал, если бы сегодня начинал учить Data Science / ML?

Сюда нужно зайти: Learn Python, Data Viz, Pandas & More | Tutorials | Kaggle

Gordon01
15.06.2025 21:38
#28445940
Привет, подскажи, на каком факультете учился в МФТИ? Учился ли в маге, если да, то на какой. Считаешь ли ты магу полезным вложение?