Примерно через каждый день проходит то или иное событие в Москве в даты с 25 мая по 2 июня 2025 года. Видимо, мероприятия от организаторов Data Fusion не одноразовое, и что-то подобное планируется проводить ежегодно, поэтому интересно посмотреть программу данного фестиваля.

Datafest в Москве
Datafest в Москве

Интересно было увидеть столько программистов, тим лидов, инженеров и продукт-менеджеров, hr-специалистов вчера, 28 мая, в Loft Hall #3, в зале Ратуша, на очередном мероприятии фестиваля. Кстати, регистрироваться надо заранее, если хотите попасть офлайн, нас не везде успели одобрить, на 24 число в гости к ВК мы не попали. А вот на ВТБ пришел положительный ответ.

Специалисты встретились как раз в неформальной атмосфере вне какого-либо офиса, атмосфера в формате Лофта. В зале проходили абсолютно разные доклады, начиная от сколковских разработок нейросетей с использованием пользовательских данных, в которых содержаться глобальные данные и знания, и заканчивая антипаттернами с рекоммендациями в формате камеди-клаб о том, как не стоит программировать. Учили даже правильно "ботать", но в целом очень в сжатые сроки рассказано много интересного из сферы ML.

Предсказание тех или иных событий
Предсказание тех или иных событий

Итак, пара историй, которые лично мы услышали и которые нам понравились.

История 1.

Множество интересных данных об устройстве мира можно анализирвать не напрямую, а через пользовательские транзакции. Например, время и причина ухода сотрудника из компании, предсказание анализа кредитного дефолта клиента банка, предсказание результатов обучения в университете часто зависит от известных фактов - от самих объектов, из-за которых что-то случается. Даже Биткоин может подешеветь именно потому, что его покупает кит. Но анализ пользовательских транзакций дает возможность не изучать напрямую факты, которые узнаешь от первого лица, а посмотреть, что много пользователей также начинают продавать биткоин, видимо потому, что его продал кит, но это не важно. Признак продажи биткоина китом теряет значимость потому, что много людей по теории вероятности не дураки и будут поступать в соответствии с тем, что поняли по ситуации, в их действиях априори уже содержится информация, о которой они узнали извне.

Называется это классификацией признаков транзакций в моделях поведенческого скоринга. Известно, что отслеживать и фильтровать для анализа можно:

  • поведение по привычке,

  • поведение в изменениях.

Признаками транзакций, также известно, могут быть:

  • Цель платежа (mcc);

  • Давность платежа – период с даты транзакции до даты заявки на кредит (days_before)

  • Сумма платежа (amnt)

В простейшем случае можно видеть максимальное совпадение определенного признака у сотен и тысяч людей, еще один простой вариант – усреднять некоторые признаки для многих людей и получать средние значения. Но есть более сложные специальные алгоритмы (кстати, туда можно было бы прикрутить и весовую обработку, которую делали с Патюковым Виктором Георгиевичем, так как она классно работает с погрешностями во временном ряду, в частности).

Коллеги из Сколково с 2016 года исследуют возможности анализа таких пользовательских данных, замораживают одни блоки в своей схеме и экспериментируют с другими. Больше об этом исследовании в области искусственного интеллекта можно почитать здесь: https://arxiv.org/abs/2502.10205

История 2.

Человек рассказал, как он стал тимлидом. Сколько нужно было ботать и как именно. Схема: ложишься на кровать, кладешь голову, выпрямляешь коленки. Спишь. Вуаля – ты ботаешь. Но если серьезно – тимлид одной из команд поделился, какие ошибки не стоит допускать, как можно относиться к своему делу. У него было 5 программистов (кстати, у меня было 40 разработчиков для сравнения, когда я начинал быть тим лидом – это совсем другой подход).

Он рассказал, что если чего-то не знаешь, лучше сразу об этом говорить, ведь позже это приведет к еще большим проблемам. Что корпоративная культура – это не центр вселенной, важнее – люди и отношение к людям. Важно часто разговаривать с коллегами, обосновывать те или иные шаги, принимать мудрые и обдуманные решения. Не нужно придираться к мелочам.

Впрочем, я пока слушал доклад и получал ответ на вопрос от этого спикера, понял, что с этим я в корне не согласен, потому что сам действовал наоборот: пояснил коллегам, что из всего многообразия того, что у нас уже есть, надо выбрать стандарты, документы, вместе следовать одним и тем же элементам стиля, пусть и не сразу. Это оказалось важно, потому что исправлять транслит в разросшемся проекте – не самое приятно дело. Слушать о том, что есть какой-то технический долг – аналогично. Но меня поразило другое: скорее ситуация была совсем другая, а не так что я не согласен с ним полностью.... Мы вроде говорим на одном языке, думаем об одних и тех же ситуациях, просто у него своя энергетика, у меня – своя. Разные боли и методы решения ежедневных вопросов. Имея разные представления, где-то в мире без слов скорее взгляды совпали, хотя на уровне слов я так и не остался согласным с его точкой зрения.

История 3.

Тимлид из Wildberries и программист из Яндекса поделились антипатернами в рабочем процессе и в поведении сотрудников на рабочих местах. "Если сроки горят, а работа не сделана, когда как ты такой прекрасный и любящий свою команду тим лид, "... "люди – это только винтики одного рабочего процесса... Связаны одной целью, скованы одной цепью".

Честно – этот формат понравился больше всего, потому что на отрицание ребята поработали, и вместо того чтобы спать на конференции, слушая, что ты должен делать, ты наоборот пытаешься шутки, рассказанные со сцены, сопоставить с тем, как ты работаешь последние несколько дней...месяцев...лет... А это оказалось интересным!

Те самые антипаттерны
Те самые антипаттерны

Как минимум одно из высказываний ребят нам показалось странным, потому что специалистов учат "отсесть и разобраться", а в Технофее мы держимся принципа "Спрашивай, обменивайся знаниями". В компоративной среде, видимо, сложнее так делать, потому что ты задаешь много глупых вопросов коллегам, не предлагая ничего взамен. Они говорили и об этом, дескать "у тебя же все такие профессионалы, забивай на свои задачи и просто ходи по столам и беседуй со специалистами, как и что правильно решить в твоих задачах, это же так просто!"... Ну с таким подходом, как они это обрисовали, действительно это антипаттерн, хотя в Технофее это, наоборот, называется возможностью быстрее поделиться опытом и вместе идти дальше к цели.

История 4.

Девушка стала руководителем отдела разработки. Начинала она позиции HR-специалиста, и те люди, которых нанимали еще Junior-программистами, в ее отделе теперь доросли до Тимлидов. Она рассказала про планирование целей по SMART, про то, что ты сначала ставишь срок до достижения цели, но затем как раз-таки декомпозируешь задачу и главное – результат стоит строго ДО крайнего срока выполнения всей задачи. Процентов так 40 времени – это тестирование уже готового кода. а процентов 15 – тот самый запас по времени, когда задача вроде теоретически должна быть решена, но до окончания сроков еще есть немного времени.

Понравилось, что такое планирование как раз и четкое, такому учат и в университетах Франции и Германии, надо прививать этику четкости и для русского народа, потому что у нас уникальная культура, но успешные методологии планирования и целеполагания никто не отменял.

Итог

На конференции мы не остались только на последний доклад, потому что уже очень устали. Хотя хотели посидеть меньше. А я вообще больше работал за ноутбуком, просто слушая доклады на заднем фоне, так интереснее работать, кстати. Хотя каждый день бы так надоело работать под такой подкастинг на мероприятии.

Несмотря на то, что без инженеров это место кажется интересным лофтом, но с кучей инженеров проходимость еле возможна внутри помещения, ощущения остались такие: за сутки мы нахватались много новых слов, из них процентов 30 - это сленг типа "ботать", 30 – новая терминология по алгоритмам ML, 40 – уже известные слова, которые вновь всплыли в голове. Например, ESLint я всегда называл на работе Сплинтером (похожие вещи Eslinter и Splinter), когда еще работал Junior-программистом в Comindware в далеком 2020. Я вспомнил это средство для проверки синтаксиса в Visual Studio Code, когда задавал вопрос по окончанию доклада. Автокодировщики, энкодеры, двухслойная нейронная сеть, библиотеки типа Pytorch. Да все и так используется, просто я в последнее время сидел вообще в мобильной разработке на Flutter, и было интересно, чтобы эти названия снова вспыхнули в памяти.

Надеюсь, с каждым годом в Москве будет еще больше таких мероприятий.

История от Евгения Николаевича Рычкова

Едем на обед с мероприятия
Едем на обед с мероприятия

#ML #нейросети #мероприятия #москва #технологии

Комментарии (4)


  1. timofas
    30.05.2025 11:30

    как по посещениям пациента предсказать диагноз? это как прикрепление - может быть только одно с точки зрения тфомса и страховой, по факту болячек всё больше и больше :)

    плюсом идет неотложка и приписки от мо-шек :)

    накатайте статью, будет интересно


    1. technofeya Автор
      30.05.2025 11:30

      Ну здесь приведен больше обзор тезисно в целом того, что получилось услышать за столь короткое время. Я бы от себя мог расписать теорию, но интересно от первых уст просто сжато передать что-то короткое и полноту мысли о том, что можно в ИИ делать. Мультимодальность датасетов позволяет оценивать не только речь, видео, ЭКГ, давление, но и эмоциональный окрас, смотря как это развивать. Работа современных поликлинник и роддомов - как по мне это базируется на том, сколько они вообще готовы платить ITшникам и там набираются на работу определенные люди с определенным отношением к жизни, сами алгоритмы и исследования здесь ни при чем.

      Согласен, что на уровне даже крупных университетов и исследовательских центров на этом хайпятся, осваивают бюджет и клепают статьи, используя непонятные, но простые в житейском смысле слова формулы, добавляя к фундаментальной теории немного дообучения и пару штрихов в рамках ТРИЗ. Но задачи уровня "Доктор, у меня есть простуда или нет", решаются спокойно с минимальным количеством признаков. Можем действительно попробовать свою статью и поисследовать что-то в данном направлении, но так получилось, что в родне психотерапевт европейского реестра и очень хороший психолог, в целом с чего-то начинать с оценкой или прогнозированием диагнозов без денег в этой области не очень охота, нужен заказ на эту тему)

      Мы больше игрались с прогнозированием оценки эффективности вложений в объекты недвижимостей, вроде более перспективное направление.


  1. Margutoop
    30.05.2025 11:30

    Здорово, что в России развивают эти направления. Data Science и AI сейчас правда меняют мир, и такие ивенты помогают. Если там есть хакатоны, лекции или стенды с технологиями - вообще огонь! Главное, чтобы это был не просто "показушный" ивент, а реально полезный для тех, кто в теме


    1. technofeya Автор
      30.05.2025 11:30

      Да если и "показушный" эвент – сложный вопрос, однако, что интереснее узнать на таком мероприятии продолжительностью 8 часов.

      Согласен, что когда слышишь одни формулы – проще нахвататься этого всего, но чего нахватаешься от человека, который слабо понимает, что говорит.... Когда в меру хайпа – он как-то больше вдохновляет, это бывает эмоционально и свежо. Ну ок, согласен, что если чисто одни продажники и хайп, мало сопоставимый с реальными экспериментами реальных инженеров, – ну такое себе.

      Ну на мероприятии было интересно и жарко в целом – чередовали доклады, полные экспериментальной части, которую пытались рассказать за несколько минут, с вайбовыми докладами, на которых вообще можно было посмеяться. Но по теме ИИ.