Несколько месяцев назад я написал статью, в которой предлагал несколько идей, как находить на Хабре действительно интересные, но давно забытые статьи. Я сравнил эти статьи с принцессами, затерянными в хранилищах Хабра, с которыми можно встретиться только случайно и то, если поисковик благоволит такой встрече. В первом же комментарии к той статье на связь вышел продакт Хабра и заверил меня, что Хабр уже движется в этом направлении и даже, что мои предложения «утащили в беклог». Однако, как говорится, «обещать — не значит жениться». Спросите у любой принцессы. Каждая подтвердит. Время шло... В общем я почти потерял надежду...
Экзотический проект
Мыслящий человек просто обязан
время от времени это делать.
Тот самый Мюнхгаузен
В свободное от чтения Хабра время я пытаюсь руководить программными проектами. При этом я стараюсь сделать так, чтобы мои сотрудники были загружены на этих самых проектах не более чем на 80% своего рабочего времени. Вы спросите: «A что они делают оставшиеся 20% времени?» Для того, чтобы мои коллеги не скучали, у меня есть специальный проект. Об истории появления этого проекта я уже однажды писал на Хабре.
Проект посвящен решению задачи, с результатами которой встречался каждый читатель Хабра, — задачи формирования расписаний занятий в учебных заведениях. Другими словами, в рамках этого проекта осуществляются попытки получить прикладные алгоритмы поиска частных решений NP‑полной задачи распределения ресурсов при управлении производством самого дорогого материала в мире. А поскольку это моя личная выдумка, об этом проекте можно хвастаться рассказывать кому угодно и когда угодно, не боясь нарушить NDA. Например, не скрывая ничего, рассказать потенциальному клиенту в деталях, как можно сократить потери его бизнеса только за счет автоматизации распределения ресурсов. Однажды на примерах этого проекта я объяснил топ‑менеджеру крупного предприятия одной, тогда еще братской страны, каким именно образом для его производства можно автоматизировать методологию OKR. И представьте себе, он меня прекрасно понял! Правда, реалии жизни внесли коррективы в намечавшееся сотрудничество.
В пору моей молодости такие проекты назывались НИОКР. Но почему‑то сегодня такие слова на совещаниях звучат как‑то неприлично. Поэтому я сегодня называю этот проект учебно‑инновационным.
Раньше я использовал этот проект в личных целях. Для удовлетворения самых изощренных и экзотических фантазий угасающего во мне программиста.
Как показал мой опыт, регулярные сеансы кодотерапии на внешнем проекте служат хорошей профилактикой от технической деградации вследствие работы руководителем. А потом я подумал, зачем мне страдать радоваться в одиночестве? Надо бы привлечь к этому проекту стажеров, чтобы в этой песочнице посмотреть, на что они способны, и кроме того, чтобы они могли на реальном проекте почувствовать, что значит участвовать в командной разработке. С применением git, jira и других командных инструментов. Этим инновационным проектом я стал управлять ровно так же, как управляю и другими своими программными проектами. Только вот в этом проекте можно безболезненно переносить сроки и делать ошибки.
Со временем я стал привлекать к этому проекту не только стажеров, но и штатных сотрудников. Правда, только тех, кто хотел в этом проекте участвовать в интересах своего профессионального роста.
Поэтому этотже проект стал служить для решения важных, но несрочных задач (см. матрицу Эйзенхауэра). Например, хочет сотрудник изучить новую технологию. А я ему: «Вот тебе инновационный проект — апробируй на нем! А если получится хорошо, потом будем применять».
Кроме того, наличие такого проекта позволяет успешно бороться с неравномерностью загрузки сотрудников. В Японии эту напасть называют мури. Поскольку сроки решения важных задач можно безболезненно перенести, этот проект стал играть роль буфера для деятельности команды в рамках заключенных договоров. Ведь если у вас есть резерв времени, вы можете без авралов ликвидировать внезапно возникающую головную проектную боль в рамках рабочего времени.
Если вышестоящее руководство требует представить план развития сотрудников моей команды, мне ничего не надо придумывать. Все задачи, которые зафиксированы в рамках учебно‑инновационного проекта, — это задачи для развития моих сотрудников.
Повышение квалификации
Я кажется, отвлекся от основной темы статьи. Так вот, мечтая о том, как можно находить интересные, но давно забытые статьи на Хабр, я подумал: «А чем мы собственно хуже Google или Yandex, которые каждый день перелопачивают Хабр вдоль и поперек?»
С другой стороны, у меня в команде один из сотрудников специализировался на десктопных решениях С#, но давно хотел себя попробовать в web. При этом, будучи адептом С#, он не хотел совершенствоваться ни в чем другом. Я подумал: «А почему бы и нет?» В результате в рамках самосовершенствования сотрудник получил задание разработать специализированную поисковую систему для поиска интересных статей на Хабр. Ограничения были следующие: программа должна быть написана в рамках требований по импортозамещению, работать на Ubuntu, в качестве БД использовать Postgres. Также, хотелось реализовать фильтр со множественным выбором и сортировку по столбцам итогового списка объектов.
Краулер был написан за полдня. Чтобы сложить результаты в БД и приделать к ней минимально рабочую web-форму, потребовалось еще время. Во время отладки программист стал жаловаться на то, что постоянно отвлекается на изучение интересных статей.
В результате этого челенджа появился инструмент, с помощью которого вы можете найти статью на Хабре, опубликованную в определенный вами период времени, для определенных вами хабов, с учетом ограничений по минимальному количеству лайков, закладок, просмотров, кармы автора, цитирования другими авторами Хабра и конверсии, как отношения количества закладок на тысячу просмотров.
Удовлетворение фантазий
Когда вам одиноко
И грустно отчего-то,
Иль что-то охота понять....
Песня о звездах
Результат создания нашей «специализированной поисковой системы» выложен в открытый доступ, и каждый желающий может применить этот инструмент для поиска своих «принцесс» на Хабре.
Мы надеемся, что наша инициатива поможет реализовать подобные штатные механизмы поиска на самом Хабре. Конечно, хотелось бы также иметь возможность делать выбор не только по конверсии закладок, но и по конверсии лайков в первый месяц публикации.
Надо отметить, что не все первоначальные гипотезы о критериях ценности статей получили подтверждение. Так, например, не оправдало себя построение рейтинга статей по индексу цитирования. Как оказалось, авторы Хабра довольно редко ссылаются друг на друга, и поэтому данный критерий, на мой взгляд, оказался слабо чувствительным. Также оказалось, что не все статьи с высокой конверсией действительно заслуживают внимания.
Вместе с тем, используя комбинации фильтров, я нашел для себя немало интересных и познавательных статей, которые без нашего поисковика никогда да бы не попали в поле моего зрения.
А что вы об этом думаете?
Комментарии (13)
tempick
03.12.2024 08:42Круто! Вот бы ещё фильтр по кол-ву комментариев. Люблю залипнуть в дискуссии на 200+ комментов чтобы отдохнуть от работы)
rapidstream
03.12.2024 08:42...мои предложения «утащили в беклог»
...но вытащили из бэклога эти позорные смайлы под статьями. Что хорошо иллюстрирует приоритеты Хабра и его продакта.
zabanen2
03.12.2024 08:42я потерял статью от games mail ru, где они рассказывали про многопользовательские игры, а конкретно - как защищать данные на стороне клиента от взлома: обфускация, маниакально не хранить ничего не стороне клиента ит.п., словно сам игрок - враг. статья показалась очень интересной, т.к. это был реальный опыт (в битве против ботов) разработчиков, но тон комментариев был негативным. спустя время я ее не смог найти. с тех пор я сохраняю статьи локально. возможно статья удалена, но поиском найти ее точно не смог.
legolegs
03.12.2024 08:42А точно автор мейлру? Я помню ,что варгейминг что-то такое где-то писал, и фраза "клиент в руках врага" там была.
aborouhin
03.12.2024 08:42Рабочая гипотеза - в разные годы на Хабре была разная активность пользователей, поэтому чтобы найти статьи одинаковой полезности/популярности, имеет смысл искать не только по абсолютным значениям просмотров/рейтинга, но и по их соотношению к среднему для всех статей в год публикации.
ArtyomOchkin
03.12.2024 08:42Интересно, а нет ли случайно ссылочки на ГитХаб с исходниками? Было бы любопытно поковыряться...
velon
03.12.2024 08:42А что считается цитированием? Это ссылка на публикацию из другой публикации? А самоцитирование исключается?
aimfirst Автор
03.12.2024 08:42Под индексом цитирования здесь понимается количество других авторов Хабра, ссылающихся на эту статью. Именно авторов, а не ссылающихся статей.
Boomburum
Класссс :) С разбега нашёл пару интересных и хорошо забытых статей.
Заметил, что не везде точно показывается карма автора (может отличаться на пару пунктов от сайта), равно как и поле «автор» не помешало бы. А также было бы интересно иметь возможность "провалиться" в циферку цитирования.
Очень здорово, спасибо!
aimfirst Автор
При наличии цитирования можно "провалиться" на список статей кликнув на дату публикации (в первой колонке). Список ссылающихся статей выведется в нижней части формы после основной таблицы. Поскольку мы не ставили целей регулярного пересканирования статей, карма показывается не совсем точно, поскольку за время прошедшее со времени сканирования статей она могла подрасти.
Boomburum
С цитированием не очень очевидно, но работает - супер, спасибо! :)