Постараюсь без долгих рассуждений, сразу к делу. Привет, я mobilz, и в своё время я уже "сливал" некоторые исходники Яндекса в том числе. Предварительно, конечно, предупредив их. К текущим событиям я не имею отношения, но у меня есть мысли, которыми я хочу поделиться.

Во-первых, это звиздец. Это не первый слив, но, наверно, самый крупный. Если бы такое произошло с моими проектами, я бы сел в углу, обняв колени, и долго плакал.
Во-вторых, это лучшее, что произойдёт с русским ИТ в этом году. Такого роста, как в этом году, мы не увидим ещё долго.


Несомненно, Яндекс как коммерческая компания, потеряет прибыль на короткой дистанции. Много времени будет потрачено на исправление узких мест, подхода и архитектуры. Но на длинной дистанции, выиграют все, в том числе и сам Яндекс, который получит ценные кадры. Опять же, если опускать лирику, то базы Яндекса (доставки, такси) сливали не раз, Яндекс отделывался штрафом. Но теперь всё поменялось.

Предпосылки.

Монорепозитории, это очень удобно. Последние лет 5 мы активно видим, что многие переходят на монорепы, и Яндекс в своё время был одним из пионеров данного подхода. Однако, это играет в том числе и злую шутку.

Упомянутые мной выше сливы баз данных были звоночками. Безнаказанность, а именно штраф в 60 000 рублей за слитые персональные данные клиентов "Яндекс.Еды" тому подтверждение. Это не значит, что разработчики дураки или им плевать, просто нет ответственности.

Политическая ситуация в стране. Сегалович, вечная память, теперь и Волож с топам, уехавшие из России, это отрицательный рост. Конечно, не Кудрин в этом виноват. Чтобы разрушить то, что создавалось десятилетиями, ему бы пришлось очень сильно постараться. Но дата последней модификации данных намекает, что не все согласны с этим. Можно долго рассказывать, что и Макдональдс не ушёл, а продал свой бизнес, и что Икея заработала на нас миллиарды и сбежала, поджав хвост. И автогиганты пытаются нам насолить, все вокруг дураки. Однако, крупные ИТ и не только, отрицательно прибавляются в стране, увы.

Кто это сделал?

Две основные теории, снятые с уст:

  1. Взлом, опираясь на предпосылки (прошлый абзац).

  2. "Крыса" внутри, которая имела доступ и просто слила.

Я лично не верю во второй вариант. Могу ошибаться, но доводы такие:

  • 26 января, 11 месяцев спустя? А почему не сразу? А почему не после Бучи? А почему не после 21 или 30 сентября? Где вы были 8 лет?

  • В сливе многое отсутствует. Где-то целиком директории, где-то конкретные файлы. Это больше похоже не на "крысу", а на расчёт.

  • Архитектура монорепов позволяет это сделать внешнему человеку при определённых условиях.

  • Неподготовленность к подобному, лично для меня, указывает на исключительность ситуации. Очевидно, Яндекс имел защиту от подобных внутренних сливов, но столкнулся с чем-то другим (вспоминаем хаос в закрытых телеграм-чатах 26-го января)

Я не говорю, что это точно взлом. Никто не застрахован от сотрудника, который медленно и планомерно, тихонько, чтобы никто не заметил, сливал ресурсы. А потом, попивая лонг-айленд на Кубе, решал, что конкретно из них он опубликует, а что нет.

Зачем?

Самый короткий абзац, Для меня ответ в mtime, последней модификации файлов. Можно долго спорить, можно говорить, что это просто пыль в глаза итп. Факт -- такое могло произойти раньше. Факт -- не произошло.

Что тут хорошего?

Я мельком глянул на сурсы. Первое, что я для себя отметил -- надо подтягивать go, python и, конечно, c++. Возвращаясь к заголовку статьи, кажется, это кладезь best-practice в плане c++/python/go/typescript/docker/etc как минимум. В README.MD часто я так и встречал: "Готовые либы либо на c, делать обёртку для c++ -- дешевле с нуля написать. А готовые либы на c++ -- люди не понимают, как делать архитектурно качественные либы". В реакт приложениях зависимости -- минимальны. Там, где я ожидал увидеть reanimated или react-navigation -- собственная реализация. Не значит, что она лучше и круче, просто "ребята" действуют изолированно. Далеко ходить не надо, яркий пример ClickHouse, который стал публичным и общедоступным и завоевал своё место в крупнейших компаниях типа cloudflare, bloomberg и менее известных для b2c компаниях, связанных с AD. Но не менее масштабных.

В сурсах мы можем встретить как супер простые скрипты, типа валидации json, енкода/декода base64/pbf/скрипто_функций, функции архивации, работы с геоданными итп. Так и достаточно сложные алгоритмы анализа данных.
На гитхабе много исходников крутых проектов на c/c++, но где ещё встретить весь спектр, от простого к сложному? При этом много кода документировано. Одно дело познавать c++ по тому же ClickHouse, где над каждой строчкой думает команда, пытаясь её оптимизировать и не допустить лишних memcpy. Другое -- начинать с малого, например, валидации урла. Современный мир перенаполнен skillbox`ами и прочими Яндекс.Практикумами, которые зачастую навязывают "свои" технологии и грязные шаблоны. Тот же, _BEM я не часто встретил в этих исходниках.

Очевидно, что исходники "Яндекса" привлекают внимание. Даже если окажется, что многие проекты были в открытом доступе, что так и есть, многим будут интересны именно "слитые" исходники. Их будут изучать. Учитывая, что Яндекс была и есть пока крупнейшей и самой качественной ИТ командой в стране -- все, кто получили сурсы и будут равняться на них, скорее будут играть в плюс.

Очевидно, что многие сурсы будут интересны и пентестерам. В нашей стране деятельность по неправомерному доступу к компьютерной информации давно интерпретируется вольно. Это раньше отдел "К" мог ворваться к тебе домой и изъять монитор (на нём же вся информация, да?), современные реалии компенсируются несовершенными законами очень просто -- ты если храбрый, то либо с нами, либо мы найдём, за что тебя посадить, 228 никто не отменял. Статья "президентская", получишь максимум. В том числе поэтому мы можем наблюдать сводки, что "русских" хакеров ловят в основном за границей. IB не в счёт.
Это не значит, что Яндекс может потирать руки и ждать новых сотрудников + бесплатную секьюрити аналитику, конечно нет. Очевидно, Яндекс заплатит много денег за пентест с доступом к исходникам. Но не зря они объявили "повышенные ставки" на "охоту на ошибки". Странно, что срок короткий. Вангую, что продлят. И все выиграют. Сами разработчики скажут "спасибо", если среди их кода найдут уязвимости.

"Взрослые" компании получили отличный пример, как надо делать. Инфраструктура, логика и реализация у Яндекса всегда была чем-то "волшебным". Сейчас мы все можем убедиться в том, что это были не сказки, так оно и есть. Всё структурировано, документация к каждому проекту, кодстайл к каждому проекту, почти в каждой документации отдельный пункт: "если чего-то непонятно -- не стесняйтесь, спрашивайте". Внутренние CRM, аркадия, вики, сообщества и чаты. Отличный повод посмотреть на то, как делаешь бизнес "лично ты". Есть на кого равняться.

Что тут плохого?

Помимо очевидных коммерческих потерь, Яндекс получил репутационные убытки. Не то, чтобы им привыкать, но исходники робота сайтов и антиробота с капчей -- это пул для дальнейших коммерческих убытков, как минимум

Обиженные партнёры маркета, которые считают, что их минусуют -- вот же исходники, давайте смотреть. В выдаче ты не на первом месте -- вот исходники (да да, робот просто собирает данные, анализируются они уже после, но доступ к роботу таки есть). Скрытые функции и настройки яндекс-навигатора -- вот же они, читай код. Таксисту не дают заказ, кооторый рядом с ним -- вот же, у тебя скорость выше предела (насколько я понял, что-то вроде больше 55кмч) или меньше предела, т.е. ты стоишь... Очевидно, что внутренние алгоритмы ударят по Яндексу и многие захотят этим воспользоваться. Кто-то чуть раньше, кто-то чуть позже. Яндексу искать новые метрики для алгоритмов это хорошо, но это не произойдёт быстро. Как и не произойдёт быстрого перестроения архитектуры. Я к тому, что Яндекс, очевидно, внепланово потратит много денег, чтобы компенсировать этот слив. И, очевидно, это отразится на нас -- пользователях Яндекса (такси, еда, поиск, кинопоиск, авто.ру и так далее).

Ну и не забудем про новые сливы баз данных. Если и раньше мы с этим сталкивались, то теперь это станет нормальным событием. Если, конечно, гении из Яндекса, быстро не решат эту проблему. Увы, я сомневаюсь, что Кудрин "гений из Яндекса". Он гений, но точно не про Яндекс и современную ИТ компанию.

Юрий Дудь Синодов (если вы не в курсе, то это "Дудь" в ИТ журналистике, webplaneta, roem итп) высказался, что прелесть тех немногочисленных гениев, что уехали с Воложем старшим -- они за неделю сделают то, что сотрудники Яндекса делали десятилетиями. Конечно это не так и конечно Юрий имел введу новые проекты на основе старых. Воссоздать инфраструктуру текущего Яндекса за неделю точно не получится, да и за пол года не получится. Даже "гении", что уехали с Воложем, потратят много времени, чтобы понять что это и как этого избежать в дальнейшем, вместо того, чтобы создавать дальше.А им так же придётся о этом думать, т.к. они так же к этому причастны.

Вместо послесловия.

Много внутренних проектов Яндекса в своих сурсах "по дефолту" имеют лицензию MIT, это явно прописано в метафайлах. Другие исходники никак не подписаны, что так же позволяет их копировать, использовать в коммерческих целях, видоизменять итп. Как бы сильно лично я "нелюбил" Яндекс (для меня они давно корпорация зла), я искренне шлю лучи добра всем оставшимся в РФ сотрудникам. Вы очень крутые и большие молодцы, то, что вы создали и поддерживаете -- это национальное достояние. Проглядывая сквозь пальцы ваши сурсы, я убеждаюсь в том, что вы большие профессионалы. Терпения вам и ни в коем случае не унывать. Повторю, данный слив актуален только "здесь и сейчас", в ваших руках сделать его "неактуальным" пол года спустя. Не ругайтесь на вайтов, что они пентестят основываясь на ваших сурсах. Так сложилось. И большое спасибо вам за то, что документируете код.

Это не ваша вина.

Комментарии (193)


  1. SibirAy
    28.01.2023 10:07
    +57

    дудь программирование заговоры яндекс кудрин ))))) сильно


    1. mobilz Автор
      28.01.2023 10:08
      +7

      машинное обучение забыл вместе с ИИ, извиняюсь


      1. vanxant
        28.01.2023 14:17
        +9

        а где блокчейн?!


        1. mobilz Автор
          28.01.2023 14:29
          +10

          web3.0!


          1. AVX
            29.01.2023 14:54
            +2

            half life 3!


            1. Eugeny1987
              30.01.2023 06:12
              +15

              ну это уже перегиб :)


  1. evgsavosin
    28.01.2023 10:20
    +150

    Коротко о статье: смешались в кучу кони, люди.

    Вроде статья о сливе исходного кода Яндекса, а ощущение, будто на кухне собрались диванные эксперты в области политики и проводят "содержательные" и "интеллектуальные" беседы.


    1. mobilz Автор
      28.01.2023 10:21

      я поэтому и поставил "мнение". это вам про докеры в кубернетихах запускать, просто отдохнуть и подумать, поделиться своим мнение. что вы сами о этом думаете?


      1. Maccimo
        28.01.2023 13:38
        +15

        я поэтому и поставил «мнение»

        На эти мертворожденные «типы публикаций» никто не смотрит, так что считайте, что вы ничего и никуда не ставили.


      1. Moskus
        28.01.2023 21:15
        +24

        Это, конечно, сейчас модно - считать, что любая необоснованная идея достойна публикации, если назвать ее "мнением". Но для подобных рассуждений есть более точное название - спекуляция.

        Анализа вопроса - нет, обоснований предположений (например, на недавних исторических примерах) - нет.

        что вы сами о этом думаете?

        Вы заметили, что тут уже было несколько статей с обсуждением в комментариях и решили таким образом "стимулировать дискуссию"?


        1. mvv-rus
          28.01.2023 21:41

          Но для подобных рассуждений есть более точное название - спекуляция.

          Нет, это название для всех подобных рассуждений - менее точное, т.к. имеет в русском языке дополнительный негативный смысл, привнесенный из уголовных кодексов времен СССР.

          Я отстаиваю мнение, что для подобных рассуждений более точным их определением являются "умозрительные".

          Конкретно по поводу рассуждений автора: вряд ли публикация какких-либо исходных текстов способна повлиять сейчас на развитие нынешнего массового IT. Хотя бы потому, что чужие исходники мало кто читает (да, это - тоже умозрительное рассуждение).


          1. Moskus
            28.01.2023 22:00
            +1

            Спекулятивное суждение - понятие из философии и риторики, которое является практически синонимом для "умозрительного суждения" и используется не только в русском языке.

            К финансовой спекуляции оно не имеет непосредственного отношения и носит негативный характер уже само по себе, так как такое суждение не опирается даже на опыт.


            1. mvv-rus
              28.01.2023 22:03

              Я правильно понимаю, что вы согласны с моим уточнением, поскольку и обсуждаемая статья, и комментарии к ней написаны именно по-русски?


              1. Moskus
                28.01.2023 22:18

                Я не считаю ваше высказывание "уточнением". Это просто синоним. С тем, что вы настаиваете на том, что это уточнение, потому что у вас есть ещё одна негативная ассоциация с этим, я не согласен, потому что это особенности вашего восприятия. Это детали на уровне шумов.


                1. mvv-rus
                  28.01.2023 22:21

                  Дело в том, что эта ассоциация есть далеко не только у меня. Поэтому, я думаю, такое уточнение необходимо.


                  1. Moskus
                    28.01.2023 22:36
                    -1

                    Какая, по-вашему, часть имеющих такую ассоциацию, не в курсе, что это разные понятия из экономики и философии, обозначаемые одним словом? Только наличие проблемы смешения понятий может оправдывать "необходимость" уточнения. Которое я сделал сам, дав ссылку на значение термина в оригинальном комментарии.


        1. Newbilius
          30.01.2023 08:23
          +1

          Но мнение - всего лишь это утверждение уровня "я считаю, что [так то и так то]", не более того. Мнение может быть плохо обоснованным или вообще необоснованным, но от того не перестанет быть мнением. Оно просто есть.

          Но соглашусь с тем, что если назвать непроработанный пост мнением, лучше от этого пост не станет)


  1. miga
    28.01.2023 10:25
    +33

    Надо подтягивать питон до уровня Яндекса.

    Уровень Яндекса: https://twitter.com/nikitonsky/status/1619042242701987840?s=46&t=yH4YtamF_sUi5TVStZSV6A


    1. mobilz Автор
      28.01.2023 10:38
      -29

      у вас ссылка на террористическую соцсеть ) про питон не могу спорить, но cpp там интересный


      1. KongEnGe
        28.01.2023 10:41
        -31

        Вы все еще находитесь там, где она считается террористической? А зачем?


        1. mobilz Автор
          28.01.2023 10:59
          +2

          это был сарказм, но да. я пока не научил роутер обходить deep. не понимаю, за что вас минусуют, вы правы


          1. KongEnGe
            28.01.2023 12:16
            +22

            Комментарий был скорее про то, что определенные нарративы не стоит реплицировать по чисто гигиеническим соображениям даже в целях сарказма.


            1. mobilz Автор
              28.01.2023 12:32
              +6

              вы запрещаете мне в субботу сарказмировать?


              1. KongEnGe
                28.01.2023 12:45
                +7

                ну что вы, всем нам иногда нужно отчудить что-нибудь этакое


          1. morijndael
            30.01.2023 14:43
            +2

            пока не научил роутер обходить deep

            https://tw.rijndael.cc/nikitonsky/status/1619042242701987840

            Или любой инстанс Nitter по вкусу. Заодно грузится быстрее чем тонна джаваскрипта


    1. Yuribtr
      28.01.2023 17:27
      +8

      d = {
          95: '+ 95-99%',
          90: '+ 90-95%',
          85: '+ 85-90%',
          80: '+ 80-85%',
          75: '+ 75-80%',
      }
      
      
      def get_lowest(mapping: dict, value):
          keys = sorted(mapping.keys(), reverse=True)
          for key in keys:
              if value > key:
                  return mapping[key]
          return mapping[keys[-1]]

      Ну блин, почему там не сделать нормальный маппер. Типа такого (прототип на коленке), ведь глаза вытекут читать такой код.


      1. LinearLeopard
        28.01.2023 18:19
        +24

        Видимо, на собеседовании по алгоритмам рассматривают, как перевернуть бинарное дерево или связанный список, а не операции целочисленного деления.


      1. lgorSL
        28.01.2023 18:24

        А ещё можно добраться до lower_bound = int(value / 5.0 // 1 * 5)
        P.S. Хм, можно ещё короче - lower_bound = int(value // 5) * 5


        1. Yuribtr
          28.01.2023 18:48
          +10

          ИМХО конечно, но ваше решение тяжелее читать, к тому же мы не знаем будет ли разница в 5 единиц постоянной.
          Почему то в погоней за краткостью забывают, что краткость не должна вредить читаемости.

          По ссылке сверху вообще предлагают такой способ, это же мрак какой то

          lambda x: {-1.0: '-', 1.0: '+'}[x/abs(x)] + ' ' + str(int(abs(x)/5) * 5) + '-' + str((int(abs(x)/5) + 1) * 5) + '%' if x != 0 else '- 0-5%'


          1. dom1n1k
            28.01.2023 18:57
            +5

            Я не особо в теме, что и как принято у питонистов, но если этот километровый однострочник тупо разбить на 3-4 части, сохранив промежуточные результаты в переменные с понятными именами, будет лучше.


            1. Yuribtr
              28.01.2023 19:40
              +8

              У питонистов так не принято, потому что как минимум есть PEP8 и ДЗЕН питона. То есть можно написать игру Змейка в одну строку но в прод такой код не должен попасть, так как поддерживать это будет невозможно.


          1. lgorSL
            28.01.2023 19:20
            +2

            ИМХО конечно, но ваше решение тяжелее читать, к тому же мы не знаем будет ли разница в 5 единиц постоянной.

            Eсли разница в 5 единиц поменяется, в оригинальном "решении" придётся все-все цифры и обозначения руками переписывать и при этом нигде цифры не перепутать. B скобочки не забыть.
            Я бы предпочёл короткое решение + несколько тестов на краевые случаи, а не ручное перечисление 30+ возможных вариантов.


            1. Yuribtr
              28.01.2023 19:43
              +2

              В том то и проблема, что подгоняя алгоритм под условия вы будете вынуждены его потом переписывать. Я бы стремился к тому, чтобы алгоритм был насколько возможно универсальным, а условия задавались декларативно.


              1. LinearLeopard
                29.01.2023 21:29
                +5

                В том то и проблема, что подгоняя алгоритм под условия вы будете
                вынуждены его потом переписывать. Я бы стремился к тому, чтобы алгоритм
                был насколько возможно универсальным, а условия задавались декларативно.

                Согласен, зачем выпускать код с шагом в 5 в прод, когда можно устроить пару митингов действительно ли мы хотим 5, как часто они будут меняться, надо ли поддерживать отрицательные и комплексные числа и за какую-нибудь неделю другую запилить алгоритм, который будет поддерживать любой шаг, считывать его из env api метода с авторизацией, чтобы поддерживать изменение шага без перезапуска сервиса и содержать несколько багов, которые потом вылезут и можно будет править их ещё несколько недель.

                P.S. И выкинуть его ещё через месяц, когда выяснится, что шаг может быть не постоянный, и надо выводить <5, 5-15, 15-30, 30-50, >50


            1. Wesha
              29.01.2023 06:35
              +1

              в оригинальном "решении" придётся все-все цифры и обозначения руками переписывать

              ...а в это время за углом притаился, помахивая хвостом, толстый полярный эффект последней строки.


      1. nronnie
        30.01.2023 17:53

        Код может быть написан таким образом просто потому что так написали аналитики в ТЗ, только словами.


    1. nkormakov
      29.01.2023 02:33

      А где в сорцах данный код? Я пытался его отгрепать, но не нашел.


      1. nick758
        29.01.2023 03:50
        +1

        market\analytics\price_opt\dependence_sales_in_deadstock.py


        1. druidvav
          29.01.2023 05:18
          +1

          Есть вероятность, что это "одноразовый" код для выборок, что не отменяет того, что это отвратительно.


          1. Yuribtr
            29.01.2023 08:26

            Странно что такой код попал в прод. По идее его какой нибудь Сонаркуб и flake8/black не должны были пропустить. Исключений noqa я не вижу. Интересно, как у них вообще качество кода оценивается.


            1. druidvav
              29.01.2023 08:28

              надеюсь не по количеству строк вклад оценивается. в целом качество кода по разным проектам там сильно разное, код на php который я нашел (auto.ru) это вообще полный мрак и профнепригодность даже по временам его написания.


            1. DMGarikk
              30.01.2023 14:30

              ну кстати не особо странно
              я не про Яндекс, но про крупные конторы где был и сонар и флейк и блек, и кошмар в кодовой базе одновременно
              код был написан давно, сонаркуб включили сильно позже, и насколько я помню он старый код не проверяет… и пока никто не полезет его править сонар ругаться не будет, а flake можно и глобально настроить


              1. sergeaunt
                31.01.2023 02:50

                У меня не особо большой опыт работы с сонаром, но я запомнил его как нечто, из-за которого у нас в коде завелась константа EMPTY_STRING (java). В общем, как штуку для искалечивания нормального кода.


                1. druidvav
                  31.01.2023 05:08

                  В целом это не выглядит как что-то плохое, по крайней мере осознанно написали что пустая строка, а не просто забыли текст засунуть.


          1. dakuan
            30.01.2023 16:51
            +1

            Может, этот код был автоматически сгенерирован чем-то? Как-то с трудом верится, что человек в здравом уме мог всерьез написать такое.


            1. DMGarikk
              30.01.2023 17:40

              … вот что олимпиадные задачи с людьми делают…


            1. druidvav
              30.01.2023 18:36

              Не боги горшки обжигают. В яндексе средний уровень кодеров не сильно отличается от общего, помимо талантливых есть и обычные и вот такие.


              1. dakuan
                30.01.2023 20:27
                +1

                Даже у самого лютого говнокода обычно есть объяснение)
                Тут же, мне кажется, нормальное решение будет гораздо проще, чем этот монстр. Т.е. вместо того, чтобы написать максимум 10 тривиальных строк, кто-то специально заморочился и написал целых 40. Либо человеку платили за код построчно, либо это сгененрированный код/трансляция с другого языка.


  1. Kremleb0t
    28.01.2023 10:28
    +34

    Слово "толчок" тут можно интерпретировать по разному.


    1. mobilz Автор
      28.01.2023 10:37
      +42

      "это будет толчок для русского ИТ" сказал владимир, не уточнив, уличный или в тёплом помещении. специально для россии23


      1. Sonichka
        29.01.2023 00:36
        +2

        Владимир - он же "лысый чёрт"


    1. KongEnGe
      28.01.2023 10:56

      А в слитых исходниках интерпретатора Толчка нет?


      1. Didimus
        28.01.2023 19:33

        Я. Толчка, тогда уж


    1. Cerberuser
      28.01.2023 11:20
      +35

      Особенно в сочетании со "сливом"?


      1. sergeaunt
        31.01.2023 02:53

        Отлично!

        "Слив засчитан": Яндекс признал утечку кода.


  1. dynamica
    28.01.2023 10:59
    +63

    Другие исходники никак не подписаны, что так же позволяет их копировать, использовать в коммерческих целях, видоизменять итп. 

    Это не так. Лицензии - разрешают что-либо. Отсутствие лицензий - это отсуствие каких-либо разрешений вообще. Если исходники не имеют никакой лицензии, это значит, что вы вообще не имеете право с ними что-либо делать.


    1. mobilz Автор
      28.01.2023 11:00
      -8

      вы юрист? если да, то у меня к вам пару вопросов ) и это не претензия, не сарказм, мне правда нужна справка по этому поводу


      1. bit314
        28.01.2023 12:59
        +8

        Ну ты можешь использовать, но если твой проект станет крупным и там найдут разработки Яндекса которые были украдены, то думаю тебя закроют. В тойже США куча судов по украденному коду идут. Особенно когда разработчики уходят в другую контору, а там потом в новой компании находят код предыдущих работодателей, украденный по факту


      1. Hait
        28.01.2023 13:12
        +10

        Эх, если бы это так работало, то из слива win xp можно было бы просто удалить лицензию, а не переписывать в reactos :)


        1. Areso
          28.01.2023 19:32
          +5

          Более того, мейнтерам даже запрещено туда подглядывать.


      1. Helltraitor
        29.01.2023 01:30
        +1

        Вся ваша личная переписка по такой логике - объект национального достояния. Не нужно быть семи пядей во лбу, чтобы понять это


      1. PuerteMuerte
        29.01.2023 02:08
        +9

        Смотрите, исходные тексты компьютерных программ — это объект авторского права. Авторское право возникает автоматически при создании какого-либо произведения, для этого не требуются никакие лицензии или что-либо ещё. По умолчанию программный код сразу после создания является проприетарной собственностью владельца исключительных прав на него, т.е. это может быть либо сам разработчик, либо его компания, если код является служебным произведением. И только если владелец исключительных прав явно решил изменить условия лицензирования этого кода, тогда может быть что-то другое.


    1. ifap
      28.01.2023 12:11
      +1

      Но как же общественный интерес, Ваша честь? Без шуток - здесь как раз тот случай, когда можно прикрыться общественным интересом.


      1. KongEnGe
        28.01.2023 12:18
        +8

        Знаем мы этот общественный интерес. Каждый раз, когда переворачивается грузовик с пивом на дороге, общество его не на шутку проявляет.


        1. ifap
          28.01.2023 13:17
          +25

          Неточная аналогия. Когда общественность набрасывается лакать разлитое пиво, это называется мародерством. А вот если в перевернувшемся грузовике обнаруживается документация на техпроцесс производства того же пива, в которой черным по белому написано: ссанина - 70%, крысиный яд - по вкусу, то публикация такой документации будет законной, даже несмотря на большую страшную надпись "копирайт пивоварня "Свинское" и "коммерческая тайна".


    1. olku
      28.01.2023 12:17
      +1

      Присоединяюсь к вопросу по соседству. Если лицензии нет никакой (встречал такие репозитории), каков допуск в англо-саксонском и романо-германском праве?


      1. alex_shpak
        28.01.2023 12:30
        +14

        я не адвокат, но гитхаб пишет:

        without a license, the default copyright laws apply, meaning that you
        retain all rights to your source code and no one may reproduce,
        distribute, or create derivative works from your work.

        гугло-перевод:

        без лицензии применяются законы об авторском праве по умолчанию, что означает, что вы сохраняете все права на свой исходный код, и никто не может воспроизводить, распространять или создавать производные работы на основе вашей работы.

        Но, конечно, "законы об авторском праве по умолчанию" в разных странах могут быть разными. На гитхабе, скорее всего, подразумевается законодательство США.


        1. olku
          28.01.2023 13:14
          -1

          Знаком с этим текстом, но вопрос не только про Гитхаб, он то как раз присваивает часть прав по-умолчанию себе - распространение на свое усмотрение и использование для создания продуктов вроде Copilot.
          В романо-германском праве программа защищается как текст, следовательно, на нее распространяются нормы цитирования и прочее. С англо-саксонским не знаком, в Штатах есть некое Fair use.


      1. dartraiden
        28.01.2023 14:52
        +9

        Если лицензия не указана, то можно только смотреть.

        Это так не работает, что «если лицензия не указана, то это общественное достояние».

        Достаточно провести аналогию с фотографией в интернете. Я выложил собственноручно сделанное фото зимнего леса в своём блоге, не указав лицензию. Вы можете взять моё фото и делать с ним всё, что пожелаете? Нет, вы обязаны сначала связаться с правообладателем (мною) и обговорить условия. Может, я разрешу использовать, с условием «оставьте ссылку на источник». А может и не разрешу. Или попрошу денег.


        1. Areso
          28.01.2023 21:13
          +4

          Да, кстати, в РФ это с некоторых пор стало популярной темой:

          1) фотограф делает хорошие фотки, и выкладывает их в хай резе, указывая авторство, но не лицензию

          2) сотрудник СМИ берёт красивую фоточку, статью пускают в тираж

          3) фотограф находит свою фотку и пишет претензию.

          ---

          Обычно цена такой выходки находится в районе 5 т.р.


          1. Yuribtr
            28.01.2023 21:38
            +2

            Такая тема очень популярна в Крыму. Есть один достаточно известный фотограф из Севастополя, ведет свой блог на разных платформах, выкладывает фото с красивыми видами. Нигде на его блогах нет условий лицензии (по состоянию на 2 года назад). На некоторых фото есть его копирайт, на некоторых нет. Эти фото индексируются и попадают в поисковики или какие нибудь сборники на пиратских сайтах. Вебмастеры делают сайты из за непрофессионализма используют фото этого фотографа без разрешения. Клиент, который заказал сайт, не интересуется происхождением фото, так как даже не знает про такую тему.

            Через некоторое время приходит претензия, а потом и судебный иск от этого фотографа - 30 тысяч р. за одно фото. Суды удовлетворяют. Так попало несколько туристических агентств на суммы ~ 100 - 800 тысяч р.

            Формально он прав, и вебмастер и клиент обязаны использовать лицензионные фото. Но по сути похоже на издевательство. За достаточно обычное фото брать 500 баксов, в то время как на стоках такие фото стоят до 10 баксов, это конечно наглость. Но у него хорошая команда юристов с материка, так что в судах все решается в его пользу, поскольку он как автор сам оценивает свое художественное произведение. Вот такая вот экономия на спичках вебмастерах выходит.


            1. dartraiden
              28.01.2023 23:40
              +1

              Возможно, тут есть нарушение ст. 10 ГК РФ, но я не юрист.
              То есть, закон, с одной стороны, должен защищать права фотографа, но, с другой стороны, фотограф тут внаглую эксплуатирует закон.

              Возможно, с хорошими юристами можно было бы снизить сумму компенсации, но, конечно, не избежать её полностью, т.к. брать чужое без разрешения нельзя.


              1. karabas_b
                29.01.2023 00:28
                +6

                Хорошие юристы обойдутся явно дороже 500 баксов, поэтому проще заплатить и забыть.

                Он скорее всего такую сумму и подобрал, чтобы было достаточно жирно как для фотки, но достаточно мало, чтобы обжалование претензий в суде имело экономический смысл.


              1. druidvav
                29.01.2023 05:21
                +12

                Никто не заставляет СМИ воровать фотографии. Нормальные СМИ берут фото либо со стоков-по-подписке, либо делают фотографии сами.


              1. PuerteMuerte
                29.01.2023 06:11
                +17

                То есть, закон, с одной стороны, должен защищать права фотографа, но, с другой стороны, фотограф тут внаглую эксплуатирует закон.

                Мы тоже все внаглую эксплуатируем законы — например, когда совершенно бессовестно идём по улицы с полным кошельком денег, и не даём нормальным честным гопникам его просто так взять и украсть.
                В действиях фотографа (по крайней мере, в описанных выше) нет вообще ничего незаконного, да и с моей точки зрения, даже ничего аморального. Если какая-то контора стянула чужое фото в своих бизнес-целях, не поинтересовавшись его принадлежностью и вообще возможностью использования, то вообще нет ничего плохого, что она заплатит за него несколько сотен тысяч рублей. Ведь в эту сумму, по сути, входит ещё и экспресс курс для бизнес-пользователей про авторские и смежные права, а также про деловой этикет.


                1. Yuribtr
                  29.01.2023 09:24

                  Абсолютно не защищая воровство контента, сам от этого страдал, но хочу заметить, что в данном случае сравнение с гопником неверно. Как минимум потому что "вымогательство/разбой" (открытое похищение имущества/+применение силы) квалифицируются по УК, а нарушение авторского права это ГК.

                  Можно отчасти сравнить с кражей (тайное похищение имущества), так как с определенного уровня ущерба (при плагиате с 250 тысяч р.) наступает уголовная ответственность. Но при ведении дела по УПК, понятие состава вины и умышленность действий будет иметь существенное значение при определении наказания. В данном случае корректно будет сравнение с человеком, который нашел на улице кошелек или банковскую карточку, но не пошел сдавать в полицию, а решил потратить на свои нужды. Да, нарушение закона (КоАП или УК в зависимости от суммы), и скорее всего по не знанию или по халатности. Но вот прямо злого умысла я тут не вижу, увы. Не думаю что кто то из причастных к созданию сайтов, зная что к ним может прилететь такой иск, осознанно решил использовать защищенные авторским правом фото - выбор в общем то есть. Да и на многих фото не было копирайтов вообще никаких. Есть кстати еще и ч. 1 ст. 1273 ГК РФ которая допускает использование без согласия автора или иного правообладателя и без выплаты вознаграждения воспроизведение гражданином при необходимости и исключительно в личных целях правомерно обнародованного произведения. Но в нашем случае эта статья не подходит, хотя фотки и были использованы как вторичный элемент оформления буквально нескольких страниц из сотен других, так как сайт создан с коммерческой целью и предназначен для привлечения клиентов.

                  А теперь вернемся к "нашим баранам" ))) Статья 1301 ГК РФ предусматривает, что в случаях нарушения исключительного права на произведение автор или иной правообладатель вправе требовать по своему выбору от нарушителя вместо возмещения убытков выплаты компенсации в размере от десяти тысяч рублей до пяти миллионов рублей, определяемом по усмотрению суда исходя из характера нарушения. То есть 30 тысяч это не на нижней границе, а немного выше, но как говорится и на том спасибо. А ведь мог бы и убить ©


                  1. PuerteMuerte
                    29.01.2023 19:04
                    +3

                    квалифицируются по УК, а нарушение авторского права это ГК.

                    Речь выше шла не про отождествление разных видов правонарушений, а про факт эксплуатации закона для защиты своих, кхм, законных прав, извините за тавтологию :)
                    Но вот прямо злого умысла я тут не вижу, увы.

                    Смотрите, туристические агентства — это по своей сути мелкий, реже средний бизнес. Это не крупные корпорации, в составе которых есть своя веб-студия. Поэтому в 90% случаев их сайты делаются профессиональными веб-студиями по заказу, и в 10% случаев кем-то вроде сына подруги замдиректора. И эти 90% случаев подразумевают, что там в процессе участвуют люди, которые в курсе про авторские права на контент. Поэтому кейс «да просто качай фотки из интернета, я ни за что платить не хочу, кто там будет смотреть и их сравнивать?» там присутствует в полной мере, и это самый что ни на есть «злой умысел» применительно к нарушению исключительных прав. Да, это мелочи… но ведь и наказание за него тоже несущественное.


                    1. Yuribtr
                      29.01.2023 19:21

                      Это не крупные корпорации, в составе которых есть своя веб-студия. Поэтому в 90% случаев их сайты делаются профессиональными веб-студиями по заказу, и в 10% случаев кем-то вроде сына подруги замдиректора.

                      Увы, опыт показывает, что на профессиональные студии у мелкого бизнеса как раз и нет денег. По крайней мере с теми, кто попал в эту проблему сайты делались фрилансерами.

                      Речь выше шла не про отождествление разных видов правонарушений

                      Извините если не так понял, но я хотел показать что с точки зрения использования закона фотограф тоже поступает не совсем добросовестно. Подобные фото на сложившемся рынке в интернете не стоят 30 тысяч рублей, это очевидно. Даже на shutterstock от 2.90 Евро и ниже за фото, плюс куча бесплатных лицензионных стоков типа pixabay. Однако этот фотограф в суд предоставляет договор с некой компанией которая якобы купила у него когда то фотки по 30 тысяч р. за штуку. И вот от этой цены он и отталкивается. Я вижу здесь злоупотребление правом, но доказать его в наших реалиях невозможно. По большей части судам не интересно разбираться в таких мелочах.


                      1. PuerteMuerte
                        29.01.2023 21:43

                        Увы, опыт показывает, что на профессиональные студии у мелкого бизнеса как раз и нет денег.

                        Профессиональные студии — это не те, где Лебедев в собственниках, а которые занимаются разработкой сайтов как основным средством заработка денег. Вне зависимости от ценовой категории. И в принципе почти все они в курсе про возможные последствия утаскивания чужих фото из интернетов, даже если какой-то веб-мастер сам себе студия. Хотя обычно не сам, т.к. рисовать и программировать уже давно плохо сочетается в одном человеке.
                        Однако этот фотограф в суд предоставляет договор с некой компанией которая якобы купила у него когда то фотки по 30 тысяч р. за штуку.

                        Я не слишком верю в хитрый план «давайте нарисуем липовый договор, а потом будем забрасывать удочку и ловить неудачников». Скорее всего, какой-то такой договор действительно имел место быть в прошлом, 30 тыс.р. за фото, это чересчур, но грубо говоря, договор на 300 тыс. р. за создание с нуля профессиональной фотоколлекции, в которой будет десяток фото, это вполне себе имеет место быть. В такой договор фотограф всунет и все расходы на поездки себя и своего ассистента, и обработку/монтаж, и еще N тысяч рублей, которые его директор компании-клиента попросил обналичить и вернуть налом. Ну т.е. с точки зрения права придраться в общем-то не к чему. С точки зрения морали… ну не знаю, это в общем-то субъективно. Я не могу сказать, что мне в этой ситуации как-то жалко турагенства. Они от этих штрафов сильно не пострадали, зато культура пользования чужими произведениями несколько повысилась.


                      1. Yuribtr
                        29.01.2023 22:14

                        Вне зависимости от ценовой категории. И в принципе почти все они в курсе про возможные последствия утаскивания чужих фото из интернетов, даже если какой-то веб-мастер сам себе студия

                        Из тех случаев что я нарыл по данному делу, сайты делались достаточно давно (еще на момент иска в 2019 г. им было по 3-5 лет). Делали их разные одиночки, а ни какие ни студии, видимо тогда никто не задумывался о таких проблемах. Почти все фото были взяты у фотографа из ЖЖ, много из них без копирайтов изначально, а те которые есть так и остались с копирайтами - их не обрезали. Вот такая вот реальность.

                        Скорее всего, какой-то такой договор действительно имел место быть в прошлом, 30 тыс.р. за фото, это чересчур, но грубо говоря, договор на 300 тыс. р. за создание с нуля профессиональной фотоколлекции, в которой будет десяток фото, это вполне себе имеет место быть

                        В договоре насколько я помню была указана чистая цена за фото, без накладных расходов.


                      1. PuerteMuerte
                        29.01.2023 23:33

                        Я тут с вами даже пытаться спорить не буду, потому что для каких-то аргументов лучше, чем особо ничего не значащие «мне кажется» и «из моего опыта», надо материалы иска видеть, чего я сделать не могу.


                      1. LinearLeopard
                        29.01.2023 21:46
                        +4

                        Подобные фото на сложившемся рынке в интернете не стоят 30 тысяч рублей,
                        это очевидно. Даже на shutterstock от 2.90 Евро и ниже за фото, плюс
                        куча бесплатных лицензионных стоков типа pixabay.

                        За достаточно обычное фото брать 500 баксов, в то время как на стоках такие фото стоят до 10 баксов, это конечно наглость.

                        Автор произведения может назначить какую угодно сумму за своё произведение, хоть сто тыщ мильён миллиардов. То, что создатели сайтов решили взять чужие фото, не поинтересовавшись лицензией и согласием автора - это проблемы создетелей сайта, человек в своём праве.

                        Аргумент "да на стоке такие фотки за доллар штука лежат" может лишь влиять на стоимость компенсации в суде или как предмет переговоров при легальной покупке, но за своё произведение и в иске за нарушение своих прав написать можно любую сумму.


                      1. Yuribtr
                        29.01.2023 22:24

                        Автор произведения может назначить какую угодно сумму за своё произведение, хоть сто тыщ мильён миллиардов. То, что создатели сайтов решили взять чужие фото, не поинтересовавшись лицензией и согласием автора - это проблемы создетелей сайта, человек в своём праве.

                        Не вопрос. Однако если бы все можно было бы уложить в строгие алгоритмы - суды были бы не нужны. Мысль в том, что возмещение вреда должно быть соразмерно причиненному вреду, для этого и нужен суд. Требовать то можно, но размер должен определяться судом на основании сложившихся обстоятельств.
                        Вот пример - пешеход погиб от наезда пьяного водителя, прошел суд, родственникам пешехода постановили выплатить миллион рублей морального вреда, хотя они требовали 10 миллионов. Суд решил, что и этого хватит, потому как такая сложившаяся практика. Но требовать родственники могли хоть 100 миллионов, кто же им запретит.


                      1. Wesha
                        29.01.2023 22:47

                        требовать родственники могли хоть 100 миллионов

                        "Хотеть не вредно. Вредно не хотеть!" (c)


                      1. Wesha
                        29.01.2023 22:10

                        Подобные фото на сложившемся рынке в интернете не стоят 30 тысяч рублей, это

                        ...до санкций ;)


                  1. bormant
                    29.01.2023 19:36
                    -1

                    нарушение авторского права это ГК

                    Это не совсем, так, точнее, совсем не так:

                    КоАП РФ, ст.7.12. Нарушение авторских и смежных прав, изобретательских и патентных прав:
                    1. Ввоз, продажа, сдача в прокат или иное незаконное использование экземпляров произведений или фонограмм в целях извлечения дохода в случаях, если экземпляры произведений или фонограмм являются контрафактными в соответствии с законодательством Российской Федерации об авторском праве и смежных правах либо на экземплярах произведений или фонограмм указана ложная информация об их изготовителях, о местах их производства, а также об обладателях авторских и смежных прав, а равно иное нарушение авторских и смежных прав в целях извлечения дохода, за исключением случаев, предусмотренных частью 2 статьи 14.33 настоящего Кодекса, -

                    УК РФ, ст.146. Нарушение авторских и смежных прав
                    1. Присвоение авторства (плагиат), если это деяние причинило крупный ущерб автору или иному правообладателю, -
                    2. Незаконное использование объектов авторского права или смежных прав, а равно приобретение, хранение, перевозка контрафактных экземпляров произведений или фонограмм в целях сбыта, совершенные в крупном размере, -


                    1. Yuribtr
                      29.01.2023 19:45

                      Ну я же так и написал в своем комментарии:

                      Можно отчасти сравнить с кражей (тайное похищение имущества), так как с определенного уровня ущерба (при плагиате с 250 тысяч р.) наступает уголовная ответственность. Но при ведении дела по УПК, понятие состава вины и умышленность действий будет иметь существенное значение при определении наказания.

                      А КоАП не применялся, поскольку иск - гражданский, здесь работает статья 1301 ГК РФ.


            1. WraithOW
              30.01.2023 14:30
              +4

              За достаточно обычное фото брать 500 баксов, в то время как на стоках такие фото стоят до 10 баксов, это конечно наглость.

              Ну так и купи фотку за 10 баксов. В этом как бы и суть штрафа - дать смачно по жопе, чтобы повторять неповадно было. Билет на автобус - 50 рублей, штраф - 1000.


              1. Yuribtr
                30.01.2023 18:24

                В ст. 1301 ГК РФ нет понятия штрафа - либо возмещение убытков либо выплаты компенсации (описанный выше случай). Это не то же самое что штраф. Для выплаты компенсации необходимо подтвердить стоимость произведения. На основании приведенных доказательств, а также учитывая сумму исковых требований, суд может назначить от 10 тысяч до 5 миллионов рублей. То есть предполагается что истец будет доказывать убытки, а суд будет назначать сумму.
                Вы можете думать о компенсации как о штрафе, но это другое. Компенсация должна быть обоснована, и именно с этим и возникает проблема.
                Но такие юридические ньюансы большинству здесь вряд ли интересны. Я привел пример выше в качестве поучительной истории, что надо внимательно относиться к авторскому праву.


        1. 13werwolf13
          28.01.2023 23:10
          +2

          Достаточно провести аналогию с фотографией в интернете.

          не лучшая аналогия. всё зависит от площадки где размещено фото. некоторые площадки для фотографов в соглашении указывают что всё размещённое там независимо от автора после размещения принадлежит площадке что бы там автор не указывал.
          а вообще для фотографов (да и не только для них) давно придумали creative commons. жаль что многие не вкурсе..


  1. web3_Venture
    28.01.2023 11:18
    +23

    "Расчетный слив" - врятли, методики ранжирования и шлюзы оплат опасно.

    "Будут равняться" - нет, супер легаси из 2001 года , ужасные подходы, ужасные структуры.

    "получит ценные кадры" - не знаю друг из какого ты года, но большинство топ менеджеров , линейных менеджеров толпами валили еще в 2022, отделы рассыпаются. А когда вместо оставшихся ЕДИНИЦ настоящих профессионалов которые долгие года работали бок о бок и предпредыдущим и предыдущим СЕО, поставили кудрина - абсолютно все поникли, приуныли и всем всё стало понятно. В 2023 работать там - зашквар, и в мире ты становишься нерукопожатным.

    ps Мне не хватило сервиса ЯндексМузыки ) отличный бы форк был с + p2p torrent or wb3


    1. mobilz Автор
      28.01.2023 12:39
      +1

      повторю, пост помечен как "мнение". я на собственном опыте знаю, что многие остались тут, по разным причинам


    1. vvzvlad
      28.01.2023 23:16
      +1

      «Будут равняться» — нет, супер легаси из 2001 года, ужасные подходы, ужасные структуры.

      У супер-легаси из 2001 года есть один большой плюс — это проверенная архитектура, которая довольно хорошо работает и не падает на куче пользователей


      1. LinearLeopard
        29.01.2023 21:50
        +3

        У супер-легаси из 2001 года есть один большой плюс — это проверенная
        архитектура, которая довольно хорошо работает и не падает на куче
        пользователей

        Ну или нет, потому что в 2001 было на порядок-другой меньше интернет пользователей, устройства и ПО на них у пользователей, провайдеров и авторов сервиса было совсем другое, а так же архитектура 2001 не подразумевала поддержку метрик, трейсов, A/B тестирования, релизов несколько сот раз в день и GDPR, при добавлении которых она начинает плохо работать и падать на куче пользователей.


        1. vvzvlad
          29.01.2023 21:52

          Она сейчас работает, и с ней все ок.


    1. web3_Venture
      29.01.2023 14:18
      -2

      ребят кто налайкал плиз поднимите карму, то на меня яндексофилы напали , душат


  1. Finesse
    28.01.2023 11:41
    +20

    26 января, 11 месяцев спустя? А почему не сразу? А почему не после Бучи? А почему не после 21 или 30 сентября? Где вы были 8 лет?

    После этого не читал, извините. Вы действительно верите, что одинаковая дата во всех файлах это не результат манипуляции с метаданными файлов?


    1. mobilz Автор
      28.01.2023 12:38
      +11

      я разве не на это и намекал?


      1. Finesse
        28.01.2023 12:58
        +5

        Это был аргумент против «крысы». Ничего не мешает «крысе» поставить любую дату файлам и выложить файлы много позже даты слива, чтобы замести следы.


        1. pae174
          28.01.2023 13:47
          +6

          Такое заметание следов бесполезно т.к. Яндекс там у себя может сравнить слитые файлы со своим репозиторием и определить, какая конкретно версия была слита и на какую дату она была актуальна.


          1. ReadOnlySadUser
            28.01.2023 13:56
            +3

            Если сливать файлы частями, то процесс определения дат будет довольно затруднителен.


  1. nronnie
    28.01.2023 12:34
    +13

    Монорепозитории, это очень удобно.

    Что удобного-то?

    Последние лет 5 мы активно видим, что многие переходят на монорепы

    Везде где видел монорепу было ровно наоборот - все только и мечтали о том как бы с неё уйти.


    1. ReadOnlySadUser
      28.01.2023 14:00
      +7

      Что удобного-то?

      Удобно управлять внутренними и не только зависимостями. Особенно в С++ проектах. Удобно унифицироватб сборочный процесс.

      Возникают сложности при обновлении версий библиотеки, но при наличии отдельной команды для этого дела - это не проблема.

      Везде где видел монорепу было ровно наоборот - все только и мечтали о том как бы с неё уйти.

      Это нормальная реакция на монорепу, но потом ты поживешь в другом мире и каждый раз когда нужно сделать релиз, хочется вернуться)


      1. nin-jin
        28.01.2023 14:05
        -2

        Я всё жду, когда же индустрия откроет для себя наконец моно-поли-репозтории.


      1. nronnie
        28.01.2023 15:30
        +9

        Удобно управлять внутренними и не только зависимостями.

        Если от проекта зависит два или более других проекта, то единственный способ этим нормально управлять это собирать и деплоить его отдельно как пакет с аккуратным версионированием по semver. Иначе это дорога в ад в котором никогда не знаешь что и где тебе какое-либо изменение может сломать.

        Удобно унифицировать сборочный процесс.

        Да, особенно удобно это для CI, которому каждый раз надо либо пересобирать и тестировать всю огромную монорепу, либо как-то выяснять что именно было изменено (это, как правило, возможно, но морока еще та).

        Для монолита монорепа еще более-менее приемлима, но для микросервисной архитектуры, по личному опыту, это боль.


        1. ReadOnlySadUser
          29.01.2023 00:23
          +9

          как пакет с аккуратным версионированием по semver.

          1. Если честно, я за всю карьеру не встречал ни одной библиотеки, в которой бы "аккуратно соблюдался semver" на сколько-нибудь долгом промежутке времени. Вот вообще ни одной. Я понимаю, что я один, а библиотек очень много, так что 100% такие существуют, но на деле - всем ваще пофиг.

          2. Что будем делать, когда проекты, от которых мы зависим внезапно начинают использовать две разных схемы версионирования. Вот тут и начинается веселье.

          Иначе это дорога в ад

          Фраза "Dependency hell" существует не просто так. Разбитие кода на независимые репозитории - это тоже дорога в ад :)

          в котором никогда не знаешь что и где тебе какое-либо изменение может сломать.

          В том и прикол монорепы. Любое ломающее изменение - сломает тебе весь репозиторий. И ты это заметишь сразу. Из плюсов - ты можешь исправить проблему сразу везде, пускай это и потребует ресурсов. Но точно меньших, чем решать эту проблему силами разных команд 10 раз подряд, да еще и в разные временные интервалы.

          Да, особенно удобно это для CI, которому каждый раз надо либо пересобирать и тестировать всю огромную монорепу

          Эта проблема решается более продвинутой настройкой CI с анализом списка измененных файлов в коммите, не более. Как я и сказал - для поддержки монорепы в работоспособном состоянии - нужна отдельная команда. Не "группка человек из разных команд", а реально отдельная команда билд-инженеров.

          для микросервисной архитектуры, по личному опыту, это боль.

          Монорепа/"многорепа" и монолит/микросервис - это проблемы из разных миров, которые между собой мало пересекаются.

          - Монорепа/"многорепа" - это способы решения проблемы шаринга кодовой базы между разными продуктами/сервисами

          - Монолит/микросервис - это способы решения проблемы взаимодействия разных частей системы между собой.

          Я слабо представляю как эти проблемы связаны между собой. Они параллеьны друг другу.

          Опять же, надо помнить, что говоря о монорепе положительно, я обычно говорю только в ключе С++ разработки. Потому что в С++ до недавнего времени не было модулей вообще, а нормальных - нет и сегодня, на мой взгляд. И монорепа для С++ решает множество проблем.

          Для языков с нормальными модулями и пакетными менеджерами, вероятно, монорепа и правда монструозная ненужная конструкция.


          1. nin-jin
            29.01.2023 03:20
            -4

            Тем временем я пишу на GLSL в нескольких репах, где не то что модулей нормальных, а даже инклудов нет. И как-то справляюсь без отдельной команды билд-инженеров.


            1. ReadOnlySadUser
              29.01.2023 09:19
              +3

              Я не знаю ни что такое GLSL, ни над чем вы работаете. Могу сказать, что если вы работаете над чем-то один или маленькой командой - вам точно не нужна монорепа. Вы не получите никакой выгоды от неё.

              Речь ведётся о кодовой базе над которой работают ежедневно 100+ человек минимум.


              1. nin-jin
                29.01.2023 11:41
                -3

                Если я работаю один или маленькой командой мне и полирепа ни к чему. А я работаю над экосистемой проектов, над которой одинаково эффективно сможет работать хоть 10-, хоть 1000+ человек, без необходимости менять сани по мере роста.

                Ну а glsl - это такой си-подобный язык для написания шейдеров.


          1. nronnie
            29.01.2023 16:49
            +3

            Монолит/микросервис - это способы решения проблемы взаимодействия разных частей системы между собой.

            Вообще-то нет, потому что монолит тоже очень даже может состоять из множества отдельных сервисов. Микросервисы это решение проблем разработки, развертывания, масштабирования, и надежности в случае сложных приложений, а особенности взаимодействие микросервисов между собой (четко определенные контракты, изоляция БД различных микросервисов, и т.п.) это уже просто следствие этого.


            1. PrinceKorwin
              30.01.2023 13:51

              Подтверждаю. Много раз приходилось сталкиваться с монолитами на микросервисах.

              Когда обновление одного заставляет перезагружать все.


    1. Doman
      28.01.2023 14:16
      +6

      Монорепы удобны в том числе для интеграционного и е2е тестирования. В мультирепе фича размазана по 10 репкам - ходи, собирай, надеясь, что название ветки везде одинаковое. Если же закралось различие, то получаешь увлекательную инвестигацию.

      Да и определить какие сервисы были затронуты фичей тоже намного проще, когда у тебя один Merge Request. Когда их 10 - опять надо сопоставлять, и надеяться, что разработчик не забыл поднять 11й.

      Можно всякие костыли приделывать сбоку, чтобы заработало, но с монорепой в разы удобнее.


      1. splix
        28.01.2023 19:00
        +10

        Если у вас фича размазана по 10 сервисам то наверное это значит что с архитектурой что-то не то? и забинтовано монорепой что-бы выглядело что так и надо


        1. ShashkovS
          28.01.2023 22:34
          +8

          Не могу в полной мере согласиться с «с архитектурой что-то не то».

          Давайте пример. Вот есть, скажем, карты. Давайте не будем резать, путь будет первый сервис.
          А есть такси — второй.

          И теперь мы придумали супер-фичу для такси, которая требует доработок в картах (очевидно для такси нужны карты). Конечно же мы можем написать код так, чтобы это были фича-в-картах и фича-в-такси, которые можно катить вообще независимо друг от друга (и так и нужно делать с точки зрения кода).
          Но концептуально-то фича затрагивает два сервиса, а наше принудительное разрезание приводит к тому, что мы эту связь теряем.

          Подозреваю, что тонкость в числе 10. Давайте поглядывая на слитый архив попробуем придумать фичу на 10 сервисов.

          • аналитика — новая фича легко может требовать новой аналитики

          • балансер — новая фича может добавлять хитрой асимметричной нагрузки

          • биллинг — хитрости с оплатой — легко

          • helpdesk — ну, хз. Фичи для поддержки где живут? Добавим пока сюда

          • карты — начинали с карт

          • мобилка — поменял карту — поменяй мобилку

          • такси — тоже с них начинали

          Ну, 10 не натянулось, но 7 можно придумать.

          По поему опыту работы в банке (в котором огромная куча изолированных систем) фича может легко затрагивать доработками 5-6 систем.


          1. splix
            28.01.2023 22:55
            +1

            Ну вот, вы же сами согласны что "так и нужно делать с точки зрения кода".

            У каждого сервиса обычно свой API для взаимодействия, мне даже непонятно как можно так сделать чтобы они были настолько неделимы. Быть зависимостью да (= требовать в проде "версию API не менее"), но иметь размазанную фичу это что-то странное имхо


            1. ReadOnlySadUser
              29.01.2023 00:47
              +6

              Проблемы начинаются не тогда, когда API расширяется.

              Проблемы всегда начинаются тогда, когда API ломается. Этот момент всегда максимально оттягивают, но это всё равно происходит. И вот тогда начинается веселье :)

              Проблемы продолжаются тогда, когда в API обнаруживается уязвимость. Монорепа позволяет раскатать гарантированно фикс безопасности по всей кодовой базе за один коммит.

              Хуже еще бывает, когда API ломается не по принципу поломки сигнатуры, а по изменению логики в передаваемой через API информации. Например, мы передавали некоторый документ в котором было полюшко quantity и оно означало количество денег в единицах валюты. А потом, по какой-то неведомой причине, quantity стало означать количество денег в тысячах единиц валюты. Например законодательство изменилось или там гиперинфляция случилась. Исправить такое в монорепе - куда проще. Хотя описаные события запускают такие волны говна, что так делают раз в тысячеление, но на масштабах жизни корпораций - это вполне себе возможный сценарий.

              P.S.

              Немножко проблем случается, когда реализация API под капотом меняется. Высокопроизводительный код (а у Яндекса он явно такой), иногда оч болезненно реагирует на внутренние изменения во внешне одинаковом API. Но это всегда уникальные случаи, тут моно/много-репность на ситуация никак не влияет.


              1. splix
                29.01.2023 08:08
                +2

                Все что вы описали это же и есть проблемы в архитектуре? Такого не должно быть в нормальном проекте. Я понимаю что в легаси проекте и кровавом интерпрайзе так иногда бывает и приходится с этим жить. Но тем не менее, монорепа это не не решение а заметание под диван.


                1. ReadOnlySadUser
                  29.01.2023 09:27
                  +6

                  1. Вы видели сколько-нибудь крупный проект у которого не было никаких проблем с архитектурой?

                  2. Вы видели хоть один проект, заточенный под реально высокую производительность, в котором вообще не используется грязные хаки?

                  3. Вы видели хоть раз кодовую базу для группы (от 5 штук) взаимоинтегрированных продуктов, в которой бы не возникало описываемых мною проблем?

                  Не, если видели такой и он был на С++ - скажите мне где, я пойду туда работать. На текущий момент я такого единорога не встречал.


                  1. splix
                    29.01.2023 20:09

                    Наверное я неправильно выразился. Я не имел ввиду что проекты не должны иметь проблем. Разве что в идеале, который не достижим.

                    Я про то что монорепа это костыль для проектов с проблемами в архитектуре. Наверное можно решать проблемы этим костылем, Яндекс же решает.

                    Я говорю что про то что не вижу причины осознанно полагаться на такой костыль. И считаю что лучше стремится к исправлению проблем, а не заметанию их под диван. Что, конечно же, не отметает тот факт что в легаси проектах проблемы все равно накопились.


        1. Doman
          30.01.2023 00:49
          +2

          10 репок - не обязательно 10 сервисов. Пример:

          • фронтенд репа

          • библиотека React компонентов репа

          • бэкенд репа

          • лямбда в AWS (репа с terraform)

          • плагин-конвертер для работы с внешним сервисом репа

          • репа с е2е тестами, тест данными

          • репа с CI пайплайн конфигом (например, энв переменная новая добавилась)

          Получилось 7, но тоже прилично. Фичи, которые все 7 реп затрагивают - действительно редко встречаются, а вот 1-3 - вполне часто. И по обозначенным выше причинам, иметь весь код в рамках одного MR-а - намного удобнее.


    1. druidvav
      29.01.2023 05:22

      с разработчиками всегда так. always on the wrong side of the door.


  1. MAXHO_MACTEP
    28.01.2023 12:36
    -15

    >Во-вторых, это лучшее, что произойдёт с русским ИТ в этом году.

    оно давно уже нерусское


    1. mobilz Автор
      28.01.2023 12:37
      +3

      пачиму?


  1. nin-jin
    28.01.2023 12:51
    +69

    Программировать надо так, чтобы не было стыдно, когда твои исходники сольют.


    1. JekaMas
      28.01.2023 13:14
      +6

      Чтобы предложения по работе и заказы кратно росли после слива.


    1. Boggard
      28.01.2023 13:41
      +11

      вспоминая классику: "Пишите код так, как будто сопровождать его будет склонный к насилию психопат, который знает, где вы живете.."


    1. venanen
      28.01.2023 19:29
      -5

      Не, программировать надо так, чтобы когда сольют твои исходники никто ничего не понял. Желательно сразу на обфусцированном ассемблере. А еще лучше в репозитории сразу держать бинарники, и вместо обычного пула декомпилировать их. Хотя не, самый безопасный вариант - это печатать код на листах а4, передавать коллегам, они его перепечатывают, изменяют, печатают, приносят обратно (разумеется на обфусцированном ассемблере).


    1. Didimus
      28.01.2023 19:36
      +18

      На собеседовании: в каком сливе смотреть пример вашей работы?


      1. sergeaunt
        31.01.2023 03:07

        Класс, теперь не будет отмазки "я не могу показать свой код, он весь в приватных репах".


  1. codecity
    28.01.2023 14:00

    Интересно, на что это повлияет? Помню что в свое время Касперский подобным образом слился. И что, привело ли это к усилению конкурентов?


    1. mobilz Автор
      28.01.2023 14:07

      напомните?


  1. sYsTem1337
    28.01.2023 14:08
    +4

    Под предлогом IT новости, автор пригласил на диван обсудить политику. Стыдно должно быть товарищ.


    1. mobilz Автор
      28.01.2023 14:08

      вы либо крестик снимите, либо трусики одевайте. увы, такое время.


      1. Maksim-Burtsev
        28.01.2023 18:34
        +33

        надевайте -_-


  1. Hlad
    28.01.2023 14:45
    +17

    Забавно, что автор считает, что если бы это был внутренний слив, то он обязательно был бы приурочен к какому-то политическому событию. Вариант "Яндекс уволил удалёнщика, тот в ответ слил исходники" не рассматривается в принципе?


    1. mobilz Автор
      28.01.2023 14:46
      -8

      нет, так как это легко отслеживается и наказывается по NDA


      1. Hlad
        28.01.2023 15:02
        +15

        То есть, вы свято верите в абсолютное отсутствие инфантильности среди разработчиков Яндекса? И в то, что NDA Яндекса испугает человека, который последние полгода живёт в условной Доминикане?


        1. Vilgelm
          29.01.2023 06:49

          Подозреваю, что из Доминиканы выдают, а слив исходников тянет на статью УК.


          1. Hlad
            29.01.2023 11:00

            Окей. Живёт в любой другой стране, не выдающей преступников в РФ. Та же Прибалтика


            1. LinearLeopard
              29.01.2023 21:58
              -1

              Думаете, если гражданин РФ совершит преступление, которое имеется в УК условной Латвии, то его не депортируют в РФ?


              1. ford153focus
                30.01.2023 06:39
                +4

                Чтобы установить личность преступника в Латвии нужно как-то взаимодействовать с латышскими конторами и латышской полицией, которой в 99% случаев глубоко плевать на реквесты мвд рф


              1. Xadok
                30.01.2023 15:57
                -1

                Нет, откажут. Уже из Испании выдачи нет.


                1. DMGarikk
                  30.01.2023 16:18
                  +1

                  Они перестали по линии интерпола с РФ сотрудничать?


                  1. Xadok
                    30.01.2023 16:25

                    Формально сотрудничают, но

                    https://www.svoboda.org/a/interpol-otkazal-rossii-v-ekstraditsii-nevzorova-i-soldatova/32162812.html

                    https://www.kommersant.ru/doc/4869883

                    Всё же совсем недавно выдали https://www.vedomosti.ru/society/news/2022/07/27/933304-ispaniya

                    То есть сотрудничают, но могут и не выдавать. И это Испания, с которой договориться еще сильно проще чем с Прибалтикой.


                    1. LinearLeopard
                      30.01.2023 18:36

                      https://www.svoboda.org/a/interpol-otkazal-rossii-v-ekstraditsii-nevzorova-i-soldatova/32162812.html

                      Я говорил про запрос на выдачу действительно преступника, которого таковым считает, например, интерпол. Вряд ли деяния людей в этой статье являются преступлением в Испании.

                      > https://www.kommersant.ru/doc/4869883

                      Здесь пример интересный, но судя по отказу в выдаче из других стран, доказательства там вилами по воде, но особо с ситуацией не знаком.

                      > https://www.vedomosti.ru/society/news/2022/07/27/933304-ispaniya

                      Вот собственно я про такие же примеры, если в УК страны есть соответствующая статья, а РФ соберёт достаточно доказательств вины, кажется, ничто не помешает выдать.

                      Но да, на запрос в выдаче по краже исходных кодов, вполне допускаю, что условные латыши просто отморозятся.


    1. xsevenbeta
      28.01.2023 18:41
      +6

      Я бы поставил на то, что это был кто-то очень давно работающий и сильно разочарованный тем, как пошли дела в компании. А вообще самое ближнее событие было запретом удалёнки и кто-то мог очень сильно расстроиться и разозлится. Да и развал команд, отъезд профессионалов и назначение Кудрина вряд ли кого-то воодушевил.


  1. PuerteMuerte
    28.01.2023 14:57
    +16

    Во-вторых, это лучшее, что произойдёт с русским ИТ в этом году. Такого роста, как в этом году, мы не увидим ещё долго.

    Я могу согласиться с вами, что если в плане «ничего хорошего с русским ИТ в этом году не произойдет», то это событие можно назвать лучшим. Но если в «абсолютном измерении», полагаю, я совсем ни на йоту не ошибусь, если скажут, что это событие вообще никак и ни на что не повлияет, кроме как на какие-то оплеухи кому-то внутри Яндекса, и все про него благополучно забудут уже очень скоро.


    1. mobilz Автор
      28.01.2023 15:00

      скачайте сурсы и почитайте код робота яндекса, который сканирует страницы ) обратите внимание, как он определяет или не определяет клоакинг. один из 1000 примерно, про таксистов и приоритет я уже писать в статье.


      1. i86com
        28.01.2023 22:44
        +7

        Это никаким образом не приведёт ни к какому «толчку» в IT, о котором написано в заголовке.

        Да, отдельные сайты и таксисты смогут какое-то время более точно обходить фильтры, зная алгоритмы и коэффициенты обнаружения (а поменять коэффициенты — минутное дело, да и, возможно, они уже все поменялись за это время). Может, даже пару программок на коленке напишут для этого. И всё. Ничего нового.

        Свой поиск и своё такси никто на этих сорцах не поднимет — тут даже алгоритмы, превосходящие Яндекс, не помогут, если нет многомиллиардных вложений.

        Текущие конкуренты сервисов Яндекса и без всяких исходников много лет наблюдают и видят, как там всё работает.

        То, что у них там утекли кодстайлы, документация и структура — в равной степени могут привести как к улучшению IT («О, вот тут хорошая идея нейминга параметров, тоже так будем у себя делать»), так и к его ухудшению (когда создаётся культ Карго и все паттерны Яндекса в приказном порядке копируются даже там, где им не место). Но и то и другое будет крайне редким явлением.


  1. Xambey97
    28.01.2023 15:23
    +20

    Учитывая, что Яндекс была и есть пока крупнейшей и самой качественной ИТ командой в стране — все, кто получили сурсы и будут равняться на них, скорее будут играть в плюс.


    Поржал. Да, там БЫЛИ хорошие ребята и еще кто-то без сомнения остался, но судя по тому что я слышал от знакомых, которые там работали в том числе много лет (и ваш покорный слуга туда однажды тоже за малым не попал — на буткемпе не понравился) и в прошлом году уволились, там было много крутых специалистов, большинство инженеров более чем достойно разбирались в математике, и наверняка это все еще так, но качество кода очень много где страдало из-за нехватки непосредственно программерского опыта, сейчас эта проблема еще сильнее разовьется (и не только в яндексе, это наблюдается много где, опять же судя по знакомым, утекающим толпами за границу) в виду массового отъезда наиболее квалифицированных кадров (особенно если учесть, что теперь помимо и так ЗП ниже рынка, чем Яндекс всегда 'славился', добавилась геополитика и Кудрин во главе). Еще к этому можно добавить хренову тучу проприетарных утилит без документации, от использования которых у многих болела башка (а теперь еще и спросить возможно будет неукого, кто их писал), что потребует дополнительных переделок и отрыва кадров от другой работы.

    Если посмотреть на то, что с собой забирает Волож, то это самые инновационные проекты за которые за рубежом готовы глотки перегрызть, а все «посредственное» (хотя и весьма хорошее по мировым меркам, но без мега фич) технологически остается в РФ под крылом товарища майора-Кудрина. Если еще к этому добавить полемики о том, что для хорошего профи очень часто работа в около-государственной конторе близко к зашквару, то отток еще и усилится уже по рынку внутри РФ и останется от Яндекса не только лишь все. По той же дороге идут некоторые крупные банки и ВК на мой субъективный взгляд. Лично у меня в компании среди сотрудников и топ. менеджмента желания работать с гос-вом ни у кого не возникает, ни за какие деньги, не только из-за бюрократии (с ужасом вспоминаю времена когда бисал бек под гос. заказы), но и последних событий в частности.

    На счет того, польза ли от этого миру ИТ РФ или вред, думаю скорее вред. Отток сотен лучших специалистов за рубеж не может не сказаться на отрасли в которой и так всю дорогу большой дефицит кадров. Едва ли из-за такого оттока магическим образом улучшится ИТ безопасность в компаниях, даже в таких крупных как Яндекс. Яндексу же явно придется сильно раскошелиться на рост ЗП, чтобы остановить отток тех кто остался и попытаться привлечь новые кадры с опусташаемого рынка. Думаю все больше людей будут постепенно уходить работать в черную на заграницу, чтобы не кормить такое прелестное гос-во налогами и теневой сектор воспрянет духом пуще прежнего. Я сам конечно никогда бы на такое не пошел, что уж говорить, спонсировать государя-императатора дело чести для любого патриота, кем мы все тут конечно являемся, а как же иначе? Да и ВЦИОМ не даст соврать, поддержка только растет! /S

    Все что выше приведено является исключительно субъективным мнением, так что не обессудьте. Всем мирного неба над головой и чтоб нам всем жить в скучные времена!


    1. BorisTheAnimal
      28.01.2023 20:34

      Думаю все больше людей будут постепенно уходить работать в черную на заграницу

      Это пока невозможно - финансовые потоки перекрыты. Деньги в РФ особо не переведешь. Открыть за границей - не у каждого есть возможность.


      1. Areso
        28.01.2023 21:51
        +4

        SWIFT еще пока ходит.

        А даже когда его отстрелят - останется крипта.


        1. PuerteMuerte
          29.01.2023 00:38
          +3

          А даже когда его отстрелят — останется крипта.

          Крипта улетит сразу же вслед за свифтом. Без свифта иметь крипту в РФ будет ровно то же самое, что иметь банковский счёт в европейском банке. Деньги-то туда поступать могут, но вы сможете на них только смотреть, и ещё платить по каким-то счетам за границей. Потому что если локальные криптообменники отрежут от международных переводов, они просто перестанут работать, и менять крипту на рубли, чтобы потом ей как-то пользоваться, вы уже не сможете.


          1. NNikolay
            29.01.2023 03:07
            -3

            Ну почему. Достаточно туристов, которые покупают крипту за рубли в РФ и снимают в фиат зарубежом.


            1. PuerteMuerte
              29.01.2023 03:18
              +2

              Да ну, полагаться на обмен денег, в котором присутствует чувак с чемоданом, который челночит между странами, это так себе финансовая стратегия.


              1. NNikolay
                29.01.2023 12:10
                +1

                Туристы ещё и сами ездят просто так. И без чемодана. И полагаться незачем. Вообще не понимаю как зачем я азы тут разжевываю.


                1. PuerteMuerte
                  29.01.2023 19:06
                  +2

                  Ну, ездят. И что? Несколько сотен путешествующих криптанов вам создадут достаточный и надёжный канал обмена крипты в масштабах страны, что ли? Особенно с учётом того, что в Европу сейчас особо не потуристишься, а в Китае наоборот, крипту не наменяешь.


                  1. dakuan
                    30.01.2023 17:15

                    Вполне. Почему же нет? У некоторых из "путешествующих криптанов" месячные обороты измеряются в миллионах $.


                  1. LinearLeopard
                    30.01.2023 18:41

                    Ну, ездят. И что? Несколько сотен путешествующих криптанов вам создадут
                    достаточный и надёжный канал обмена крипты в масштабах страны, что ли?

                    Ну будет курс не как в обменнике, а такой, который обеспечивает баланс. А не нравится - иди в свифт.


              1. WraithOW
                30.01.2023 14:43
                +2

                У вас уже есть чувак, называется блокчейн. Купил крипту в Европе за ойро, продал в РФ за рубли. В России крипта никуда не денется, дурь и дропов надо же за что-то покупать.

                Крипта мало отличается от хавалы, которая успешно существовала за столетия до этих ваших свифтов.


          1. LinearLeopard
            29.01.2023 22:05
            +2

            https://ru.wikipedia.org/wiki/Хавала

            Всё уже изобретено до нас, существуют переводы, которые вообще не подразумевает обязательное перемещение ценностей через границу, только информацию. Будут функционировать пока есть потоки денег в обе стороны.


          1. RedWolf
            29.01.2023 22:12
            +1

            В крипте нет международных переводов, вы что-то путаете.

            Если человек получает в крипте, то он может поменять ее на рубли в РФ или поменять на любую другую валюту в той стране, куда ему удастся из РФ выбраться.

            Возможно даже поменять на СКВ где-нибудь в Москве.


            1. PuerteMuerte
              30.01.2023 03:33
              -4

              В крипте нет международных переводов, вы что-то путаете.

              Ну как это нет? В самой крипте-то нет, а в обслуживающей её инфраструктуре, благодаря которой вы меняете крипту на фиат и обратно, очень даже есть.


              1. RedWolf
                30.01.2023 10:03
                +2

                Вы ерунду пишете.


    1. sergeaunt
      31.01.2023 03:20

      Думаю все больше людей будут постепенно уходить работать в черную на заграницу, чтобы не кормить такое прелестное гос-во налогами и теневой сектор воспрянет духом пуще прежнего.

      Где принципиальность - и где российские айтишники. Почитайте комменты ниже. Если законом установят обязанность раз в неделю приходить в мусарню на швабринг, они будут увлеченно обсуждать на Хабре, какую смазку лучше купить и как правильно раздвигать булки.


  1. t38c3j
    28.01.2023 16:27
    +4

    Поделитесь ссылками где делают ревью утекшего кода


    1. chernish2
      28.01.2023 17:38
      +1

      И ссылками на сам слив тоже пожалуйста


  1. Upsarin01
    28.01.2023 17:46
    -3

    Большая часть вложенных архивов битые (скорее всего специально испорчены).

    Из интересного, признаки для adblocker, и веса для приоритетных сайтов в выдаче ????????????


    1. t38c3j
      28.01.2023 17:47

      Напишите какие, проверю у себя, сам еще не все смотрел


    1. Alexsey
      28.01.2023 18:29
      +8

      Все архивы что я открывал - нормальные. Запускайте проверку целостности в торрент клиенте.


    1. SerafimArts
      28.01.2023 20:50
      +12

      Просто используйте 7-zip, а не winrar.


      1. Upsarin01
        30.01.2023 17:20

        Да Вы правы. Распаковываю 7-zip, потом нормально... Winrar - 6.2 не корректно обрабатывает архивы.


    1. vriska
      28.01.2023 22:04
      +1

      У меня такая же проблема с архивами была, половина не открывалась, половина частично. Архивы оказались в итоге нормальными, помогло использование утилиты tar вместо WinRar :)
      Думаю разные архиваторы по разному ведут себя с файлами которые во время открытия раздаются/скачиваются торрент-клиентом.


      1. aegoroff
        29.01.2023 23:22
        +1

        скорее всего, библиотека декомпрессии не умеет в мультистрим, а там такие архивы

        "To make a long story short, the bzip2 file is compressed using a multi-stream compression algorithm, which means that, in order to use parallel compression on the file stream, the single file is broken into pieces, each piece is compressed, and the overall file is reassembled from the pieces–with each piece basically being a complete BZip2 file."


    1. aegoroff
      29.01.2023 23:21
      +1

      Абсолютно нормальные архивы, только ваш инструмент который делает декомпрессию bzip2, должен уметь в bzip2 multistream (https://chaosinmotion.com/2011/07/29/and-another-curiosity-multi-stream-bzip2-files/), не мультистрим не будет работать, - действительно выдает ошибку. Например та же библиотека SharpZipLib этого не умеет делать https://github.com/icsharpcode/SharpZipLib/issues/162


  1. heejew
    28.01.2023 22:20
    +3

    "Крыса" внутри, которая имела доступ и просто слила

    Я как раз в этот вариант больше и верю, и он более объясним и правдоподобен.

    Думается, у "злобных хакеров" исходники давно уже могли быть, как и любые данные. Мы же видим только то, что слили в паблик. Взлом организовать сильно сложнее, чем занести пачку денег сотруднику или же хорошенько поканифолить ему мозги, чтобы это было ради идеи.

    Не обязательно даже, что крыса. Это вполне может быть обиженный на что-либо сотрудник, возможно, уже и бывший на момент слива. Обиженный на страну, государство, внутренние реорганизации в Я или что-то другое. Все же, при нынешнем уровне информационного шума человеку всякое в голову залететь может. И ты не можешь гарантировать стабильность психологического состояния у всех сотрудников, это просто невозможно отследить. И вот уехал он и уволился, стукнуло ему сделать пакость, вот и сделал.

    Вы думаете, законодательство останавливает людей? Как бы не так. У нас тут у опсосов люди готовы за копейки сливать персданные клиентов, находясь внутри страны, имея довольно огромные шансы спалиться ( потому что исполнители, обычно, являются одноклеточными ). А если это делать ради каких-то определенных идей и находясь за пределами страны, то тем более никакой УКРФ тут не остановит и о последствиях для своих хоть и бывших коллег думать вряд ли будут. Уж и nda тут никакой не имеет значения. Все же нельзя отрицать, что и хорошие специалисты в своей сфере могуть быть абсолютно инфантильными в своих действиях, тем более, на эмоциях и ради каких-либо идей.


  1. marimero
    28.01.2023 23:21
    -1

    Главный вопрос, так как я топлю за учебу и самообразование:

    С исходниками этой страны можно ознакомиться без настраивания deep???


  1. bungu
    28.01.2023 23:25
    +13

    Учитывая, что Яндекс была и есть пока крупнейшей и самой качественной ИТ командой в стране -- все, кто получили сурсы и будут равняться на них

    В Яндексе работают такие же разработчики как и везде и никаких уникальных паттернов или подходов на которые резко всем стоит начать равняться нет. А вот что есть, так это велосипеды о которых уже не раз писалось


    1. marimero
      29.01.2023 00:20
      -1

      Когда яндексом владели его основатели - это было прибежище лучших из лучших, чьи советы и решения простые смертные могли использовать годами, а то и десятилетиями


      1. bungu
        29.01.2023 08:52
        +14

        Ко мне в компанию приходили люди из Яндекса, и из компании уходили в Яндекс. Были хорошие разработчики, а были не очень. Никакого отрыва от остальных разработчиков в компании нет, а уж тем более «лучших из лучших». Это какие-то мифы


  1. IvanGanev
    29.01.2023 00:40
    +8

    Если хотите изучать чужой код - идите в опенсорс. Этот слив показал что в реальности ничего достойного для изучения там нет. Словить лулзов с кода и комментариев можно, но вот в практическом смысле пользы от изучения этого - ноль. Куда полезнее изучать опенсорс, в том числе и опенсорс самого яндекса.

    Софт в этом плане вообще забавная вещь - никто не скрывает как нужно что либо делать, хорошие и плохие практики известны. Проблемы узнать как делать правильно нет, проблема в том что бы Делать правильно.


  1. YuryB
    29.01.2023 02:52
    +3

    как-то автор расфантазировался. процентов 90 кода не получится запустить, если речь про тот, что не опенсорсили (вы же сами говорите, что даже спецы яндекса в Израиле это за месяцы не сделают), в таком случаи понимание работы будет примерное, от которого толка около нуля если говорить про конкретные коэффициенты в понимании работы. большинство людей пробежится по ним глазами и оставит солиться на диске, а самые интересные моменты и концепции наверняка давно рассказаны в статьях и выступлениях работников яндекса. такой вот пессимизм в ответ на ваш оптимизм.

    ПС: представля как на собесе спрашивают "ваш опыт работы с опенсорсом?" - "да, помогал кое-что править в пи-еных сорцах яндекса" - "спасибо, нам надо кое-куда позвонить, оставайтесь на месте...". А ведь Кудрин может и такое развернуть (у него кстати папа из конторы)


  1. gregorybednov
    29.01.2023 03:57

    Категорически не согласен с одной из главных мыслей автора - что данная утечка окажет положительный эффект, ведь там содержится "добротный код"

    Как написали в другой аналитической статье с мнениями, и тоже совсем недавней, и с которой лично мне проще согласиться, в Яндексе уже давно практикуется отчуждение труда от его производителя (что было там показано на примере Яндекс.Такси, где работал автор). Это означает, что кода много, он хорошо формализован (ещё бы, 80% его пишет кодогенератор!), но при этом этот код "мёртвый", в нём не должно быть задумки автора даже на оставшиеся 20%. Задумка автора - это то, что затрудняет увольнение автора, усложняет "ротацию кадров" (политкорректное название ) Лишь "осколки", несколько десятков микросервисов (которые кстати соединены между собой, судя по тому же рассказу, не бог весть как), могут работать как какая-то связная сущность.

    Этой информацией (о том, каковы на самом деле бизнес-процессы) располагает топ-менеджер, представитель капитала, но не располагает сам рядовой наёмный работник. Помимо банальной эксплуатации, это ещё и в том числе защита от копирования бизнеса: даже сейчас, имея на руках код, вряд ли кому-то удастся воспроизвести существенное количество функций, которые предоставляет Яндекс.

    Безусловно, код представляет интерес, в том числе в вопросах рекламы и персонализации, но не потому что там явлены шедевры программирования, неординарного подхода или потому что оттуда можно чему-то научиться, а по чисто общественным причинам: как ИТ-олигополия (Яндексу в Рунете по сервисам конкурент лишь Гугл, по такси почти монополия, по доставке товаров олигополия против ВБ и Озона, а местами - в универсальной доставке еды - Яндекс уже де-факто и есть монополия) стимулирует спрос нами своих услуг, как продаёт поток аудитории рекламодателям, и так далее.


    1. Myxach
      30.01.2023 13:36
      +1

      Какая к черту задумка автора в коде?

       Задумка автора - это то, что затрудняет увольнение автора, 

      То-есть костыли и не логично связанные части кода, которые ломаются от пчиха?


  1. Hivemaster
    29.01.2023 06:35
    +7

    Очевидно, что исходники "Яндекса" привлекают внимание. Их будут изучать. Учитывая, что Яндекс была и есть пока крупнейшей и самой качественной ИТ командой в стране -- все, кто получили сурсы и будут равняться на них, скорее будут играть в плюс.

    Уже изучают и пока реакции класса "Зачем заставлять на собесе красно-чёрное дерево балансировать, если потом такое писать?" и "Понабрали оленьпиадников!"


  1. XFed
    29.01.2023 08:44
    -1

    'опровержение' второго пункта ну такое себе натягивание совы на глобус. Там ещё с десяток возможных причин может быть. Например, что кому то не разрешили работать удалённо из-за бугра. А так то да, ты просто Шерлок


  1. DrVicZ
    29.01.2023 08:44
    -11

    Тот кто писал статью кто угодно, но не Инженер! Инженер до такого базарного уровня не должен опускаться и тем более лезть в политику! Человек который лезет в политику автоматически расписывается в свое низком уровне интеллекта и непрафессионализме ;)

    Дизлайк за эту писанину! Надеюсь когда-нибудь инет дорастет до того чтобы автоматически выпиливать такие статьи ниочем


    1. delicious
      30.01.2023 17:36

      ахаха, в настоящего инженера лезет политика, запомните, дети, не наоборот!


  1. middle
    29.01.2023 11:47
    +3

    Синодов - не Дудь. Синодов - болтун и фантазёр.


  1. shasoftX
    30.01.2023 15:03
    +1

    26 января, 11 месяцев спустя? А почему не сразу? 

    Потому что утащил просто для "интереса". А потом решил выложить в публичный доступ.


  1. falcon4fun
    31.01.2023 03:19

    "Толчок" - слишком сленговое слово. Правильно писать "туалет"

    З.ы. увидел в выдаче ленты гугла, долго думал, почему на Хабре яндекс ассоциируют, простите, с парашей :D