Примечание переводчика: оригинальная статья опубликована в серии твитов

Вероятно, вы уже читали кучу объяснений, почему обработка связных списков — плохой вопрос для собеседования. Я же в первую очередь хочу объяснить, откуда он вообще взялся. Всем пристегнуться, погружаемся в теорию игр ИСТОРИЮ!

Хотя индустрия программного обеспечения процветала в 80-е годы, но действительно взлетела в 90-е. В это десятилетие число работников отрасли в США утроилось и превысило миллион человек. Со взрывным ростом пришла необходимость нанимать массу сотрудников и оценивать их.

Что нужно оценить? Ну, в первую очередь, знание языков. Согласно TIOBE, в 1986?2006 годы самым популярным языком в мире был C, далее следовал C++. К 2006 году Java вышла на первое место, но C остался рядом.

C работал близко к железу без лишних абстракций. Пустой словарь Python расходует аж 288 байт, то есть 5% всего объёма памяти первого поколения Apple II. Абстракции слишком дороги, слишком много накладных расходов. Если вам нужна сложная структура данных, вы должны построить её самостоятельно с помощью массивов, структур и указателей.

(C++ оказался получше в этом отношении, поскольку там появилась стандартная библиотека шаблонов, но её официально приняли только в 1998 году, а повсеместно использовать начали гораздо позже. Помню, как читал аргументы о накладных расходах даже в 2005 году).

Связные списки — необходимая структура данных, которая позволяет производить динамическое выделение памяти с меньшими рисками переполнения буфера. И нужно было писать эти связные списки вручную. Это означает, что вы должны были вручную манипулировать указателями в связных списках.

Другими словами, в 90-е годы вопрос «Как развернуть связный список» — это не проверка алгоритмического мышления или знания структур данных, это вопрос «Вы программировали на C?». Если да, то для вас ответ тривиален. Если нет, ответить (в идеале) невозможно.

В настоящее время большинство из нас не программирует на C. Но устаревший вопрос не исчез, а модифицировался. Я подозреваю, причина в том, что огромное количество программистов продолжали задавать и задавать его, не понимая исторического контекста и причин, почему этот вопрос появился.

Вероятно, ситуацию помог зацементировать бестселлер «Взлом собеседования по программированию». Её автор Гейл Лакман Макдауэлл работала по специальности в 2000?2008 годы и, вероятно, написала книгу на основе собственного опыта. Книга стала настольным справочником компаний, которые проводят собеседования — и связные списки укрепились в списке стандартных вопросов.

Без исторического контекста связные списки стали преподносить как вопрос на «навыки решения проблем». Но это полностью противоречит изначальной цели: если вы проверяете знание языка, вы не хотите, чтобы на вопрос могли ответить (то есть «решить проблему») люди, не знакомые с этим языком.

Например, вопрос «Определите, есть ли в связном списке цикл». Предполагается, что кандидат должен придумать решение типа «черепаха и заяц», опубликованное в обильно цитируемой научной статье 1967 года. Вы просите кандидата повторить научное исследование за 30 минут!

Возможно, когда мы перешли к вопросам типа «решение проблем», то откалибровали сложность, взяв связные списки в качестве ориентира. Что совершенно искажает шкалу.

(Кстати: ещё один аргумент для связных списков — это «проверка фундаментальных знаний информатики». Ну если так, то почему у всех не спрашивают про детерминированные конечные автоматы? Теорему Райса? Как работает компилятор? Структуры данных — очень небольшая часть компьютерной науки и часто нерепрезентативная).

Подводя итог, вопрос о связном списке был хорошей проверкой умения писать на С, а теперь стал плохой проверкой «Умеете ли вы решать проблемы?»

Мораль: подумайте ещё раз о том, чтобы задавать вопросы по связным спискам в собеседовании.

Ещё одна мораль: из истории можно многому научиться.

(Третья мораль: если видите наполовину завершённую статью и думаете «Эх, легче запустить проект в серии твитов», это ловушка, не попадайтесь в неё)

Комментарии (348)


  1. staticmain
    06.06.2019 16:43
    +2

    Вероятно, вы уже читали кучу объяснений, почему обработка связных списков — плохой вопрос для собеседования.

    А что делать, если знание этих алгоритмов важно для нашей работы?
    Подводя итог, вопрос о связном списке был хорошей проверкой умения писать на С
    Почему *был*? Он и сейчас в этом плане неплох.
    Что нужно оценить? Ну, в первую очередь, знание языков. Согласно TIOBE, в 1986?2006 годы самым популярным языком в мире был C, далее следовал C++. К 2006 году Java вышла на первое место, но C остался рядом.

    С и сейчас не очень далеко. Правда это не останавливает людей писать статьи о том, что вопросы на знание алгоритмов и структур данных «устарели». Конечно, ведь сегодня, чтобы программировать не нужно знать алгоритмы и структуры данных. Ведь можно слабать на электроне очередной недо-мессенджер просто написав
    const { remote } = require('electron')
    remote.getCurrentWindow().loadURL('https://github.com')


    1. saboteur_kiev
      06.06.2019 17:58

      Ну если это важно, то спросите.
      Суть в том, что для большинства JS/DBA это не важно.


      1. khim
        07.06.2019 13:39

        Если большинству JS/DBA это не важно, то почему они лезут на вакансии, где это требуется?


        1. AllexIn
          07.06.2019 16:04
          +3

          Мне задачу которая решается зайцем и черепахой задавали при устройстве на работу которая была связана с версткой UI в игре.
          Это я не туда полез или все таки собеседующий идиот?


          1. khim
            07.06.2019 16:10

            Не знаю. Судя по тому, как работают многие популярные сайты (какой-нибудь) — скорее первое.


            1. AllexIn
              07.06.2019 16:19
              +2

              А при чем тут сайты?
              Ну и отдельный момент — как идя на собеседование на верстальщика UI я должен был догадаться, что от меня требуется алгоритмическая подготовка, чтобы «не лезть»?

              P.S. Отдельно замечу что с алгоритмической подготовкой у меня всё приемлемо. Но речь не об этом, а о самом неуместном вопросе на рассматриваемую должность.


              1. khim
                07.06.2019 16:41

                Притом что их тоже делают вот те самые JS/DBA, которым «нинужна» в алгоритмы.

                В результате там есть всё, что угодно, кроме одного: быстрой реакции на нажатия кнопок.

                В подавляющем большинстве случаев нажатие куда угодно заставляет усомниться в том, что у тебя в руках — устройство, способное выполнять миллиарды операций в секунду. Потому что они пары-тройки простых операций за секунду, зачастую, неспособно выполнить…


                1. AllexIn
                  07.06.2019 17:25

                  Это в какой игре у вас проблемы с UI?
                  Ну и отдельные момент — в современных движках UI верстается в редакторах, кода там нет от слова «вообще». Максимум есть обработчики нажатий кнопок, но они к верствке не относятся. Даже всякие анимации делаются в редакторах, с использованием минимума кода типа «запустить анимацию/остановить анимацию».


                  1. khim
                    07.06.2019 20:22
                    -2

                    Может быть авторы используют «несовременный движок UI»?

                    Так-то я про это знаю. И потому вообще не понимаю зачем нужен отдельный человек на подобную должность и какого масштаба должна быть игра, чтобы можно было выделить на это отдельную штатную единицу…


                    1. AllexIn
                      07.06.2019 20:26
                      +1

                      Может быть авторы используют «несовременный движок UI»?

                      UE4

                      зачем нужен отдельный человек

                      Инструментом тоже нужно уметь пользоваться. Просто рандомный человек такого наворотит…


                      1. khim
                        07.06.2019 21:01

                        Инструментом тоже нужно уметь пользоваться. Просто рандомный человек такого наворотит…
                        Это понятно. Но у меня нет уверенности в том, что от вас хотели только «UI в редакторах, кода там нет от слова «вообще»».

                        Скорее всего было понимаение, что какой-то процент времени (не знаю сколько: день в неделю или месяц… неважно) человек должен верстать пресловутый UI — а остальное время он будет кодить что-то другое.

                        А если вы можете решить только часть задачи — то логично же поискать кого-то, кто сможет решить её всю.


    1. flygrounder
      07.06.2019 12:03

      Этому алгоритму можно научиться за один вечер. В вашем случае, лучше тестировать умение и желание человека обучаться, а не знание какого-то алгоритма


      1. kalombo
        07.06.2019 14:39

        del


      1. saboteur_kiev
        07.06.2019 20:13

        Возможно, но придумать конкретный алгоритм за 10 минут на собеседовании — не всегда могут даже те, кто этими алгоритмами активно пользовался несколько лет назад.

        Если примерно помнишь — то нагуглить не проблема. Если догадываешься о существовании алгоритма — то нагуглить можно. Если вообще не догадываешься о существовании алгоритмов, то такого человека можно на собеседовании определить разными способами.


      1. Ctacfs
        08.06.2019 09:19
        +2

        За один вечер можно много чему обучиться. Например яблочный пирог готовить. Если я научусь яблочный пирог готовить, возьмете программистом? Мало того, что есть желание обучаться, так еще и широкие интересы. И даже огонь (от духовки) в глазах видно!


    1. rkuvaldin
      07.06.2019 19:03

      А что делать, если знание этих алгоритмов важно для нашей работы?

      Ну если реально важно — то конечно учить.
      Но в большинстве случаев выгоднее взять готовую библиотеку.


      1. staticmain
        07.06.2019 19:07
        +2

        Но в большинстве случаев выгоднее взять готовую библиотеку.

        А как эта «готовая библиотека» поймет, какой, например, вид списков или деревьев наиболее выгоден с точки зрения быстродействия или памяти для вашей конкретной ситуации? Или она просто возьмет то, что в нее накодил автор-программист (неизвестного качества)? А, ну тогда неудивительно, что некоторые программы выжирают всю ОЗУ и долбят процессор, например для того, чтобы отрисовать на экране таблицу из 100 строк…

        Попробуйте, например, сделать тестовый файл в 2-3 МБ с текстом, а потом попробуйте заменить в своем любимом редакторе буку о на заглавную. Почему большинство редакторов при этом намертво зависают, а оставшиеся 5% делают это 2-3 минуты?


        1. rkuvaldin
          08.06.2019 19:00

          Потому-что реально замена выполняется за доли секунды, а остальное время редактор пытается оценить, какие изменения попадают в окно пользователя, и перерендерить его содержимое? То есть вещам, которые надо выполнить чтобы пользователь увидел замену?


          1. staticmain
            08.06.2019 19:02

            Нет, потому что тот же самый рендер он делает несколько раз в секунду когда вы мотаете документ или открываете его впервые.


        1. khim
          08.06.2019 19:36

          Почему большинство редакторов при этом намертво зависают, а оставшиеся 5% делают это 2-3 минуты?
          О каких редакторах речь? Только что проверил — и vim и emacs укладываются в пару секунд. Примерно столько же, сколько открытие такого файла занимает: всякие подсветки и прочее нужно же пересчитать…


          1. staticmain
            08.06.2019 20:02

            Речь не про консольные редакторы. Gedit от такой операции просто умирает, mousepad пыхтит минуты три, виндовый блокнот вешается, notepad++ пыхтит минуты три. Kate умирает.


            1. khim
              08.06.2019 20:13

              Emacs вообще-то и не был никогда чисто консольным и GVim тоже отлично справляется. Как и Sublime. То, что Gedit написан через задний проход (как и многое другое в GNome) — увы, медицинский факт.

              P.S. Тут правда сказывается моё нежелание в принципе работать с редакторами, которые тормозят. Но я знаю, что я почти уникален, да: когда я как-то кинул в репу автосгенерённый файл на 5 мег — вой был слышен чуть не на луне, когда народ стал на меня баллоны катить, за то, что я им всё сломал.


              1. samhuawey
                10.06.2019 10:51

                Потому что надо было не в репу, а в артефактори. Смысл в репу если он всё равно автосгенерённый и сравнивать с предыдущей версией никто никогда не будет.


  1. devpony
    06.06.2019 16:49
    +3

    Если кандидат не разбирается в односвязных списках, то он, как правило, не разбирается в структурах данных вообще.


    Если кандидат не разбирается в структурах данных, то он, как правило, не умеет писать эффективные реализации алгоритмов на высокоуровневых языках программирования, где эти структуры данных уже реализованы.


    И пишет потом в прод:


    xs = list(...)
    ys = list(...)
    
    for y in ys:
        if x in xs:
            ...

    и тому подобное.


    Односвязные списки – отличный фильтр, с которого можно начать блок вопросов про структуры данных.


    1. wormball
      06.06.2019 17:13
      +3

      > И пишет потом в прод:

      А что не так?


      1. Graphite
        06.06.2019 17:40

        Осмелюсь предположить, что во-первых x не определен, a во-вторых x in list имеет линейную сложность и лучше использовать set.


        1. Andrey_Dolg
          06.06.2019 18:04

          Ну set допустим только для xs насколько я понимаю. Или имелось ввиду что-то иное?


      1. devpony
        06.06.2019 18:40

        Поиск в списке – O(n). Для проверки принадлежности нужно использовать множество, дающее амортизированную O(1).


        1. wormball
          06.06.2019 19:08
          +2

          А, всё, понял, там if в последней строчке. Ну это уже зависит от размеров xs и ys и частоты вызова оного кода. Может так статься, что там вообще придётся выкинуть питон и переписать на С, сразу производительность вырастет в 50 раз.


          1. 0xd34df00d
            06.06.2019 19:36
            +7

            Лол, я тоже там вместо if прочитал for.


            Но вообще да, зависит. Если в xs, например, инты, и их немного (с десяток), то может оказаться быстрее пробежаться по списку (особенно если он будет реализован в памяти как непрерывный массив, кто там этот питон знает), чем играться с хешмапами.


            1. JekaMas
              06.06.2019 21:45

              Да и да! Однажды убил полчаса на собеседовании на дискуссию, что для решения задачи необходим контекст. И если она формулируется как "написать оптимальное решение", то контекст просто необходим и без него нельзя говорить, что то же решение со списком не оптимально.


              1. wellusion
                07.06.2019 12:22

                А потом ещё окажется, что для удовлетворительного решения данный проблемы вообще не важны эти 2.5 наносекунды. Где-то там же идёт вызов веб-сервиса и потери в первом случае нивелируются.
                Потому что «Преждевременная оптимизация — корень всех зол» (с)


                1. marsermd
                  07.06.2019 12:30
                  +1

                  На самом деле, полная цитата звучит иначе


                  We should forget about small efficiencies, say about 97% of the time: premature optimization is the root of all evil…
                  Yet we should not pass up our opportunities in that critical 3%…
                  A 12% improvement, easily obtained, is never considered marginal

                  Получается совсем другой смысл, не так ли?
                  Эта вырваная из контекста фраза часто используется как оправдание для того чтобы пропустить этап обдумывания, и зафигачить линейный поиск по большому списку там, где можно было бы спокойно использовать HashMap.


                  1. retran
                    07.06.2019 12:36
                    +1

                    А здесь я вас поддержу. Выбор и проектирование правильных алгоритмов и структур — это фактически архитектурный вопрос, а не предварительная оптимизация.


                  1. wellusion
                    07.06.2019 13:09

                    Да, смысл меняется. Если точно знаешь, данный вариант лучше и не отнимет времени — нет смысла не сделать.
                    По конкретному случаю: Ну вот использовал здесь один разраб hashMap. Времени лишнего не потратил, но и на конечный результат не повлиял. Другой не задумался на решением или не знал другого варианта и использовал List. Результат — тот же. Но ведь время более квалифицированного разраба дороже?
                    И другое дело, если список _действительно_ большой и результат имеет значение.


                    1. retran
                      07.06.2019 13:14
                      +2

                      Другой не задумался на решением или не знал другого варианта и использовал List.


                      … и через несколько лет, когда при масштабировании этот код внезапно отожрал всю память или начал тормозить на казалось бы обычных операциях, придется потратить еще больше времени дорогих специалистов на профилирование, поиск проблемы, отладку и переписывание с учетом регрессии.


                      1. wellusion
                        07.06.2019 13:22
                        -4

                        Гипотетическая проблема. Всё не предусмотришь. В данном случае вероятность такого исхода довольно мала.
                        Хотелось бы писать хорошо структурированный код с хорошей архитектурой и тестами. Но реальность такова, что бизнесу нужен результат. И нужно найти золотую середину между стоимостью, качеством и временем разработки.


                        1. retran
                          07.06.2019 13:32
                          +1

                          Это очень сильно зависит от проекта и специфики. Есть проекты где это неважно (типичный веб), есть проекты где про это все нужно думать постоянно даже на очень простом коде (я сейчас на таком).


                      1. dididididi
                        07.06.2019 15:46

                        Но с гораздо большей вероятностью, эта строчка кода никогда не использовалась, кроме тестов и проект умер через пару лет навсегда.


                      1. triada63
                        08.06.2019 14:41

                        И команда пошла искать специалиста по оптимизации, чтобы найти проблему, который стоит еще дороже :) А так да, всегда нужно держать в уме базовые принципы оптимизации, в основном это массивы и циклы, и если сомневаешься с будущим количеством данных — сделай хэштаблицу, не ленись. А то потом через неделю/месяц/год придется с профайлером искать где же залипает приложение


        1. wormball
          06.06.2019 19:10
          -2

          А почему, кстати, О(1)? Уже придумали алгоритм, ищущий быстрее двоичного поиска?


          1. lair
            06.06.2019 19:13
            +9

            Ну да, хэш-таблицы.


            1. retran
              06.06.2019 20:05

              А если ключи — строки? А если хэш-таблица не влезает в оперативку? А если таблицу надо часто перестраивать?


              1. ainoneko
                06.06.2019 20:46

                А если значения — байты?


                1. 0xd34df00d
                  06.06.2019 22:05
                  +2

                  Тогда массив из 256 элементов с честным доступом за O(1) вместо амортизации.


                  Хотя это изоморфно хеш-таблице с perfect hash function.


              1. lair
                06.06.2019 21:14
                +1

                Тогда мы все умрем.


              1. marsermd
                06.06.2019 22:54

                То все равно за O(1).


                Если быть чуть более дотошным, то время работы O(hashTime).
                Т.е. если у нас есть N строк с длиной L, хэш-таблица отработает за O(L). Но заметьте, что поиск в отсортированном массиве был бы O(L * log(N)), а поиск в неупорядоченном массиве был бы O(L * N).


                1. retran
                  06.06.2019 23:45

                  Речь в комментарии на который я отвечал шла о том "какой алгоритм быстрее", а не о том сложность какого алгоритма быстрее растет при росте n.


                  "хэш-таблица отработает за O(L)"


                  Все равно за O(1).


                  1. marsermd
                    07.06.2019 12:00

                    Дочитайте мой комментарий до конца.


                    Из него вполне очевидно, что по ассимптотике хэш-таблица быстрее других методов, т.к. время работы других методов так же растет линейно с ростом длины строки.


                    1. retran
                      07.06.2019 12:08

                      Я повторю ещё раз.


                      Речь в комментарии на который я отвечал шла о том "какой алгоритм быстрее", а не о том сложность какого алгоритма быстрее растет при росте n.


                      А дальше попрошу сходить в любую книжку по алгоритмам и разобраться с понятием амортизированной сложности алгоритма (по пути можно заглянуть в матанализ и посмотреть, что такое предел по одной переменной) и а также алгоритмами хэширования строк.


                      1. marsermd
                        07.06.2019 12:45
                        +1

                        Оригинальный комментарий:


                        А почему, кстати, О(1)? Уже придумали алгоритм, ищущий быстрее двоичного поиска?

                        Да, придумали. Хэш-таблица.


                        Вы привели контр-пример про строки (корректный, но являющийся скорее придиркой в данном контексте) — я на него ответил.


                        А если хэш-таблица не влезает в оперативку?

                        Это не влияет на ассимптотику.


                        А если таблицу надо часто перестраивать?

                        Это не влияет на ассимптотику.


                        А дальше попрошу сходить в любую книжку по алгоритмам и разобраться с понятием амортизированной сложности алгоритма

                        Я осознаю, что в случае хэш-таблицы это сложность в среднем, а в бин. поиске — в худшем случае. Но, как вы сказали, мы обсуждаем "какой алгоритм быстрее".


                        Так нормально? Вы меня не отсылайте в книжки, покажите где я по вашему неправ.
                        Я умею хэшировать строки и писать хэш-таблицы. И теорию тоже сдавал:) Так что давайте дискутировать предметно.


                        1. retran
                          07.06.2019 12:58

                          Хорошо, извините за резкий тон и спасибо за адекватную реакцию.

                          Давайте подробно, по порядку.
                          Что по вашему такое «асимптотика функции»?

                          Я осознаю, что в случае хэш-таблицы это сложность в среднем, а в бин. поиске — в худшем случае. Но, как вы сказали, мы обсуждаем «какой алгоритм быстрее».


                          Не совсем «в среднем», это предел от «среднего» при n -> бесконечность.
                          В вашем примере с хэшфункцией по строке со сложностью O(L) получается:
                          image

                          Это не говорит о том быстрее или медленнее работает хэш-таблица, это говорит о том, что при росте n хэш-таблица в общем случае не становится медленнее.


                          1. marsermd
                            07.06.2019 15:30

                            А, все, я понял о чем мы спорим.


                            Вы под "быстрее/медленнее" подразумеваете произваодительность в миллисекундах (измеряемую). А я подразумеваю сравнение вычислительной сложности.


                            Мое понимание ситуации взялось из оригинального комментария "А почему, кстати, О(1)? — тут речь шла явно именно про асимптотику.


                            Вы видимо зацепились за "Уже придумали алгоритм, ищущий быстрее двоичного поиска?"


                            Я же развернул этот вопрос так(из теории): найдется такое n0, что для любого N > n0 хэштэйбл работает быстрее двоичного поиска (в миллисекундах). При этом, из практики, находится это n0 довольно быстро:)


                            1. retran
                              07.06.2019 15:41

                              Вы под «быстрее/медленнее» подразумеваете производительность в миллисекундах (измеряемую).


                              Да, конечно, ту которую можно измерить, и которая реально влияет на пользовательский опыт.

                              Вы видимо зацепились за «Уже придумали алгоритм, ищущий быстрее двоичного поиска?»


                              Именно так.

                              Вообще, я хотел высказать идею, что принимать решение о выборе алгоритма только на основании его асимптотик (как часто просят на «неправильных» собеседованиях поклонники карго-культа и зубрежки) — неправильно.


                              1. marsermd
                                07.06.2019 19:41

                                Ок, тут согласен на все 100%.
                                Если есть априорное понимание того, что список объектов будет коротким нужно писать на списке. Хотя лучше написать реализацию ArraySet, чтобы каждый раз самому не писать:)


                                В случае же сомнений обычно стоит выбирать вариант с наилучшей асимптотикой (о выборе коллекций с адекватным трейд-оффом между ассимтотикой и константой за нас обычно заботятся разработчики коллекций. Вы врядли встретите упомянутое ниже дерево Ван Эмде Боаса, из-за его ужасной константы).


                                За 5 лет разработки игр я 1 раз видел в профайлере OrderedSet, который надо было заменить на массив чтобы стало быстрее. Ни разу я не видел в такой роли HashSet. И я видел с сотню раз линейный/бинарный поиск, который надо было заменить на HashSet.


              1. Ogoun
                07.06.2019 15:04

                Если строки (или набор байт произвольной длины) в качестве ключа, можно использовать префиксное дерево


            1. JekaMas
              06.06.2019 21:46

              От реализации правда зависит, количества элементов, их распределения. Может доходить и до логарифмической сложности.


            1. pal666
              07.06.2019 04:08

              хэш-таблица гарантированно ищет за O(n)
              меньше только если с ключами повезло и она не выродилась в список
              а если не повезло, то выходит так ocert.org/advisories/ocert-2011-003.html


              1. nightwolf_du
                07.06.2019 15:26

                Можно взять хэш-таблицу с открытой адресацией и двойным хешированием, чтобы радикально уменьшить верятность вырождения в список


                1. pal666
                  10.06.2019 00:32

                  а до 2011 года это была засекреченная информация или все авторы перечисленных реализцаций просто прогуляли в школе урок по хештаблицам? если вашей структурой может пользоваться только секюрити эксперт после оборачивания ее несколькими рядами костылей, зачем ее кому-то в интернете вообще советовать?


                  1. nightwolf_du
                    10.06.2019 10:28

                    Как-то за вашей агрессией мысль не уловил.
                    По ссылке описана атака на отказ в обслуживании через подбор и засылку данных, которые заранее известной хешфункцией дают коллизии, в связи с чем поиск вырождается в линейный для разрешения коллизий цепочками, логарифмический для цепочек лежащих в дереве поиска, линейный для хеширования с открытой адресацией с линейным/квадратичным пробированием и хз для двойного хеширования.

                    Т.е. не будет разницы между поиском по массиву по связному списку и по хештаблице с любым типом разрешения коллизий.

                    если вашей структурой может пользоваться только секюрити эксперт после оборачивания ее несколькими рядами костылей

                    Какой структурой, хештаблицей?
                    А чем еще пользоваться-то, сбалансированными деревьями поиска? Ну, они при такой атаке покажут амортизированную логарифмическую сложность поиска, но также будут неплохо сдыхать на перебалансировке.
                    Ну, и вне данной атаки производительность будет хуже.


          1. retran
            06.06.2019 19:50
            +1

            Это на самом деле очень сложный вопрос.
            Хэш-таблицы имеют хорошую амортизированную асимптотику, но это совсем не значит, что в общем случае они ищут быстрее или медленнее.


            1. YemSalat
              07.06.2019 00:30

              Не понял, можете пояснить?
              Как выбор значения «по ключу» может быть нe быстрее поиска по списку? Особенно учитывая что про сам список нам никакие особые условия не даны.


              1. retran
                07.06.2019 00:46

                Последовательный перебор хорошо локализованного списка влезшего в кэш процессора легко может оказаться быстрее поиска в размазанной по куче или вообще выгруженной в своп хэш-таблице.


                Сравните:


                1. Вы держите книгу в руках и ищете страницу 100 последовательно переворачивая страницы.
                2. Вы пишете письмо другу в другой город с просьбой прислать страницу 100 и неделю ждёте ответа с одной страницей.

                Асимптотики алгоритмов знать безусловно надо, но они нужны не столько для сравнения скорости алгоритмов сколько для сравнения их способности к масштабированию. А оценить именно скорость без учёта окружения и особенностей реализации невозможно.


                1. mayorovp
                  07.06.2019 09:31

                  Ключевое тут — "хорошо локализованного" и "влезшего в кэш процессора". Минимально разросшийся список в кеш уже не влезет, ну а локализованность в Питоне — оксюморон.


                  1. retran
                    07.06.2019 11:55

                    Конечно, правда говорят, что массивы в numpy как раз хорошо локализованы. Но я не питонист, не знаю :(


                    Это просто пример того, что O-нотация и реальная жизнь сложнее чем "O(1) быстрее O(n)".


                    1. marsermd
                      07.06.2019 19:44

                      Не могу с вами не согласиться:)


          1. SanQri
            07.06.2019 08:28

            С хеш таблицами это обман. Либо большой перерасход памяти, либо реальная худшая сложность О(н). Если хотите что-то быстрее, то, например, дерево Ван Эмде Боаса может отвечать на ваши запросы за логарифт по основанию w, где w это длина числа (ключа) в битах. Из-за большой константы имеет смысл использовать только на больших данных, но при этом памяти расходует сколько нужно и ведет себя более определенно по сравнению с хеш таблицами


          1. C-4
            09.06.2019 10:26

            «Уже» придумали и описали в 30-ых годах прошлого века. Ссылки в книгах Д. Кнута, Вам в помощь:)


    1. noize
      06.06.2019 17:23
      -4

      уточните, кандидат на должность по какому языку? Например, зачем мне на python или javascript знать как организовывать связанные списки(за исключением саморазвития и расширения кругозора)?
      Скорее всего, среднестатистическому программисту на интерпретируемых языках это вообще никогда не понадобится.


      1. DrPass
        06.06.2019 17:40
        +3

        Например, зачем мне на python или javascript знать как организовывать связанные списки(за исключением саморазвития и расширения кругозора)?

        Например, для того, чтобы делать осознанный выбор, в каком случае для хранения данных использовать список, в каком — хеш-таблицу, а в каком массив, чтобы ваше приложение из пары форм нормально работало, а не еле ворочалось на топовой конфигурации, как некоторые ухитряются делать.


        1. Andrey_Dolg
          06.06.2019 17:44
          +3

          Честно скажу, по моему вы слишком утрируете.


          1. menstenebris
            07.06.2019 14:08

            Не утрирует. Я постоянно переписываю код на python за студентами и стажерами. У большинства начинающих разработчиков на python вообще нет понимания в чем разница между структурами данных. Хеш-таблица интуитивно понятно выполнена, список тоже. Поэтому я видел абсолютно бесчеловечные попытки реализовать выдуманные велосипеды, ведь проект нужно было сдать еще вчера. В итоге мне на полном серьезе приходится объяснять что не надо искать уникальные элементы списка через ключи хеш-таблицы когда есть множества (set).

            Но опять же. Ты получаешь то что контролируешь. Хочешь чтобы кандидат знал структуры данных, спрашивай его про структуры данных. Если ты спрашиваешь у кандидата решение задачи про «мышей и яд» то он это ответит, но не факт что он будет знать структуры данных


            1. mjr27
              07.06.2019 16:17
              +2

              что не надо искать уникальные элементы списка через ключи хеш-таблицы когда есть множества

              Я за бывшими PHP'шниками постоянно такое замечаю. Последствия "единой структуры данных для всего".


        1. knotri
          06.06.2019 18:59

          использовать список, в каком — хеш-таблицу, а в каком массив

          Не будем забывать что в js "настоящего" связного списка нет, он будет делатся через объект(который хеш таблица).


          Также не будем забывать что на фронтенде объем данных редко превышает 200 единиц, почти никогда 2000.


          А на таких объемах условныйn log n против n выиграет всего-то навсего в 10 раз. И не исключенно что упущенные константы будут 1 * n * log n против 20 * n


          1. devpony
            06.06.2019 19:01
            +3

            А на таких объемах условныйn log n против n выиграет всего-то навсего в 10 раз. И не исключенно что упущенные константы будут 20 n log n против 1 * n

            Но ведь лучше это явно понимать.


            1. knotri
              06.06.2019 19:11
              +7

              Лучше находишь бутылочное горлышко и учится писать качественный, а не производительный код. Лучшее враг хорошего, а преждевременная оптимизация зло.


              На фронтенде производительность очень редко будет упиратся в структуры данных или алгоритмы. Пример простой и распространненой задача на фронтенде это получить данные от бекенда -> отобразить эти данные. ё


              А сложные задачи возникают так редко что их может тех лид / сто помочь решить / отловить на ревью


              1. mkovalevskyi
                07.06.2019 00:25
                -1

                Пример — фронтенд, на который несколько сотен раз в секунду поступает насколько сотен рекордов, в каждом по 500 полей. Все это дело динамически подсвечивается в зависимости от настроек и данных, сортируется и фильтруется.
                Удачи вам, без структур данных и алгоритмов )


                1. putnik
                  07.06.2019 01:42
                  +1

                  И вы уверены, что узкое место тут именно данные, а не рендеринг?


                  1. JustDont
                    07.06.2019 12:04

                    Как раз хотел написать, что работая с таким реальным проектом (быстро обновляющаяся таблица) — всё время, потраченное на оптимизацию, сначала ушло в транспорт (и вот эти «сотни раз в секунду» обрезались на этом этапе, потому что столько обновлений на фронте просто не надо, а значит и пересылать их тоже не надо, надо заранее группировать и причёсывать), а когда транспорт стал более-менее весело бегать, остальное ушло на очень простенькую оптимизацию рендера, чтоб хотя бы стабильные 30 fps были.
                    Про структуры данных вообще никто не вспоминал.

                    Хорошие структуры данных однозначно полезны и на фронте, но совсем даже не для оптимизации (я за 10+ лет фронтэндерства местами на довольно больших объемах данных про big O вспоминал примерно один раз, да и то в целях «а не стоит ли этот момент отдать на бэк?»), а для читаемости кода.


                    1. mkovalevskyi
                      07.06.2019 18:20

                      Тут есть одна проблема.
                      Вы рассказываете, как это все надо было сделать правильно, и это все конечно так. А я — как это было первоначально сделано по разным причинам (начиная от полного игнорирования пункта про саначала анализ требований, а потом их выполнение, заканчивая чуток загадочным подходом менеджмента к процессам).


                      1. JustDont
                        07.06.2019 18:29

                        Но при чём тут правильные структуры данных?
                        Плохо сделанную вещь надо делать нормально — и это начинается не с замен структур данных.


                        1. mkovalevskyi
                          07.06.2019 19:45

                          Структуры данных тут при том, что они будут прописаны как требование для айчаров и прочих учасников найма.
                          И еще раз, «правильно» — понятие сильно относительное.
                          Для Вас, правильно — это корректно работающее приложение с логичной структурой.
                          Для менеджера (да, есть исключения, но в больших конторах эти исключения редко задерживаются), правильно — это проект на котором задействовано максимально большое количество людей на максимально длительный срок.
                          И возвращаясь к изначальной теме — угадайте, кто влияет на методики подбора кандидатов больше? Вы, или менеджер?


                          1. JustDont
                            07.06.2019 19:57

                            Ничего не понял.
                            Если у нас «проект, на котором задействовано максимально большое количество людей на максимально длительный срок» — то структуры данных вам точно не помогут. Просто получайте ваши сотни обновлений данных в секунду и как-нибудь показывайте их на фронте. Желательно силами большой скрам-команды со всеми песнями, плясками, эпиками, доской, и всем таким. Желательно долго. Начните с тормозного варианта, а потом в течении десятка лет оптимизируйте по паре процентов в месяц. Все будут довольны (особенно менеджер). Ну а уж если вам таки хорошие структуры данных в итоге будут нужны, то за этот десяток лет будет время самообразоваться.


                            1. mkovalevskyi
                              07.06.2019 23:38

                              Вы опять зачем-то используете логику нормального человека. Оно не применимо для эфективного аутсорса )


                1. max_mustermann
                  07.06.2019 15:08
                  +3

                  У вас на фронтенде 50 тысяч(!) полей, изменяющиеся несколько сотен(!) раз в секунду. Отличный пример.
                  А зачем вам фронтенд, всё равно человек на такое смотреть не сможет чисто физически, а роботу через API какое всяко удобнее…


                  1. mkovalevskyi
                    07.06.2019 17:59

                    Вот вам «всё равно человек на такое смотреть не сможет чисто физически» это очевидно. И мне очевидно.
                    Но тут у нас имеют место быть ньюансы работы эффектывных аутсорсинговых компаний. Которым надо работу работать, и как можно дольше, особенно если можно прикрытся требованиями от заказчика. Так что вышенаписанное год пилили, пока все не поняли, что это будет невозможно использовать на практике…


                    1. saboteur_kiev
                      07.06.2019 20:16

                      Для данной проблемы нужно проявлять не знание структур данных и алгоритмов, а те самые софт скиллы, чтобы вовремя пояснить и сэкономить человекочасы.


                      1. mkovalevskyi
                        07.06.2019 23:16

                        Да, только вас уволят в течении имнимально возможного времени, как только узнают что вы решили «сэкономить человекочасы». Ибо вы нанесете таким образом прямой финансовый урон вашей галере )))


                    1. max_mustermann
                      08.06.2019 13:35

                      Вот вам «всё равно человек на такое смотреть не сможет чисто физически» это очевидно. И мне очевидно.


                      Это очевидно любому человеку, ну обычный здравый смысл.

                      надо работу работать, и как можно дольше


                      Это называется «попил бабла», к алгоритмам и структурам данных отношения не имеет.


              1. cross_join
                07.06.2019 12:35
                +1

                Сортировки в таблицах, отображение master-detail на 2+ уровня, подсветка строк «значение есть/нет в списке»?


              1. menstenebris
                07.06.2019 14:18
                +1

                Я когда-то тоже любил фразу про преждевременную оптимизацию. На деле же оказалось что к тебе через неделю подойдут и спросят «а может твой код обработать в 1000 раз больше данных? а в 10000?» ты начинаешь пытаться оптимизировать программу и понимаешь что у тебя не одно узкое место, а вся программа сплошное узкое место.
                И на самом деле большинству достаточно по профилировать свои программы пару раз. чтобы понять какие решения работают медленно а какие быстро и в следующий раз они уже так делать не будут. Не будет больше решений в стиле «а давайте создадим 10 млн экземпляров классов на python» или «давайте сделаем цикл в цикле для поиска уникальных элементов связанного списка на javascript»


              1. khim
                07.06.2019 16:20
                +1

                На фронтенде производительность очень редко будет упиратся в структуры данных или алгоритмы.
                Зайдите на популярный Patreon (хотя бы сюда), отмотайте ленту, скажем, на пару лет назад… а потом возвращайтесь сюда и мы сможем продолжить дискуссию.

                Лучше находишь бутылочное горлышко и учится писать качественный, а не производительный код.
                Лучше — не создавать «бутылочных голышек» в количестве 100500 штук.

                Да, это плохо влияет на KPI: вы не сможете рапортовать о том, что ускорили Frontend на 50% каждый год 10 лет подряд… но зато то, что вы сотворили — не будет вызывать у пользователя ненависти.

                P.S. И да, тот факт, что Patreon — при всей его жутчайшей убогости — весьма популярен… говорит не о том, что на фронте не нужны люди со знанием алгоритмов. А о том, что вообще качество программистов для фронта — дело вообще десятое. Маркетинг и дизайнеры — важнее. Нет никакой дихотомии между написанием «качественного» и «производительного» кода. Возможно при выжимании последних 2-3-5% производительности… но никак не при добавлении трёх кнопочек на веб-страницу. Вы либо пишите качественный и производительный код, либо… дешёвый. И то и другое бывает нужно — но только не надо рассказывать сказок про качественный, но не производительный код. Не на фронте.


                1. JustDont
                  07.06.2019 17:17
                  -1

                  Зайдите на популярный Patreon (хотя бы сюда), отмотайте ленту, скажем, на пару лет назад… а потом возвращайтесь сюда и мы сможем продолжить дискуссию.

                  Это всего лишь потому, что сценарий достаточно долгого проматывания модной бесконечно скроллящейся ленты в подавляющем большинстве случаев использования этих самых модных лент никого не интересует.
                  Просто потому, что так пойдет делать ничтожно малый процент пользователей, на интересы которых дешевле наплевать, чем что-то делать.

                  И структуры данных тут опять же не при чём, кстати.


                  1. khim
                    07.06.2019 18:49
                    +2

                    Это всего лишь потому, что сценарий достаточно долгого проматывания модной бесконечно скроллящейся ленты в подавляющем большинстве случаев использования этих самых модных лент никого не интересует.
                    А с чего вы так решили, извините? И как вообще добраться до первый страниц комикса, про который вы только что узнали?

                    Там сейчас вообще забавная вещь происходит: творчество некоторых авторов увидеть целиков вообще нельзя, в принципе, потому что при попытки домотать туда примерно через пару часов сайт просит обновить куку… и забывает про всё, что вы успели намотать.

                    И структуры данных тут опять же не при чём, кстати.
                    Что значит «не при чём»? Тот факт, что каждое нажатие на «Load more» отрабатывает дольше, чем предыдущее (до такой степени, что Firefox начинает предлагать «убить вкладку») — просто орёт про то, что кто-то где-то куда-то вкрутил, в очередной раз, алгоритм маляра Шлемеля.

                    Просто потому, что так пойдет делать ничтожно малый процент пользователей, на интересы которых дешевле наплевать, чем что-то делать.
                    Вот только не надо рассказывать мне — что это был сознательный выбор. Просто при написании этого кода учитывалась что угодно, кроме, собственно, эффективности и реального удобства пользования.


                    1. JustDont
                      07.06.2019 18:54
                      -1

                      А с чего вы так решили, извините?

                      Предлагайте свои варианты. Я не настаиваю.

                      И как вообще добраться до первый страниц комикса, про который вы только что узнали?

                      Никак? Вы всерьез что ли думаете, что я не в курсе типичных проблем убогой реализации бесконечной ленты, и что я лично с этим не сталкивался? Я в курсе и сталкивался. И жаловался на это. И в конце концов плюнул и получил нужную мне инфу через прямой запрос к бекэнду.

                      В Спортлото напишите.

                      Тот факт, что каждое нажатие на «Load more» отрабатывает дольше, чем предыдущее (до такой степени, что Firefox начинает предлагать «убить вкладку») — просто орёт про то, что кто-то где-то куда-то вкрутил, в очередной раз, алгоритм маляра Шлемеля.

                      А, ну у кого-то очень кривые руки. Как будто что-то новое. Учитывая, что на патреоне с бэком вроде бы всё в порядке, насколько я могу видеть, а тормоза проявлятся на самом onclick, еще даже до того момента, как будут сделаны запросы на бэк — это один из случаев криворукого построения фронтэнда. Сказать, что там дело именно в структурах данных — я бы очень сильно поостерегся. Может быть именно и в них, но проблемы там явно не от структур данных начались, а от непонимания того, что происходит со страницей, когда на ней пара тысяч постов.

                      Вот только не надо рассказывать мне — что это был сознательный выбор.

                      Нет, сознательный выбор — это ничего не делать, когда неизбежно придут те 2.5 человека, которым это надо, и начнут жаловаться. И это опять же только лишь гипотеза, основанная на наблюдении. С радостью её отброшу, как только где-нибудь кто-то починит свою убогую ленту по жалобам пользователей.


                      1. khim
                        07.06.2019 20:31

                        Может быть именно и в них, но проблемы там явно не от структур данных начались, а от непонимания того, что происходит со страницей, когда на ней пара тысяч постов.
                        Погодите — а как вы поймёте «что происходит со страницей, когда в ней пара тысяч постов» если вы про алгоритмы и структуры данных не в курсе?

                        Вы вообще — на каком языке будете это своё понимание описывать? Я вот, извините, не могу просто себе представить человека, который понимает «что происходит со страницей, когда на ней пара тысяч постов» — но при этом не умеет «в алгоритмы и структуры данных».

                        Ну просто потому что у человека же даже словаря не будет в голове со словами, которые нужны, чтобы это вот всё описать!

                        Сказать, что там дело именно в структурах данных — я бы очень сильно поостерегся.
                        В алгоритмах и стурктурах данных. 100%. Задача — добавить на страницу несколько картинок ну никак не должна требовать триллионов операций (именно столько CPU исполняет за то время, пока отрабатывает onclick). Никак. Она может это делать только когда кто-то что-то сделал не думаю о сложности от слова «совсем».


                        1. JustDont
                          08.06.2019 00:07

                          Вы спорите с какими-то своими фантазиями. Я всего лишь о том, что тема, поднятая в комментариях о «замените список на мапу и всё у вас станет хорошо» во фронтэнде в подавляющем большинстве случаев смысла не имеет. Алгоритмы-то тут при чём? Я про них не говорил. Вы хотите спорить с тем, кто написал

                          На фронтенде производительность очень редко будет упиратся в структуры данных или алгоритмы.

                          — вот с ним и спорьте (но едва ли в этом много пользы, потому что написанное им просто бессмысленно; производительность всегда будет упираться в алгоритмы).


                    1. rkuvaldin
                      07.06.2019 19:18

                      А с чего вы так решили, извините? И как вообще добраться до первый страниц комикса, про который вы только что узнали?


                      Скачать его с ресурса, на котором он выложен с нормальной постраничной разбивкой :-)
                      acomics.ru/~LwHG например


                      1. khim
                        07.06.2019 20:34

                        Скачать его с ресурса, на котором он выложен с нормальной постраничной разбивкой :-)
                        acomics.ru/~LwHG например
                        Этот ресурс, конечно, хорош — но там много всякого премиум-контента недоступно. Только сам комикс.

                        Да и вопрос не в том, как это в принципе сделать (можно, в конце-концов, понять какие запросы фронт Patreon'а шлёт на сервере), а в качестве кода. Дерьмо это, а не код — и мне для того, чтобы сделать это высказывание совершенно даже не нужно на него смотреть.


                    1. mayorovp
                      09.06.2019 15:48

                      А с чего вы так решили, извините? И как вообще добраться до первый страниц комикса, про который вы только что узнали?

                      Неужели… нужно включить фильтрацию по месяцу? Или сортировку от старых к новым?


                1. bano-notit
                  08.06.2019 03:16

                  Зайдите на популярный Patreon (хотя бы сюда), отмотайте ленту, скажем, на пару лет назад… а потом возвращайтесь сюда и мы сможем продолжить дискуссию.

                  Ну да, ну пролистал, ну рендер начинает дохнуть от такого количество нод (один только значок замочка — 4 вложенных друг в друга дива, что вообще-то делать нельзя).


                  Это всё конечно классно, но я не понимаю как тут могут помочь алгоритмы? Тут может помочь только нормальная вёрстка, а не использование react styled components на каждом новом посте.


                  Решение, которое тут сработает — виртуальные списки, которые уменьшают количество нод для отрисовки, и в них тоже никакими алгоритмами не пахнет, ну просто потому что не пахнет, это простейшая штука, которая давно сделана по несколько раз в разных библиотеках.


                  1. khim
                    08.06.2019 05:22
                    +1

                    Это всё конечно классно, но я не понимаю как тут могут помочь алгоритмы? Тут может помочь только нормальная вёрстка, а не использование react styled components на каждом новом посте.
                    Понимаете какая история. Отмотав куда-нибудь достаточно далеко (насколько дадут, к началу отмотать не получится, как я уже сказал)… можно это вот всё — со всеми четырёхвложенными Div'ами и прочим — записать в файл. А потом — прочитать его. И он откроется за пару секунд.

                    Что это значит? Что вся эта «ненормальная» вёрстка браузером пережёвывается нормально. Да, она ужасна. Да, у людей создавших это — руки из жопы растут. Но тормоза — не оттуда. Тормоза — из применений технологий, «цену» которым вы не знаете.

                    Всё что там происходит с DOM'ом — при некотором желании я могу воспроизвести на технологиях нулевых, а если немного напрячься — то и на технологиях прошлого века. И оно не будет тормозить. Это несложно. Ну вот просто тупо сделать всё на строках, а потому один раз innerHTML присвоить.

                    Сложно — сделать это, применяя хайпхайп современного фронтэнда. Но, чёрт побери, если вам это технологии мешают делать вещи, которые люди прекрасно делали и без них 20 лет назад — то чего вообще, вот это вот знание, которое нам предлагают оценивать вместо «разворачивания списков» — стоит?


                    1. bano-notit
                      08.06.2019 06:12

                      Но, чёрт побери, если вам это технологии мешают делать вещи, которые люди прекрасно делали и без них 20 лет назад — то чего вообще, вот это вот знание, которое нам предлагают оценивать вместо «разворачивания списков» — стоит?

                      Я где-то на хабре давно писал, что заказчику важно не насколько качественно сделано, а насколько быстро и дёшево. Во фронте это везде. Потому что рынок такой.


                      Цену технологий мы знаем, прекрасно знаем. Вопрос в том, что нам не платят за правильное использование, платят за быстрое и дешёвое использование.


                      Тем кому важно сделать нормально, те сами сядут и сделают, а те кому нужно деньги быстро закалачивать — те будут использовать быстрые и дешёвые технологии.


                      Для примера "хорошо сделанного" возьмём coub.com, люди как к бизнесу так и к коду и технологиям относятся. Хотят сделать хорошо — делают. Но только у них весь бизнес — одна эта лента и от её реализации напрямую зависит количество денег, которые получает компания. В медиуме статейки являются источником бабла. Поэтому они сделаны оптимально и быстро. Там может быть сколько угодно картинок и сколько угодно анимаций, всё сделано хорошо, потому что люди знали, что делают на совесть.


                      В патреоне главное — переводы, на посты всем глубочайше срать, а вот лендинг, как ему и положено, грузится быстро и не зависает. В вк теперь главное — музыка, реклама и хайп, поэтому сообщения начинают безбожно лагать, официальные приложения безбожно жрать, а реклама безбожно появляться везде.


                      Весь фронтэнд сейчас работает на хайпе, потому что за него платят. Если вам будут платить если вы во время использования своих алгоритмов будете хиты на гитаре бренчать, то вы будете работать с гитарой под мышкой, вот и мы, работаем тем, за что платят.


                      1. khim
                        08.06.2019 13:37

                        Цену технологий мы знаем, прекрасно знаем. Вопрос в том, что нам не платят за правильное использование, платят за быстрое и дешёвое использование.
                        Это всё понятно.

                        Весь фронтэнд сейчас работает на хайпе, потому что за него платят. Если вам будут платить если вы во время использования своих алгоритмов будете хиты на гитаре бренчать, то вы будете работать с гитарой под мышкой, вот и мы, работаем тем, за что платят.
                        Тогда откуда обсуждаемые статьи? Если тот, кто вам платит, хочет, чтобы вы знали про работу со связанными списками — что вам мешает научиться с ними работать?

                        Почему довод «любой каприз за ваши деньги» работает в сторону объяснения «почему порождённый вами код — такое дерьмо», но не работает в сторону «хотите, чтобы я знал про „зайца и черепаху“ — выучу»?


                        1. bano-notit
                          08.06.2019 13:52

                          но не работает в сторону «хотите, чтобы я знал про „зайца и черепаху“ — выучу»?

                          Я не говорил, что в эту сторону не работает, я как раз придерживаюсь именно этой позиции. Если надо будет вакансия со знанием алгоритмов, я конечно же поднатаскаюсь немного, а на работе уже буду применять выученное.


                          Статья то о другом, о том, что знание алгоритмов теперь "жизненно необходимо" даже тем, кто алгоритмы использовать никогда не будет. А точнее на собеседованиях задают задания, которые проверяют навыки, не требующиеся на вакансии на самом деле.


                          Про фронтэнд я начал потому, что вы привели пример плохого продукта из фронтэнда, который как раз сделан для закалачивания и желательно побыстрее и на аутсорсе. Если бы вы брали пример из, например, плюсов, то я бы не смог вступить в дискуссию)


                          1. khim
                            08.06.2019 16:39

                            Про фронтэнд я начал потому,
                            Про фронтенд начали не вы, а совсем даже knotri вот тут:
                            Лучше находишь бутылочное горлышко и учится писать качественный, а не производительный код. Лучшее враг хорошего, а преждевременная оптимизация зло.

                            На фронтенде производительность очень редко будет упиратся в структуры данных или алгоритмы.
                            Я просто показал, что это, мягко говоря, неправда. Свинья везде грязь найдёт — и незнание алгоритмов может сделать ваш фронтенд полным дерьмом. Нельзя «писать качественный, а не производительный код». Это не дихотомия. Качественный код — он же и производительный тоже. Если только вы не пытаетесь выжать «грязными трюками» уж последние 5-10% производительности.

                            вы привели пример плохого продукта из фронтэнда, который как раз сделан для закалачивания
                            А с чего вы так решили? «Заколачивать» они как раз вполне себе заколачивали и три и пять лет назад. У них был вполне себе шустрый сайт с реально работавшей бесконечной лентой (но без модных хайповых технологий… jQuery был, конечно, куда без него).

                            и желательно побыстрее и на аутсорсе.
                            А вот это уже — классическая история: пару лет назад у них случился редизайн. Скорее всего у них появились деньги и они смогли нанять «приличную дизайн-студию». Которая, разумеется, выдала им кусок дерьма с наполнителем из дерьма, приправленный сверху дерьмом же.

                            В любом случае вопрос «нужен нам качественный, быстрый код» или «нам нужен дешёвый код… и побольше-побольше-побольше» — это уже другой вопрос.

                            Изначальный тезис был: на фронте знания алгоритмов и структур данных просто не нужны, а качество кода, магически — в чём-то другом (дальше можно произносить много разных умных слов). На самом деле — знание алгоритмов и структур данных на фронте тоже нужны… если вам нужен качественный код, конечно. Если он не нужен (а так бывает часто, на самом деле, с этим я согласен) — ну тут всё понятно.

                            А точнее на собеседованиях задают задания, которые проверяют навыки, не требующиеся на вакансии на самом деле.
                            Ну тут я отчасти согласен. Сейчас время такое, дурное. Платят не за качественно сделанную работу, а за высоко поднятый хайп.

                            В позднем СССР тоже так было.


                            1. bano-notit
                              08.06.2019 17:10

                              Свинья везде грязь найдёт — и незнание алгоритмов может сделать ваш фронтенд полным дерьмом.

                              Так уже) У нас есть одна большая проблема со структурами, а точнее с одним типом структур — деревом. Оно медленное и неповоротливое. Поэтому мы и придумываем разные хаки, чтобы побороть медленную плюсовую реализацию этого самого дерева.


                              1. khim
                                08.06.2019 17:24

                                У нас есть одна большая проблема со структурами, а точнее с одним типом структур — деревом. Оно медленное и неповоротливое.
                                Ну нет же! Оно, как раз, работает с такой скоростью, что человек не успевает заметить как его тысячу раз поменяют. То есть — да, оно дико медленное и неповоротливое, если сравнивать его с каким-нибудь WinAPI прошлого века, но дело не в нём.

                                Поэтому мы и придумываем разные хаки, чтобы побороть медленную плюсовую реализацию этого самого дерева.
                                Вашими бы устами… Увы, но эти хаки — они о другом: когда наваляли такой большой ком дерьма, что даже эффективная реализация DOM-дерева перестаёт с ним справняться — можно попроовать засунуть его под пресс и постараться сделать блин потоньше.

                                Если вы вместо двух-трёх операций с DOM-деревом выполняете миллион — то да, они-таки начинает тормозить «и с этим приходится что-то делать».

                                Почему-то, правда, «наивное детское решение» — «не выполнять миллион операций там, где нужно десять» в голову не приходит… а да, это ж «преждевременная оптимизация», на неё у нас табу, как же я мог забыть…


                                1. bano-notit
                                  08.06.2019 20:28

                                  del


                                1. bano-notit
                                  08.06.2019 20:28

                                  Я с вами в корне не согласен в том, что dom реализован эффективно. Он реализован по стандарту, а стандарт далеко не эффективный и никогда к этому не стремился.


                                  *прыгаем по веткам*


                                  Меня совершенно удивляет ваша святая вера в эффективность element.innerHTML += stringFromServer. Во-первых, это выдаёт вашу некомпитентность (ибо в js как раз для пропускания этапа парсинга html придумали DocumentFragment, который как бы перекладывает на программиста то, что вслепую делает плюсовая "эффективная" реализация), во-вторых, stringFromServer — один из самых типичных проколов, это прямо зияющий XSS.


                                  А ещё меня уже начинает немного напрягать, что проблему большого количества списков вы причисляете к проблемам, которые "возникают из-за не знания алгоритмов". Это проблема тонкости реализации, и наша задача, как фронтэндеров, знать не алгоритмы, а решения проблем, которые появляются в нашей области. Если будут проблемы, которые решаются алгоритмами — значит они решаются алгоритмами, если решаются всеми известной либой — значит либой. Если руками — значит руками.


                                  Алгоритмы — не серебряная пуля, так же как и библиотеки для виртуализации списков. Просто есть специфика области. И статья как раз про то, что "связные списки" начинают пихать туда, где нет такой специфики, нет задачи, которая так решается.
                                  from del


                                  1. khim
                                    09.06.2019 00:03
                                    -1

                                    Меня совершенно удивляет ваша святая вера в эффективность element.innerHTML += stringFromServer.
                                    Это не вера. Это знание.

                                    ибо в js как раз для пропускания этапа парсинга html придумали DocumentFragment, который как бы перекладывает на программиста то, что вслепую делает плюсовая «эффективная» реализация
                                    Вы хотя бы по ссылке-то сходить пробовали? Вот прям на той странице, куда вы ссылаетесь: Оптимизация, о которой здесь идёт речь, важна в первую очередь для старых браузеров, включая IE9-. В современных браузерах эффект от нее, как правило, небольшой, а иногда может быть и отрицательным.

                                    Кто там говорил про некомпетентность?

                                    во-вторых, stringFromServer — один из самых типичных проколов, это прямо зияющий XSS.
                                    Вы уж меня извините, но если вы сами со своего сервера выдаёте данные, которым не доверяете, то а каких XSS может идти речь? Да, конечно, чтобы XSS не было — нужно, чтобы сервер правильно производил обработку. Но вот беда: наматывание слоёв абстракции эту необходимость совершенно не уничтожает. Наоборот — чем больше вы добавляете «наворотов», тем больше шанс, что вы пропустите какую-нибудь банальность на стыке ваших 100500 плагинов.

                                    А ещё меня уже начинает немного напрягать, что проблему большого количества списков вы причисляете к проблемам, которые «возникают из-за не знания алгоритмов».
                                    «Алгоритмов и структур данных» да. Известная книжка не зря именно так называется. В данном случае второе — важнее, чем первое.

                                    Это проблема тонкости реализации
                                    Нет, чёрт побери. Это не «тонкости реализации». Вы тут почти правильно всё сказали:
                                    Он реализован по стандарту, а стандарт далеко не эффективный и никогда к этому не стремился.
                                    DOM и CSS — это редкостное дерьмо. Иногда вообще возникает ощущение, что они задуманы так, чтобы всё происходило максимально медленно и с максимальными затратами ресурсов. Браузеры очень стараются всё сделать быстро, но поскольку ошибка там в ДНК, то их возможности ограничены.

                                    Тем не менее, если в ответ на действия пользователя вы производите одну манипуляцию с DOM'ом (или даже десять, но не миллион) — современные браузеры всё будут делать достаточно быстро. Ваша задача — придумать, как сделать так, чтобы любые действия пользователя не требовали множества обращений к DOM'у. Если учесть, что данных там у вас на страничке будет несколько мегабайт — от силы (даже если вы откроете тысячи картинок в «ленте» за несколько лет), то скорости JS должно более, чем хватать. А дальше — да, innerHTML и скорости движка тоже должно более, чем хватать.

                                    Если будут проблемы, которые решаются алгоритмами — значит они решаются алгоритмами, если решаются всеми известной либой — значит либой. Если руками — значит руками.
                                    Ещё раз: не бывает задач, которые не решаются правильными алгоритмами и структурами данных, но решаются «известной либой» или «руками». Потому что всё, что вы можете сделать «известной либой» или «руками» — это реализовать ту или иную структуру данных или алгоритм.

                                    Если вы «забьёте» на всё специфику отрасли и всё сделаете на основе базовых структур — то, всего лишь, потратите время на изобретение велосипеда. Что плохо, но не смертельно. Будет несколько дороже, чем в идеальном случае — но приемлемо.

                                    Если же вы всё делаете «SOLIDно», «идеоматично» и так далее (я уверен, что авторы этого самого ужаса на Patreon'е приведут ещё 100500 классных buzzword'ов), но вы не понимаете какие структуры данных за всем этим стоят и какие алгоритмы задействованы — то вам под силу «спалить» любой бюджет, но в результате — у вас всё равно будет глючное поделие, которое тормозит и жрёт ресурсы как не в себя.

                                    И статья как раз про то, что «связные списки» начинают пихать туда, где нет такой специфики, нет задачи, которая так решается.
                                    Почему, чёрт побери, вы в этом так уверены? Вот где на том же самом Patreon'е что-то принципиально отличное от того, что было в GMail 2004го года выпуска? Не в смысле вёрстки (там, как раз, есть вещи, которые технологиями прошлого века не решить… мне так лично кажется, что и не очень надо, ну да ладно — я не верстальщик, туда лезть не хочу и не буду), а вот именно в смысле функциональности? Какая-такая «специфика» там выросла и почему, если там «нет задачи, которая так решается» — то результат столь убог?


                                    1. bano-notit
                                      09.06.2019 00:33
                                      -1

                                      Кто там говорил про некомпетентность?

                                      Прошу прощения конечно, но я привык верить бенчмаркам (DIY), а не какому-то Кантору)


                                      Вы уж меня извините, но если вы сами со своего сервера выдаёте данные, которым не доверяете

                                      Между мной и сервером ещё целая цепь "людей", которым я не могу доверять:


                                      1. Браузер
                                      2. ОС клиента
                                      3. Хакер на вайфае
                                      4. Провайдер клиента
                                      5. Провайдер оборудования для сервера
                                      6. ОС сервера и прокси провайдера железяки

                                      Они могут менять данные как захотят, и https, к сожалению, не спасает. Так что нет, я не доверяю никому, ни юзеру, ни браузеру, ни серверу — всё обманывают, все хотят меня сломать.


                                      Тем не менее, если в ответ на действия пользователя вы производите одну манипуляцию с DOM'ом

                                      Бизнесу нужно, чтобы при нажатии на кнопку "купить" фоточка товара "летела в корзинку", и везде менялись циферки и всё это шустро и одновременно и с анимацией.


                                      Это 1 изменение дома — это просто идеальный случай, которых уже не существует. Нужно и анимацию и пересчёт всего и сразу.


                                      Потому что всё, что вы можете сделать «известной либой» или «руками» — это реализовать ту или иную структуру данных или алгоритм.

                                      Так зачем, если в либе уже реализовано, а руки не отсохнут пару строчек написать? Почему вы эти алгоритмы превозносите в абсолют и приравниваете к сакральным знаниям?


                                      то результат столь убог?

                                      В РФ вроде живём, на вопрос "почему результат столь убог" принято отвечать "ну он хотя бы есть")


                                      А если серьёзно, то результат убог потому, что деньги дали, а когда очухались, что подсовывают говно, обратно деньги уже не вернуть. Ну и выкатили то, что получилось, ибо дешевле выкатить говно чем проходить ещё через 20 таких же компаний и в каждой оставлять кругленькую сумму за один и тот же кусок творчества.


                                      1. khim
                                        09.06.2019 01:11

                                        Кто там говорил про некомпетентность?
                                        Прошу прощения конечно, но я привык верить бенчмаркам (DIY), а не какому-то Кантору)
                                        Бенчмарки показывают то, что и должны были показывать: appendChild работает куда быстрее и innerHTML и DocumentFragment, однако разница не критична. Да, когда вы говорим о том, что операция, которая должна занимать доли секунды, на самом деле исполняется за минуты трёхкраная разница не критична.

                                        Вот когда то, что должно исполняться за доли секунды — будет-таки исполняться за доли секунды… можно уже и об оптимизациях и бенчмарках начинать думать.

                                        Они могут менять данные как захотят, и https, к сожалению, не спасает. Так что нет, я не доверяю никому, ни юзеру, ни браузеру, ни серверу — всё обманывают, все хотят меня сломать.
                                        И чего вы этим добиваетесь? Того, что всё получается такое феншуйно-хайповое? Если вот эти вот «все» могут что-то менять по дороге от сервера к клиенту — то они запросто могут поменять и первоначально скачиваемую страницу. И ваша игра проиграна. Если же не могут — то они и в дополнительный скачанный фрагмент ничего не смогут добавить.

                                        Безопасность не достигается бессмысленным наворачиванием 100500 уровней защит неизвестно от чего. Вначале вы должны понимать — от какой конкретно атаки вы защищаетесь, потом — можно обсуждать — как именно нужно защищаться.

                                        Вот где-где, а в вопросах безопасности — карго-культ точно не нужен.

                                        Бизнесу нужно, чтобы при нажатии на кнопку «купить» фоточка товара «летела в корзинку», и везде менялись циферки и всё это шустро и одновременно и с анимацией.
                                        Расскажите где конкретно на Pantreon'е фоточки «летают в корзину». Потом — можно будет уже и обдумать как конкретно их туда отправить.

                                        Потому что про «шустро и одновременно с анимацией» — возможно продавцы того ужаса, что мы там наблюдаем, кому-то в уши и лили. Но на практике — никакого «шустро» там нет. Нигде.

                                        Это 1 изменение дома — это просто идеальный случай, которых уже не существует.
                                        Извините — но я вам дал вполне конкретный пример. Вот найдите там анимацию (и да — она там такие есть, хотя в глаза бросаются только бесконечно крутящиеся круги, которых, как раз, скорее хорошо, чтобы не было бы) и подумайте — нужно ли ради неё грузить шесть мегабайт JavaScript'а?

                                        Нужно и анимацию и пересчёт всего и сразу.
                                        Ну да, конечно. А иметь возможность всем этим пользоваться — не нужно, конечно.

                                        Так зачем, если в либе уже реализовано, а руки не отсохнут пару строчек написать?
                                        А шесть мегабайт дерьма куда при этом исчезнут?

                                        Почему вы эти алгоритмы превозносите в абсолют и приравниваете к сакральным знаниям?
                                        Это не «сакральные» знания. Не необходимые знания. Если вы знаете алгоритмы и структуры данных, но не знаете «специфики фронтэнда» — то вы поиспользуете «устаревший» innertHTML (который да, действительно работает вдвое-втрое медленнее чем appendChild), но вы с лёгкость скомпенсируете это тем, что ваш код будет в принципе исполнять раз в десять меньше работы.

                                        Хотя код будет писаться долго, да.

                                        Если вы знаете алгоритмы и структуры данных, а также ещё и «специфику»… ну это ваще класс: вы сможете всё делать быстро и хорошо.

                                        Если вы знаете только «специфику» — то вы обречены порождать исключительно тормозное и жрущее ресурсы, как не в себя, дерьмо… хотя кому-то, может быть, этого и будет достаточно…

                                        А если серьёзно, то результат убог потому, что деньги дали, а когда очухались, что подсовывают говно, обратно деньги уже не вернуть. Ну и выкатили то, что получилось, ибо дешевле выкатить говно чем проходить ещё через 20 таких же компаний и в каждой оставлять кругленькую сумму за один и тот же кусок творчества.
                                        Ну вот если вы устраиваетесь в компанию, которая специлизируется на впаривании подобных «продуктов» — тогда вам и будет достаточно только «специфики». А списки тогда разворачивать действительно не нужно.


                1. Soupbreak
                  08.06.2019 14:41

                  Зайдите на популярный Patreon (хотя бы сюда), отмотайте ленту, скажем, на пару лет назад…


                  Отмотал на пару недель, открыл девтулз и увидел там, что ренедерятся все элементы, а не те которые отображаются(нет виртуального скроллинга)
                  Как эту проблему решит знание алгоритомов? Это проблема браузера и знания его api/проблем


                  1. JustDont
                    08.06.2019 15:31
                    +2

                    Как эту проблему решит знание алгоритомов?

                    Вообще-то это всё — самые что ни на есть алгоритмы. Другое дело, что это куда более глубокая тема, чем «просто возьми хэш-таблицу».


                  1. khim
                    08.06.2019 17:02

                    Отмотал на пару недель, открыл девтулз и увидел там, что ренедерятся все элементы, а не те которые отображаются(нет виртуального скроллинга)
                    А почему это проблема? Современные браузеры умеют «дропать» из памяти картинки, которые находятся не во viewport'е, умеют подгружать их «правильно», если они уходят из него, но близко к нему и так далее. Времена MS IE 6 прошли.

                    Проведите эксперимент: сделайте страницу с десятью тысячами картинок (вот просто картинок, без CSS и прочего), откройте её и попробуйте пролистать. Возможно для вас это будет откровением и удивлением, но её можно будет прекрасно просматривать в то время, как ваши десять тысяч картинок будут «медленно и печально» грузиться через GPRS (по крайней мере в Chrome). Firefox сейчас хуже такие вещи обрабатывает — но только вот именно загрузку страницы в которой десять тысяч картинок с самого начала присутствуют… если они туда добавляются постепенно — то и Firefox отлично всё отрабатывает.

                    При этом десять тысяч картинок — это больше, чем в ленте почти у всех авторов там.
                    Как эту проблему решит знание алгоритомов? Это проблема браузера и знания его api/проблем
                    Нет — это проблема именно знания алгоритмов. Если вы эту страницу реализуете с использованием технологий прошлого века (вот совсем прошлого века, без всяких кавычек), но, при этом, задумываясь о качестве результата — то всё будет «летать» (хотя как раз если скачать браузер прошлого века и попробовать её там открыть… эффекто может оказаться несколько другим).

                    А вот если применять хайпхайп технологии и не думать об этом… получите то, что получите.

                    P.S. И да: я не против виртуального скроллинга и вообще всячески за поддержку старых браузеров. Но это уже следующий этап! Сделайте чтобы оно, блин, не тормозило хотя бы в новых! Не можете? Ну и нечего тогда утверждать, что на «на фронтенде производительность очень редко будет упиратся в структуры данных или алгоритмы». Это не так.


                    1. Soupbreak
                      08.06.2019 18:23

                      Проведите эксперимент: сделайте страницу с десятью тысячами картинок (вот просто картинок, без CSS и прочего), откройте её и попробуйте пролистать. Возможно для вас это будет откровением и удивлением, но её можно будет прекрасно просматривать в то время, как ваши десять тысяч картинок будут


                      Но ведь проблема не в картинках, а в том, что в дом дереве постоянно рендерятся новые элементы. И если я также буду выводить 10к точек(каждая в отдельном дом-узле, в котором еще дом узел и тд) то получу туже проблему

                      Нет — это проблема именно знания алгоритмов.


                      И как это поможет пофиксить проблему? Приведите, пожалуйста, пример. И оцените сколько по времени займет его имплементация.

                      Сделайте чтобы оно, блин, не тормозило хотя бы в новых! Не можете? Ну и нечего тогда утверждать, что на «на фронтенде производительность очень редко будет упиратся в структуры данных или алгоритмы». Это не так.


                      Фикс — github.com/bvaughn/react-virtualized, github.com/aurelia/ui-virtualization и тысячи их(в ванильной или же под любой фреймворк). И если на код ревью попадет самописная реализация — ее заверну. Поэтому повторюсь, каким образом знание алгоритмов поможет быстро пофиксить это(или аналогичную) проблему?


                      1. JustDont
                        08.06.2019 20:03
                        +1

                        Фикс — github.com/bvaughn/react-virtualized, github.com/aurelia/ui-virtualization и тысячи их(в ванильной или же под любой фреймворк).

                        Вы идеализируете сторонние решения — они не решают конкретно ваших проблем (а иногда и вообще ничего не решают), и всегда добавляют своих собственных внутренних проблем.

                        Возвращаясь к вашим фиксам, теперь у вас изначальная проблема (длинный список без тормозов) и вторая проблема (issues той либы, которую вы взяли). И хорошо, если первую проблему эта либа полностью решит — тогда вы «всего лишь» останетесь со второй проблемой. Но это не всегда бывает.

                        Для того, чтоб отделять случаи, когда сторонние либы решают проблем больше, чем создают, от тех, когда наоборот — тут и требуется понимание принципов работы фронтэнда и браузерного рендера (и это, внезапно, тоже алгоритмы).

                        ЗЫ: Когда вы подключите 100500 библиотек и вам кто-нибудь скажет, что ваш фронт теперь неподъемен и не грузится на плохом канале — вы что будете делать? Еще одну либу подключите?

                        ЗЗЫ: Я со своей колокольни предложил бы гораздо более простой фикс: нефиг показывать на одной странице столько, что браузер начинает тупить или отжирает всю память клиента (это к вопросу о всяких virtualized-либах, памяти они жрут дай боже, и вполне реально сожрать её всю, если клиент не на ПК с кучей памяти). Добавьте пажинацию и поиск, и внезапно, вам уже не надо рендерить миллионы дивов только чтоб пользователь нашел нужное ему.


                        1. khim
                          08.06.2019 20:11

                          ЗЫ: Когда вы подключите 100500 библиотек и вам кто-нибудь скажет, что ваш фронт теперь неподъемен и не грузится на плохом канале — вы что будете делать? Еще одну либу подключите?
                          Маркетологов подключит. И они объяснят заказчику, что конфетка получается по рецепту «взять дерьма, нафаршировать дерьмом, посыпать сверху дерьмом и завернуть в дерьмо».

                          А что результат плохо пахнет — так это потому что вы неспециалист и не понимаете всех последний веяний создания фронтэндов.


                      1. khim
                        08.06.2019 20:08
                        +1

                        И если я также буду выводить 10к точек(каждая в отдельном дом-узле, в котором еще дом узел и тд) то получу туже проблему
                        Не получите. Если породите их одним приcвоением innerHTML. Или даже 10.

                        И как это поможет пофиксить проблему? Приведите, пожалуйста, пример. И оцените сколько по времени займет его имплементация.
                        Одна строка:
                        document.getElementById("mytext").innerHTML += answerFromServer

                        Не знаю сколько потребуется на реализацию — зависит от того, сколько вы бессмысленного феншуя нагенерировали на стороне сервера.

                        Но знаю, что если вы добавите таким образом мегабайтный HTML с тучей нод (пусть даже 100-вложенных) — это отработает меньше, чем за секунду. Я когда-то слышал, лет 10 назад, когда был «молодой и зелёный» о том, как создатели GMail воевали с MS IE 6, который не допускал больше 255 вложенных Div'ов (и вообще любых элементов — там, похоже, «глубина дерева» как байт хранилась). Да, были проблемы. Тормозов не было. Во всяком случае таких как мы наблюдаем сегодня.

                        И если на код ревью попадет самописная реализация — ее заверну.
                        Ну так в этом проблема, а не в алгоритмах.

                        Поэтому повторюсь, каким образом знание алгоритмов поможет быстро пофиксить это(или аналогичную) проблему?
                        Если от требования «использовать только хайп, а ещё лучше хайпхайп» отходить нельзя — то никак, конечно. Ну тут проблема не с алгоритмами. А в том, что гланды требуется вырезать только автогеном и только через задний проход.

                        В этих случаях — алгоритмы бессильны, тут уже ничего не поделать.


                        1. JustDont
                          08.06.2019 20:27

                          Но знаю, что если вы добавите таким образом мегабайтный HTML с тучей нод (пусть даже 100-вложенных) — это отработает меньше, чем за секунду.

                          Такой хардкор (унесем всё на бэк) в подавляющем большинстве случаев опять же даже и не нужен — мегабайты HTML и реакт какой-нибудь нагенерит, и сделает это весьма быстро (по крайней мере настолько быстро, чтоб пользователь не возмутился). Всё что тут нужно — дать возможность и реакту и браузеру спокойно отработать, не нагружая их каким-нибудь безумным маразмом типа синхронного запиливания миллионов узлов в DOM, или ненужных многократных перерисовок.
                          Конкретно для реакта — это вообще классические грабли, например: перерисовывать весь список тогда, когда нужно перерисовать один его элемент. Сначала так пишется, потому что не тормозит и вообще «ачотакова?», а потом на боевых объемах всё дохнет. И хотя в теории и туториалах этот момент всегда разжёвывается, на практике — обычно всё миллионы раз завёрнуто одно в другое («композиция круче наследования», — говорили они), и неудивительно, что в этом оберточном цирке даже и адекватный программист пропускает неадекватно большую перерисовку.


                          1. khim
                            09.06.2019 00:23

                            Возможно тут влияет руль моё первоначальное образование (математик).

                            Такой хардкор (унесем всё на бэк) в подавляющем большинстве случаев опять же даже и не нужен — мегабайты HTML и реакт какой-нибудь нагенерит, и сделает это весьма быстро (по крайней мере настолько быстро, чтоб пользователь не возмутился).
                            В данном случае речь шла о том — можно ли сделать так, чтобы без измнения вёрстки и без использования «виртуального скроллинга» сделать так, чтобы вот эта вот «бесконечная лента» не тормозила так безбожно. Ответ: да, это возможно — и, собственно
                            document.getElementById("mytext").innerHTML += answerFromServer
                            это конструктивное доказетельство.

                            Нужно ли так делать? Ну — это уже второй вопрос. Да, действительно, возможны варианты и, да, очень может быть что использование полезных либ — не будет лишним.

                            Да собственно почти наверняка оно будет не лишним: сейчас, всё-таки на дворе не 2000й и даже не 2004й год, Pentium II на 200MHz не является типичной конфигурацией, и, в общем, MS IE 6 — тоже в прошлом. А грамотное использование библиотек позволяет достичь хорошего результата быстрее. Однако, парадоксальным образом, не уменьшает необходимости знать основы!

                            И хотя в теории и туториалах этот момент всегда разжёвывается, на практике — обычно всё миллионы раз завёрнуто одно в другое («композиция круче наследования», — говорили они), и неудивительно, что в этом оберточном цирке даже и адекватный программист пропускает неадекватно большую перерисовку.
                            Но если результат — дерьмо, то зачем тогда всё это сакратльное знание, скрытое «в специфике отрасли» и почему оно должно цениться выше, чем банальное умение развернуть список?

                            Увы, абстракции текут — и ничего с этим поделать нельзя.


                            1. JustDont
                              09.06.2019 01:12

                              Но если результат — дерьмо, то зачем тогда всё это сакратльное знание, скрытое «в специфике отрасли» и почему оно должно цениться выше, чем банальное умение развернуть список?

                              Если результат приносит деньги — он не дерьмо. Наверное тут тоже играет роль моё образование (экономист, пусть и с программерским уклоном). Здесь мы как раз приходим к «если это всё говно, но тем не менее приносит прибыль, то почему бы и не продолжать в том же духе». Не говно будет еще больше прибыли приносить? Очень даже вероятно, но его сначала надо сделать, и потратить на это какие-нибудь большие деньги (потому что из «быстро, дешево, качественно» тут придётся поступиться именно «дешево»).

                              Вот именно поэтому кодер, который как-то там смог в реакт на уровне «почитаю Дэна и сделаю всё как пишут» для бизнеса часто интереснее того, кто знает, как сделать всё хорошо, правильно, и без явных и скрытых проблем — но и стоит дороже, да и еще дополнительно требует дорогой же команды, потому что первоначальные трудозатраты на качественные решения — существенно выше первоначальных затрат на говнокод.


                              1. khim
                                09.06.2019 02:17

                                Наверное тут тоже играет роль моё образование (экономист, пусть и с программерским уклоном).
                                Ну эконмисты разные бывают. Некоторые всерьёз верят, что в замкнутой подсистеме можно создать безконечно расширяющаюся подсистему.

                                Очень даже вероятно, но его сначала надо сделать, и потратить на это какие-нибудь большие деньги (потому что из «быстро, дешево, качественно» тут придётся поступиться именно «дешево»).
                                Как раз этот вариант и невозможен. Бизнес очень-очень часто хочет «быстро и качественно» (и обычно, хотя и не всегда, даже готов за это платить). Но получает всегда «быстро и плохо». Потому что качественный софт создаётся десять лет. Ну или не создаётся — ну это если его некому создавать.

                                Не говно будет еще больше прибыли приносить?
                                «Не говно» будет кому-то нужно через десять лет. Про говно все забудут.

                                Если ваш горизонт планирования — два-три года, то вам ни алгоритмы, ни качественные разработчики, на самом деле, не нужны. Пролема в том, что сейчас, на волне хайпа, даже компании, которые не собираются «хапнуть и разбежаться» через пару лет — тоже покупаются на обещания «серебрянной пули».

                                Вот именно поэтому кодер, который как-то там смог в реакт на уровне «почитаю Дэна и сделаю всё как пишут» для бизнеса часто интереснее того, кто знает, как сделать всё хорошо, правильно, и без явных и скрытых проблем — но и стоит дороже, да и еще дополнительно требует дорогой же команды, потому что первоначальные трудозатраты на качественные решения — существенно выше первоначальных затрат на говнокод.
                                Я с этим где-то спорю? Наоборот — я ж токо за! Однако. Вся ветка началась с ответа на вот эту реплику
                                Лучше учится писать качественный, а не производительный код. Лучшее враг хорошего, а преждевременная оптимизация зло.

                                На фронтенде производительность очень редко будет упиратся в структуры данных или алгоритмы.
                                Заметьте: речь идёт про качественный, не дешёвый код.

                                По моему дискуссия себя давно исчерпала: кажется все согласны с тем, что если ваша цель — дешёвый код (пусть и дерьмовый), то отказ от знания алгоритмов и структур данных и многих других «излишеств» — оправдан. Меня просто покоробило предложение писать «качественный, а не производительный код» опираясь на то, что «производительность очень редко будет упиратся в структуры данных или алгоритмы». Это притом, что мы видим везде и всюду как именно это она и делает.

                                Ну вот нет у фронтенда никакой специфики. Вы можете в банальной утилите поиска подстроки в файле создать процедуру сравнения букв без учёта регистров, добавить пару индирекций — и получить такое же замедление, как ваши классические грабли с перерисовкой всего списка, вместо одного элемента. А можете в билд-системе устроить O(N?) — ровно по той же схеме.

                                Потому если вас волнует качество результата — вы должны уметь «в алгоритмы и стурктуры данных». Если нет — то нет.

                                Вот только почему-то у разработчиков в других областях эта банальщина не вызывает отторжения, а фронтэндеры — воспринимают эту банальную истину «в штыки».


                                1. JustDont
                                  09.06.2019 02:28

                                  Как раз этот вариант и невозможен. Бизнес очень-очень часто хочет «быстро и качественно» (и обычно, хотя и не всегда, даже готов за это платить). Но получает всегда «быстро и плохо».

                                  О нет. Этот вариант очень даже возможен в огромном количестве случаев, просто бизнес часто очень плохо представляет, насколько дорого это всё выйдет. Ну и да, конечно же, вещи с некоторого уровня сложности и выше имеют свою цену не в деньгах или не только в деньгах. Не всё параллелится, не всё делается с первого раза, да и всегда есть досадная загвоздка в виде невозможности нарушить законы физики, даже если залить это всё деньгами.

                                  «Не говно» будет кому-то нужно через десять лет. Про говно все забудут.

                                  А если еще точнее — некоторое отдельное «не говно» будет кому-то нужно и через десять лет. Множество другого, не менее хорошего «не говна» всё равно не будет нужно. Нужность через N лет не определяется качественностью, качественность тут — всего лишь одно из необходимых, но не достаточных условий.

                                  ЗЫ: Ну и да, я согласен, что ветка комментов себя исчерпала — я еще где-то выше сказал, что комментировать вот это вот «производительность будет очень редко упираться в структуры данных или алгоритмы» я считаю излишним; это ж просто глупость написана. Многие места в UI упираются в производительности в юзера, но никакой даже очень примитивный UI никогда полностью не упирается в производительность юзера (вторая сторона, сам код, тоже как бы должен отрабатывать). На счётах тоже считают со скоростью юзера, но если счёты у вас заржавеют, то проблема будет не на стороне юзера.


                    1. bano-notit
                      08.06.2019 20:14
                      +1

                      Проведите эксперимент: сделайте страницу с десятью тысячами картинок (вот просто картинок, без CSS и прочего), откройте её и попробуйте пролистать. Возможно для вас это будет откровением и удивлением, но её можно будет прекрасно просматривать в то время, как ваши десять тысяч картинок будут «медленно и печально» грузиться через GPRS (по крайней мере в Chrome).

                      Проводили такой эксперемент… Не прекрасно там ничего, и картинок там было меньше десяти тысяч, и комп был нормальный, на нём видео обычно рендерят, и браузеры разные были, и человек, писавший это является ярым противником js, и было это год назад… Пока оно всё грузилось, а оно реально долго грузилось, потому что фото были хорошие, наваристые, страницу прокручивать было просто невозможно. И фоточек там была наверное тысяча. Как ни странно, но JQ + lazy load решили все проблемы разом, потому что не надо было эти самые картинки грузить и пытаться их отрисовывать кусками, уже пришедшими с сервера.


                      1. khim
                        09.06.2019 00:28
                        -1

                        Возможно. Спорить не буду. В любом случае грузить гигабайт данных, когда об этом не просят — попросту некрасиво. Но вопрос-то был о другом: необходим ли для отзывчивости этой страницы «виртуальный скроллинг» или достаточно грамотного кодинга? Ответ: грамотного кодинга — достаточно. Но его нет. В этом беда.


                    1. mayorovp
                      09.06.2019 16:07

                      Однажды проводил похожий эксперимент. В тот раз я попытался понять, почему же тормозит Хабр на страницах с кучей комментариев. Я нажал "Ответить", открыл инструменты разработчика, и начал снимать с поля ввода все подозрительные обработчики событий.


                      Так вот — когда я снял все, тормоза не исчезли. Дальнейшее исследование показало, что тормозит сам браузер: при вводе любого символа он считал, что размеры textarea могли измениться, и бросался делать всему дереву DOM повторный layout и render.


                      Ну и чем тут могли помочь алгоритмы, "правильная" работа с HTML и прочее? Да ни чем, единственный способ предотвратить тормоза без переписывания браузера — просто не показывать столько комментариев на странице одновременно...


                      1. DrPass
                        09.06.2019 16:58

                        Ну и чем тут могли помочь алгоритмы,

                        Ещё как могли. Только не вам, а разработчикам браузера. Меня, например, откровенно коробит, что моя современная машина с кучей ядер, гигагерц и гигабайт тормозит на такой ерундовой задаче, как рендеринг пары тысяч абзацев. Почему двадцать с лишним лет назад Pentium-233 не тормозил при наборе документа в полторы сотни страниц со встроенной графикой в Word'е, и ему для этой задачи хватало аж нескольких мегабайт, а современный браузер уваливается, и жрет сотни мегабайт или даже гигабайты? Ах, да, ещё и сам Word при этом занимал метров 30, и разрабатывался даже меньшей командой, чем современные браузеры.


            1. wladyspb
              07.06.2019 14:41

              У меня вот в проекте есть места, на которых скорость начала сдавать за счёт сильного увеличения количества элементов, которые надо получить с бэка, а потом отрисовать. Я уверен, что можно получить некоторый прирост за счёт структуры данных. Но. В некоторых случаях, по итогам анализа удалось сократить время ожидания за счёт сжатия данных на бэке. В некоторых случаях удалось оптимизировать скорость работы за счёт перевода пагинации с фронта на бэк, грузя за раз N элементов. Селект с поиском, в котором отрисовывались N элементов, тоже начал тупить, когда N подросло с пары сотен до нескольких тысяч — и проблема прекрасно решилась выносом автокомплита на бэк. Это всё — реальные куски работающей системы, периодические проблемы которые возникают в работе. И решаются они в каждом конкретном случае — разными способами, наиболее подходящими в данном случае. Бывает, конечно, что и на бэке перестаёт хватать скорости обработки данных. Например, у меня в одном пет проекте прототип на php работал несколько минут над хорошей такой кучей взаимно перелинкованных объектов, которые надо было обойти по несколько раз вложенными циклами. Структура данных для коллекций в php одна — называется массивом, а по факту является хэш-словарём. И что там оптимизировать? Возможно, я бы смог переписать алгоритмы и добиться ускорения в два-три раза… Но я ускорил этот кусок кода в сотни раз, просто переписав его на Go.

              И да, признаюсь, я не знаю как составить самостоятельно связанный список. Пока ни разу не понадобились такие навыки, понадобятся — пойду и прочитаю как это делается.


          1. mayorovp
            07.06.2019 09:34

            Не будем забывать что в js "настоящего" связного списка нет, он будет делатся через объект(который хеш таблица).

            Начиная с V8 небольшие объекты — больше не хеш-таблицы, а записи (благодаря скрытым классам). А теперь уже все основные движки так умеют.


      1. 0xd34df00d
        06.06.2019 17:53
        +2

        Список — самая простая рекурсивная структура данных, и на нем удобно учиться мыслить формально рекурсивно.


        И, кстати, список — это вполне формально в некотором смысле самая простая структура данных, так как это свободная монада. Но это уже совсем другая история.


      1. devpony
        06.06.2019 18:58

        уточните, кандидат на должность по какому языку?

        Python


        Например, зачем мне на python или javascript знать как организовывать связанные списки(за исключением саморазвития и расширения кругозора)?

        Во-первых, как я уже упомянул, чтобы понимать как наиболее эффективно использовать структуры данных для реализации алгоритмов. Знать границы применимости, уметь предсказывать поведение кода на низком уровне.


        Во-вторых, иногда и на высоком уровне приходится использовать базовые структуры данных. Реальная продуктовая задачка: для подготовки данных необходимо применить цепочку преобразований. Элемент a заменить элементом b, элемент b элементом c, элемент h элементом g и т.д. Для каждого элемента цепочка преобразований образует односвязный список. А цепочки эти комбинируются из различных источников и, чтобы исключить ошибку, перед применением необходимо проверить их на валидность – удостовериться, что в них нет циклов. А если есть, то либо целиком откинуть такую цепочку, либо поднять информативную ошибку.


        Ни одна стандартная структура данных Python здесь не поможет, библиотек для такой фигни никто не станет писать. Но, понимая структуру данных и зная алгоритм, можно за 5 минут накидать его в несколько строк.


        И это простейший пример. Гораздо чаще возникают деревья и графы.


        1. ZurgInq
          06.06.2019 19:22

          Как тут поможет односвязный список? Вам придётся его эмулировать на имеющихся стандартных типах, что даст только оверхэд на эмуляцию.

          Цепочка преобразований скорей всего будет записана через таблицу замены. Проверка на исключение циклов — это к алгоритмам, а не к структурам данных.
          Графы и деревья в условиях скриптовых языков точно так же будут записаны через структуры Hash\Map. И это точно не является типичной задачей для фронтенда\веба.

          Вопросы на структуры данных и алгоритмы в современных реалиях строго под специфику разрабатываемого продукта.


          1. devpony
            06.06.2019 19:38

            Как тут поможет односвязный список? Вам придётся его эмулировать на имеющихся стандартных типах, что даст только оверхэд на эмуляцию.

            Можно эмулировать, можно и не эмулировать.


            @dataclass(frozen=True)
            class Node:
                next: 'Node'
                value: T

            Проверка на исключение циклов — это к алгоритмам, а не к структурам данных.

            Алгоритмы и структуры данных настолько тесно связаны, что говорить о них отдельно совершенно не имеет смысла.


            Графы и деревья в условиях скриптовых языков точно так же будут записаны через структуры Hash\Map.

            Ну почему же? Я вот так всегда деревья записываю:


            @dataclass(frozen=True)
            class Node:
                left_child: 'Node'
                right_child: 'Node'
                value: T

            это точно не является типичной задачей для фронтенда\веба.

            Человек спросил про Python / JavaScript, а не про фронтенд. В статье тоже ничего конкретно про фронтенд. Мы же с вами не фронтендщиков обсуждаем, а программирование в целом. И в программировании довольно часто появляются задачи, связанные с графами и деревьями. В backend и data science особенно.


            1. vassabi
              06.06.2019 19:51

              … а еще можно через массив\список\кортеж, и тогда ссылки — это индексы в нем.


            1. ZurgInq
              06.06.2019 19:58

              Всё таки сильно зависит от области работы. В моём backend за 7 лет ещё ни разу не было необходимости вручную ворочить списками\деревьями. Там где есть хоть какие то объёмы данных, в дело вступают базы данных (тут скорее задачка, правильно выбрать индексы).

              Могу ошибаться, но кажется системщики, сетевеки, разработчики драйвером, криптографы и прочая братия тоже не слишком часто сталкиваются с необходимостью реализовать структуры данных вроде деревьев\списков, а вот других специфичных особенностей там будет навалом.


              1. lorc
                06.06.2019 20:05

                Да нет, сталкиваемся довольно часто. На самом деле, в ядре уже есть примитивы для одно- и дву- связных списков, rbtree и других чудес алгоритмики. Но примитивы довольно таки тонкие, поэтому все равно надо хотя бы представлять как оно там внутри устроено.


              1. devpony
                06.06.2019 20:14
                +2

                Всё таки сильно зависит от области работы.

                Пожалуй.


                Три примера из моей области:


                1) Фильмы в Netflix со всеми метаданными образуют граф. При этом фильмов немного и граф небольшой, в графовую базу его смысла складывать нет. Поэтому они держат его в памяти процесса и, используя самописные алгоритмы на графах, быстро и эффективно отвечают на запросы.


                2) Для поиска похожих фильмов удобно использовать граф, где рёбрами будут метаданные и скоры из различных моделей. На таком графе затем запускается процедура оптимизации, считающая степень похожести.


                3) Ансамбли деревьев решений – мощные алгоритмы машинного обучения, но скорость предсказаний у них оставляет желать лучшего. Поэтому мы пишем компилятор таких деревьев в нативный код. Для этого, естественно, в памяти необходимо построить некое абстрактное представление таких деревьев, которое затем может быть оптимизировано и скомпилировано.


              1. JekaMas
                06.06.2019 21:53
                +1

                Распределенные системы и криптография. Задачи с деревьями, хитрыми структурами данных вроде crdt, фильтров Блума часты, если не повседневны.
                Однако, я не считаю, что даже в эту область обязательно проверять знания вроде написания своих списков. Пришедший кандидат может оказаться полезен во множестве других задач.


    1. Andrey_Dolg
      06.06.2019 18:18

      И тут такой момент если вы таких кандидатов отсеиваете, то откуда знание в чем они разбираются и что умеют?


      1. devpony
        06.06.2019 18:46
        +1

        После собеседования даём тестовое и потом смотрим корреляцию результатов и присланного кода.


        Честные эксперименты проводить, конечно же, очень дорого.


        1. Andrey_Dolg
          06.06.2019 19:06

          Думаю такой подход даёт максимум информации без затрат денег. Просто предположил что вы используете только вопросы для фильтра.


    1. kotlomoy
      06.06.2019 23:11

      Не уверен, что понял правильно, не знаю языка, но выглядит, как одна и та же проверка внутри цикла. x же не меняется? Действительно, сферическая неэффективность в вакууме


      1. devpony
        06.06.2019 23:17

        Ну я опечатался, там y in xs должно быть.


    1. ArcadijVK3
      08.06.2019 14:41

      Какое бурное обсуждение односвязного списка. Что обсуждать и какие алгоритмы связанные с ним? Элемент такого списка имеет способ получить следующий, если он не последний. А что с полученным элементом делать, к односвязным спискам никакого отношения не имеетю


  1. Gorthauer87
    06.06.2019 17:05
    +4

    А еще эта задача внезапно становится интересной в случае программирования на Rust.


    1. 0xd34df00d
      06.06.2019 18:29

      А что там в Rust?


      Я как ближайший по наркомании аналог беру хаскель — так там обычная свёртка слева с аккумулятором, ровно n действий (в отличие от наивного reverse (x:xs) = reverse xs ++ [x] за n?).


      1. staticlab
        06.06.2019 18:45
        +3

        Может Хаскель и ближайший по наркомании, но у него есть GC, а в Rust вместо него концепция владения. То есть каждый элемент списка владеет следующим, а не просто хранит на него ссылку. Первым же элементом владеет структура списка. В смене владельцев элементов и заключается нетривиальность.


        1. 0xd34df00d
          06.06.2019 19:33

          А, хм. Интересно, да. Надо попробовать написать на идрисе с линейными типами.


        1. Vogr
          07.06.2019 11:35

          Скорее всего это тот самый случай, когда надо писать «небезопасно»


          1. staticlab
            07.06.2019 19:02

            unsafe не отключает borrow checker. Хотя… если использовать «сырые» указатели, то может быть и можно что-то замутить, но тогда уж проще этот список на старой доброй сишечке написать :)


      1. domix32
        06.06.2019 20:07
        +3

        А в Rust если хочется написать односвязный список лучше сразу перестать хотеть


  1. terrier
    06.06.2019 17:29
    +4

    Хм, кстати интересный вопрос: а много ли программистов, скажем от миддлов и выше, которые не знают как развернуть связный список?
    Кому не сложно: если вы не знаете, на уровне алгоритма/псевдокода как это сделать, расскажите, на каком языке вы пишете, какими проектами занимаетесь? Ну или, предположим у вас есть знакомый, который не знает как развернуть список, расскажите о нем.


    1. Rinin
      06.06.2019 18:25
      +1

      Спутникостроение, роботостроение, всякая низко(и очень низко) уровневая дичъ. Очень давно не проходил собеседование, обычно зовут меня, а я ленив чтобы сам искать. Не знаю даже смогу ли.
      Но точно спрошу, что простите вы хотите со списком сделать? После чего видимо буду забрит как безперспективный дед =)


      1. terrier
        06.06.2019 19:08
        +1

        Интересный случай у вас. Но, да, наверное, с таким ответом откажут


        1. Rinin
          06.06.2019 23:38
          +2

          Но при этом это не имеет никакого отношения к квалификации и к знанию Си и структур данных. Всего лишь к знанию терминологии собеседованй. Мне пришлось погуглить чтобы понять что вы об изменить направление связей односвязного списка.

          Связный список в общем случае не надо разворачивать. Связный список можно развернуть в массив, если считать «развернуть» синонимом «распаковать» а не «повернуть». А возможно речь вообще о Развёрнутых связных списках.

          Если же исходить из задачи поменять направление — то логичный ответ — зачем? Если мне зачем-то нужно развернуть односвязный список — то я наверняка что-то делаю неправильно.

          Вообще это отдельная история — терминология собеседований. У вас есть best practices и есть их названия. И если ты не знаешь названия — считается что ты не используешь практику, а если знаешь — то используешь. Что имеет весьма отдаленное отношение к реальности.


          1. terrier
            07.06.2019 01:37

            Окей, возможно, терминология сбивает. Но, предположим вам бы предложили задачу в ясной формулировке, типа:
            преобразовать список
            a->b->… ->d->null
            в
            d->… ->b->a->null
            , ответили бы на уточняющие вопросы по формулировки. При этом вы бы были мотивированы пройти это собеседование. Вы бы смогли придумать алгоритм/написать псевдокод?


            1. Rinin
              07.06.2019 11:00

              Да конечно, я тоже уверен что любой мидл должен быть в состоянии эту задачу решить не задумываясь. Да и любой джун если он планирует писать на чем-то типа C/C++

              Конечно извиняюсь что ответил на заданный вопрос, а не на подразумеваемый, хотя подразумеваемый и был очевиден, но так просто захотелось сказать, что ответ может быть «не смогу» не только из за квалификации.


            1. kisskin
              07.06.2019 20:19

              я бы предложил использовать двунаправленный список и не париться :-D
              но вот подумав минуту, я чтото не придумал быстрого и при этом безопасного алгоритма. Единственно что приходит в голову — использовать стэк, заполнив его адресами элементов и потом сформировать новый список.


              1. khim
                07.06.2019 20:35

                но вот подумав минуту, я чтото не придумал быстрого и при этом безопасного алгоритма.
                Что значит «безопасного» в данном случае???


              1. MacIn
                07.06.2019 20:49
                +1

                Ок, не проблема. Дополнительное ограничение (типичная штука для таких задачек): памяти у вас на это нет. Вот есть у вас список в 3Гб и больше нет ни ОЗУ, ни адресного пространства в товарных количествах.


      1. wadeg
        06.06.2019 23:32

        О_о нешто же такой длинный ответ было написать быстрее, чем в течение нескольких секунд быстро представить в голове хотя бы пару принципиальных ответов?


    1. GarfieldX
      06.06.2019 18:53
      +2

      Ох ты ж. Когда то, во время учебы ворочал этими списками без проблем. Потом использовал в своих домашних поделках иногда, причем, больше «из любви к искусству» чем из-за необходимости. Но фразу «развернуть связный список» пришлось гуглить, т.к. зачем такое может понадобиться не представляю. Потому как звучит из разряда «как же я цифры буквами напишу».


      1. terrier
        06.06.2019 19:09

        А в какой области вы работаете, если не секрет?


        1. GarfieldX
          07.06.2019 12:59

          Работал в области продаж компьютерной техники (была такая сеть Polaris), в области строительства (обработка и визуализация инфы со всяких датчиков в зоне ведения работ — графики, 2D, 3D), в области логистики, сейчас работаю над проектом федерального уровня (заказчик системы — государство).
          Ну и на всякий случай, чтобы «два раза не вставать», образование — «прикладная математика».


      1. 0xd34df00d
        06.06.2019 19:37

        зачем такое может понадобиться не представляю

        Ну самое простое — чисто функциональная очередь, например, с амортизированными константными вставками и удалениями.


        1. vassabi
          06.06.2019 19:47

          вот один раз было надо написать такое, плюс чтобы одновременно было несколько писателей (и чтобы при этом не лочить всю очередь).
          Но действительно, нечасто и в весьма низкоуровневом коде…


    1. grinCo
      06.06.2019 18:59
      +3

      Хм, кстати интересный вопрос: а много ли программистов, скажем от миддлов и выше, которые не знают как развернуть связный список?

      В СНГ процентов 99%.


      1. terrier
        06.06.2019 19:02

        В СНГ процентов 99%.

        Ну, выглядит как серьезное преувеличение.


        1. grinCo
          06.06.2019 19:33
          +1

          Отбросьте Яндекс и может еще пару компаний. В остальных без подготовки развернет список только случайный человек. Просто потому, что этого не спрашивают на собеседованиях, это не нужно в работе.


          1. Andrey_Dolg
            06.06.2019 19:35

            То есть это не нужно спрашивать?


            1. grinCo
              06.06.2019 20:15

              Я такого не говорил. Я как раз за алгоритмические вопросы, структуры данных и задачи на доске на собеседованиях.


              1. Andrey_Dolg
                06.06.2019 20:59

                Скользкий конечно момент нужно ли спрашивать то, что не будет нужно от кандидата. От того в каждом посте про алгоритмы сплошной холивар. Спор ли это на тему плоских или конусообразных кто знает.


          1. YemSalat
            07.06.2019 00:40

            Отбросьте Яндекс и может еще пару компаний. В остальных без подготовки развернет список только случайный человек.

            Чето вы загнули. Мнe кажется большинству разработчиков уровня middle и выше надо будет максимум немного подумать. Сама то задача тривиальная.


            1. Andrey_Dolg
              07.06.2019 15:53
              -1

              Подумать, плюнуть и дальше дебажить прод. =)


          1. terrier
            07.06.2019 01:00

            Отбросьте Яндекс и может еще пару компаний. В остальных без подготовки развернет список только случайный человек.

            Нет, это просто неправда. Вот только что опросил провел блиц-опрос коллег — никто сложности в этой задаче не видит. Не яндекс. Когда проводил собеседования, тоже значительная часть кандидатов с задачами такой сложности справляется. Понятно, что на собеседовании под стрессом даже синтаксис цикла может выпасть из головы, но ведь необязательно создавать такую атмосферу.


            1. knotri
              07.06.2019 12:27

              Когда проводил собеседования, тоже значительная часть кандидатов с задачами такой сложности справляется.

              Нет, ну если вы в свою компанию отбираете только ТЕХ КТО МОЖЕТ решить такие задачи — очевидно что и на вашем блиц-опросе они их тоже решат) Это ошибка вижившего


              1. YemSalat
                07.06.2019 12:32
                +1

                Что значит «отбираете только ТЕХ КТО МОЖЕТ решить такие задачи»? это по резюме можно как-то понять? Написали же что на собеседовании большинство справляется.


                1. knotri
                  07.06.2019 12:33

                  Цитирую человека выше


                  Когда проводил собеседования, тоже значительная часть кандидатов с задачами такой сложности справляется.

                  То есть это выглядит так
                  2018 год — проводит собеседования, спрашивает алгоритмические задачи, берет на работу тех кто умеет их решать
                  2019 год — проводит блиц-опрос, и о ЧУДО! Люди в его компании умеют решать алгоритмические задачи


                  1. YemSalat
                    07.06.2019 13:25

                    Когда проводил собеседования, тоже значительная часть кандидатов с задачами такой сложности справляется.

                    Значительная часть (большинство) — справляется НА собеседовании, а не после него. Т.е. большинство разработчиков с улицы с этой задачей справляется.
                    В вашей компании не так? Повод задуматься.


                    1. knotri
                      07.06.2019 13:35

                      Вы правы, я не так прочитал.


                      Но все же в свою зашиту


                      это по резюме можно как-то понять?

                      Таки можно, по наличию строк "знаю алгоритмы/структуры данных", либо по наличию профильного выш образования


                      1. YemSalat
                        07.06.2019 14:48

                        Спасибо что не стали дальше спорить.
                        Но все же :) У меня ни того ни другого в резюме нету, но список я вам разверну «с закрытыми глазами»


    1. lair
      06.06.2019 19:10
      +6

      Я не знаю. Наверное, если сколько-то минут подумаю, то напишу, и скорее всего, даже будет работать правильно. Но не знаю.


      C#, Python, "кровавый энтерпрайз".


      1. terrier
        06.06.2019 19:14

        Но не знаю.

        Ну, да, вы верно подметили разницу — педантичнее было бы сформулировать «не знают и не придумают в течение минуты-другой».


        1. lair
          06.06.2019 19:16
          +2

          Просто для тех, кто придумывает, немедленно есть следующий вопрос: а как быть уверенным, что оно правильно. Я вот, пока вы писали ответ, придумал в голове некое решение. Сейчас-то я могу, не знаю, сесть и загнать его в ближайший интерпретатор и посмотреть, где я ошибся. Но на собеседовании я этого не смогу сделать, а в описании придумываемого алгоритма собеседующему намного проще найти дырки.


          Я как-то раз на собеседовании так решал задачу "сделайте дистинкт по списку" — тоже навзлет не помнил, поэтому последовательно улучшал предыдущее решение. Собеседнику не понравилось.


          1. Andrey_Dolg
            06.06.2019 19:24

            Думаю хорошо, что вы туда не попали. =)


          1. terrier
            06.06.2019 19:41

            «Как бы вы протестировали свое решение?» тоже нередко спрашивают. Но понятно, что это скорее некая имитация доказательства и решения инженерной задачи в принципе


            1. lair
              06.06.2019 21:14
              +1

              Но понятно, что это скорее некая имитация доказательства и решения инженерной задачи в принципе

              Не лучше ли в этом случае давать инженерную задачу, а не академическую?


            1. vassabi
              06.06.2019 22:29
              +1

              не обязательно. Можно сделать второй алгоритм, который будет медленный и неэффективный, зато простой и очевидный, которым и проверять


              1. AllexIn
                07.06.2019 16:16

                Тесты так не хорошо делать же. Вы умножаете вероятность ошибки.
                Тест отдает фиксированные данные, получает результат и сравнивает с тем, что должно получиться.


          1. 0xd34df00d
            06.06.2019 19:56
            +2

            Просто для тех, кто придумывает, немедленно есть следующий вопрос: а как быть уверенным, что оно правильно.

            Конечно же, доказать теорему!


            Правда, какие характерные теоремы можно придумать для такой операции, как обращение списка, не очень понятно. Наверное, достаточно ограничиться


            reverseFold : (xs : List a) ->
                          (f : b -> a -> b) ->
                          (init : b) ->
                          foldl f init xs = foldr (flip f) init (reverse xs)


            1. 0xd34df00d
              06.06.2019 22:04
              +1

              Дошли руки поиграться. Как-то так, да:


              %default total
              
              myReverse : List a -> List a
              myReverse [] = []
              myReverse (x :: xs) = myReverse xs ++ [x]
              
              foldrLemma : (f : a -> b -> b) ->
                           (z : a) ->
                           (init : b) ->
                           (lst : List a) ->
                           foldr f (f z init) lst = foldr f init (lst ++ [z])
              foldrLemma f z init [] = Refl
              foldrLemma f z init (x :: xs) = cong $ foldrLemma f z init xs
              
              reverseFold : (xs : List a) ->
                            (f : a -> b -> b) ->
                            (init : b) ->
                            foldl (flip f) init xs = foldr f init (myReverse xs)
              reverseFold [] f init = Refl
              reverseFold (x :: xs) f init = rewrite reverseFold xs f (f x init)
                                             in foldrLemma f x init (myReverse xs)

              Ожидаем реакцию интервьювера.


            1. SanQri
              07.06.2019 08:40

              Про доказательство теоремы Кнут как-то сказал: «Обратите внимание, я доказал работоспособность кода, но еще не запускал его». Так что, увы, доказательство не дает полной уверенности, но его наличие это безусловно хорошо!


              1. mayorovp
                07.06.2019 09:53

                Но собеседующий тоже не сможет запустить код :-)


          1. gorodnev
            06.06.2019 20:13
            +1

            а как быть уверенным, что оно правильно.


            Конкретно в случае со связным списком нужно применить структурную индукцию. Но меня берут сомнения, что хоть где-то за пределами академической среды это нужно :)


            1. 0xd34df00d
              06.06.2019 20:22

              А какое утверждение вы будете доказывать структурной индукцией?


            1. lair
              06.06.2019 21:16

              … а поскольку структурную индукцию я тоже не знаю, мои шансы пройти собеседование уменьшились на следующий порядок.


              1. retran
                06.06.2019 22:44
                +1

                Достаточно потратить пару вечеров на доказывание классических алгоритмов на графах (которые всяко полезнее и применимее тех же сортировок, и доказывается через эту самую индукцию) и шансы резко повысятся.


                1. lair
                  06.06.2019 23:00

                  … и через год упадут обратно, потому что нигде, кроме как на собеседованиях, мне этот навык что-то не пригождается.


                  1. retran
                    06.06.2019 23:24

                    Ты переооцениваешь сложность навыка. Или ты про алгоритмы на графах?


                    1. lair
                      06.06.2019 23:25

                      Нет, я адекватно оцениваю свои способности к воспроизведению неиспользуемых навыков.


                      1. retran
                        06.06.2019 23:37

                        Я допускаю, что тебе это не нужно, но вообще это метод решения очень большого класса проблем (тот же квиксорт и динамическое программирование растут именно отсюда).


                        1. dididididi
                          07.06.2019 16:08

                          А зачем мне писать квиксорт, если он сто раз уже написан.


                          1. retran
                            07.06.2019 16:28
                            +2

                            Квиксорт писать не надо. А задач которые решаются аналогичными методами полно и вот их решать надо.


                1. GarfieldX
                  07.06.2019 14:07
                  +2

                  Вот заняться больше нечем, как пытаться ради собеса охватить всё что можно. Если захочу потратить свое личное время на свою же область (а такое желание всегда есть), то найдется куча более интересных задач, а не из класса доказательных, которые практической ценности не имеют.
                  Что же касается шансов, то найдется куча более адекватных контор, где не надо проходить 9 кругов ада ради самого процесса трудоустройства.
                  И, как написано по-соседству, такие знания, не подкрепляемые постоянной практикой, очень быстро превратятся в тыкву.


                  1. 0xd34df00d
                    07.06.2019 14:25

                    Это не ради собеса, уметь доказывать вещи полезно и так.


                    Впрочем, если вы можете решить задачи не из класса доказанных, то список вы уж точно доказанно обратите.


                  1. retran
                    07.06.2019 14:38

                    1. Это просто полезно, даже не для программирования.
                    2. Умение решать такие задачи открывает двери в места, где такие задачи решать нужно, можно и интересно. Не говоря уже о чисто материальных и репутационных плюшках.

                    Но если вам интересно в кровавом энтерпрайзе (в хорошем энтерпрайзе таких задач тоже много) или вебе (без иронии, я понимаю почему это может быть интереснее), то как бы да, выбор понятен.


          1. vassabi
            06.06.2019 22:31

            есть следующий вопрос: а как быть уверенным, что оно правильно.


            правильный реверс от половинок, собранных в обратном порядке должен совпадать с реверсом целого: rev(a+b) == rev(b) + rev(a). Эту проверку можно запустить простой рекурсией через весь список.


            1. lair
              06.06.2019 23:00

              Спасибо, вы только что привели еще одну вещь, которую я не знаю.


            1. 0xd34df00d
              07.06.2019 00:37

              rev lst = [], очевидно, удовлетворяет этому условию.


              Кстати, интересно, а достаточно ли reverse (reverse xs) = xs и reverse (xs ++ ys) = reverse ys ++ reverse xs? По идее, да, но строго доказывать это лень.


              1. mayorovp
                07.06.2019 09:55

                Нет, не достаточно, ведь реализация, которая меняет знак у каждого элемента, удовлетворяет вашим условиям.


                Правильные условия — reverse [x] = [x] и reverse (xs ++ ys) = reverse ys ++ reverse xs; они достаточны потому что исходя из них функцию можно построить конструктивно (кроме случая с пустым списком — он тоже однозначен, но найти его из этих условий можно только как решение уравнения)


                1. 0xd34df00d
                  07.06.2019 14:26

                  Нет, не достаточно, ведь реализация, которая меняет знак у каждого элемента, удовлетворяет вашим условиям.

                  Нет, parametricity не даст написать такую функцию.


                  1. mayorovp
                    09.06.2019 16:12

                    … но можно ошибиться с типами, и случайно написать функцию для разворота списка чисел :-)


              1. vassabi
                10.06.2019 12:16

                rev lst = [], очевидно, удовлетворяет этому условию.

                (в восхищении) вот это уровень!


          1. mayorovp
            07.06.2019 09:52

            а как быть уверенным, что оно правильно

            Если алгоритм циклический — то надо найти инвариант цикла. Дальше, как правило, всё очевидно.


          1. MacIn
            07.06.2019 19:30

            немедленно есть следующий вопрос: а как быть уверенным, что оно правильно

            Ну, чисто навскидку: мне никогда не приходилось разворачивать список в указанных терминах. Писал и пишу на С, Ассемблере, Object Pascal — это из самых низкоуровневых. Решение пришло секунд за 10, еще 20 ушло, чтобы записать его на листке.
            Поскольку алгоритм в каждый момент времени работает только с 3 элементами, можно считать, что если мы докажем правильность его работы чисто эмпирически на 3 элементах, то по индукции он будет работать верно и для 4..N. Здесь можно просто руками провести трассировку, указать конечное состояние тех или иных полей и переменных, а потом показать, что при таких значениях мы можем пройти от 3го элемента до 1го.


    1. Gumanoid
      06.06.2019 20:50

      Я представляю как это сделать в теории, но ни разу за 10 лет работы не приходилось такое писать. А когда 3 года назад на собеседовании меня попросили накодить это на бумажке, то я раз 10 ошибался и переписывал код.
      Программирую на C компиляторы, гипервизоры и т.п.


      1. terrier
        07.06.2019 00:53

        когда 3 года назад на собеседовании меня попросили накодить это на бумажке, то я раз 10 ошибался и переписывал код.

        Кодирование на бумажке под прессингом — это отдельный вид спорта, тут все понятно.


    1. AlexSky
      06.06.2019 22:41

      Эмбедер, сишник, лет 10 опыта. Связные списки использую, но что такое "развернуть" не знаю. Имеется в виду "сделать reverse"? Тогда это элементарно.


      1. terrier
        07.06.2019 00:51

        Тогда это элементарно.

        Ну, никто не говорит, что это сильно сложно.


    1. vladkorotnev
      07.06.2019 04:25

      До этой статьи как-то даже не задумывался. Пока читал, приостановился на пару секунд, задумался, прикинул, что самое простое — берём первый объект, меняем у него местами prev и next, дальше идём по ссылке prev, и повторяем, пока prev не окажется null.


      1. W3rtaS
        07.06.2019 09:27
        +1

        Список имеется в виду односвязный


    1. tonad
      07.06.2019 12:47
      -1

      как развернуть связный список?

      Java junior
      Слишком много неопределенности.
      Я как-то завалил тестовое, когда на требование отсортировать коллекцию, вызвал метод sort(), видимо если бы задача была в тестовом задании, я бы так же ее завалил. На вскидку в голове сразу несколько идей, например можно составить новый лист, запоминать последний и предпоследний элемент, и так проходить по списку пока последний не станет равным предпоследнему. А можно записать предпоследний в конец очереди, потом тот который перед ним, и т.д. Когда первый элемент будет записан в конец очереди, удалить все, до того, который был последним.

      Наверное можно еще как-то, эффективнее. Но суть в том, что если я реализую не тем способом, который собеседующий нашел в вики, скорее всего я завалю тестовое )


      1. murzilka
        07.06.2019 19:03

        Ради интереса погуглите как решается эта задача, и сравните сложность стандартного решения с вашими вариантами


        1. tonad
          10.06.2019 10:26

          Как я и говорил, я понял задачу не так, как остальные… то ли дело в неопытности то ли глупый )
          Я понял, как есть односвязный список и его надо развернуть. А типичные решения — реализация метода реверс, внутри односвязного списка, что собственно разные задачи. Реализацию ликнед листа, аррей листа и мап с основными методами, я писал в целях самообразования(и сравнивал реализацию с вики). Но ни разу не приходилось реализовывать их на работе, наверное, просто пока мало опыта )


    1. DatUser
      07.06.2019 13:07

      Думаю, у большинства людей есть фишки, которыми они регулярно пользуются, и эта информация всё время висит в оперативной памяти. Остальное сжато и лежит далеко в долговременной памяти, иногда сжатие происходит с потерями. Не представляю, чтобы на текущем уровне развития ЯП, библиотек и абстракций, кому-то постоянно приходилось реализовывать базовые алгоритмы. Не спорю, есть специфичные области, — это исключение, подтверждающее правило. Также, бывает полезно переписать базовый алгоритм в целях оптимизации, когда данный алгоритм используется в подавляющем объёме операций (как было здесь в статье 1С про то, как они переписывали базовый класс работы со строками).
      Поэтому, важно не то, знает ли человек конкретный базовый алгоритм, а знает ли о нём вообще. Поясню: в университете на письменных экзаменах нам разрешали использовать открыто любые источники, — лекции, учебники и т.д. Так как было важно, чтобы студент знал, какие есть методы и законы, где они применимы, и мог ими оперировать для достижения цели — решения задачи. Если он не знал инструментов, то поиск не сильно помогал.


    1. wladyspb
      07.06.2019 15:13

      php как основной профиль, sql, js как сопутствующие знания, ну и прочее связанное с вебом. Ещё какое-то количество языков на уровне «интересуюсь». Не умею правильно определять профессиональный уровень, но на мидла за несколько лет точно тяну. Как развернуть (одно?)связный список не знаю, по работе ни разу не приходилось сталкиваться с такой необходимостью, если потребуется — думаю что найду\придумаю решение. Ключевой момент — если.


    1. dididididi
      07.06.2019 16:00

      90% программистов, из тех что я встречал не смогут реверснуть связный список. Может даже 99%.
      Блджад, я за пять лет работы на жаве ни разу не использовал LinkedList.
      Все равно, что спросить, кто из имеющих права умеет шлифовать задиры на цилиндрах.


      1. staticmain
        07.06.2019 16:53
        +1

        Все равно, что спросить, кто из имеющих права умеет шлифовать задиры на цилиндрах.

        Скорее кто знает, что такое цилиндр.


  1. DrPass
    06.06.2019 17:34

    Например, вопрос «Определите, есть ли в связном списке цикл». Предполагается, что кандидат должен придумать решение типа «черепаха и заяц», опубликованное в обильно цитируемой научной статье 1967 года. Вы просите кандидата повторить научное исследование за 30 минут!

    Я бы добавил к элементам списка счетчик, который инкрементировал бы при проходе через элемент. Если бы при очередном проходе в счетчике уже была единица, то значит, цикл есть.
    И да, я никогда не решал подобную задачу, я не в курсе про ту научную статью, и даже поленился заходить по вашей ссылке. Этот алгоритм я придумал в течении минуты, как только прочел процитированный абзац.
    Пара вопросов:
    1. Такая ли уж это сложная задачка для кандидатов, или просто обычный индикатор, умеет человек логически рассуждать, или нет?
    2. Могу ли я ещё одну научную статью сделать из этой фигни?


    1. 0xd34df00d
      06.06.2019 17:50
      +1

      А если менять список нельзя?


      Но вообще да, мне лет в 17 попался этот же вопрос, и я придумал похожее на упомянутое в статье решение, но второй итератор каждый раз запускал с нуля — догадаться, что можно просто их с разной скоростью инкремент кровать, я не успел уже.


      1. DrPass
        06.06.2019 18:11

        А если менять список нельзя?

        Если нельзя, то хранить идентификаторы элементов, например, их адреса, в какой-то внешней структуре, и проверять, есть ли там такой же идентификатор. Сути не меняет, задачка совершенно рядовая, с какой стороны к ней не подойди.


        1. 0xd34df00d
          06.06.2019 18:24
          +1

          Ну вот, теперь ваше решение требует дополнительную память.


        1. Kyoki
          06.06.2019 18:30
          +2

          Как у вас все хорошо — хочу элементы меняю, хочу памяти себе… Помню когда мне первый раз задали эту задачу на собеседовании все было веселее: список большой, но конечный; элементы не менять; памяти хватает только вот элементов на 10 списка, куда там идентификаторы хранить…


          1. AlexSky
            06.06.2019 22:53
            +1

            Как выше написали, требовать изобрести академический алгоритм на собеседовании — верх идиотизма. Требовать его знание — тоже. Слишком уж оторванный от реальных задач пример.
            Нормальный подход — спросить и смотреть, как кандидат будет выпутываться. Если предложит решение с маркерами в списке, с доппамятью или с разрушение списка (использование ссылок как маркеров прохода), то уже норм.


            1. khim
              07.06.2019 14:29
              +3

              Извините, но это — пиздец. С такими рассуждениями окажется, что вообще ни про какие алгоритмы и ни про какие манипуляции с данными спрашивать нельзя.

              Потому что пузырьковая сортировка — тоже была описана в научной публикации. И даже какое-нибудь банальное решение квадратного уравнения — тоже было когда-то «высокой наукой». И даже отрицательные числа и ноль! Ноль — вообще «прорывом» был… столетия назад, да… ну а какая разница?

              Вот интересно: в какой момент знания перестали переходить из академической науки в практику и появилась вот эта реакция: полвека назад про это была научная статья — значит мне это «нинужна»?


              1. AlexSky
                07.06.2019 19:08

                Вы реально помните все алгоритмы, которые изучали 15 лет назад в институте, а потом ни разу не использовали? Прям вот все-все сможете вспомнить на собеседовании?


                1. khim
                  07.06.2019 20:40
                  +1

                  Нет, конечно. Какой-нибудь КМП — он простой (достаточно запомнить «ключевое слово» началоконец… которого, кстати, в википедии нет… хмм...), а вот уже БМ — тут уже напрягаться придётся, чтобы из глубин памяти его выудить… и то может быть с ошибкой.

                  Но в данном-то случае мы говорим об алгоритме, который в дюжину строк реализуется и легко визуализируется…


              1. AlexSky
                07.06.2019 19:15

                И вообще вы разговариваете с голосами в своей голове. Никто и не говорил о ненужности, говорили о том, что подобный алгоритм, который мало применим в реальной работе, человек может и не знать или не помнить, а изобрести заново на собеседовании нереально.


                1. khim
                  07.06.2019 20:48

                  Почему нереально? Потому что когда-то он был предметом изысканий? Ну так и сортировка «пузырьком» когда-то имела этот статус. Вот статья, где она обсуждается. Всё теперь? Пузырёт тоже «под запретом»?

                  Да, конечно, в природе есть экзотические структуры данных — типа каких-нибудь фибоначчиевых куч — но уж «зайца и черепаху» не знать?

                  Я, по неопытности, какое-то время на интервью использовал её для подсказок к другим задачам — и офигевал, когда кандидаты меня не понимали. Теперь привык.


                  1. adictive_max
                    10.06.2019 05:20

                    Да, конечно, в природе есть экзотические структуры данных — типа каких-нибудь фибоначчиевых куч — но уж «зайца и черепаху» не знать?
                    Вот представьте себе, я вроде и в универе на программиста учился, и 10 лет стажа, а про «зайца и черепаху» только из этой статьи впервые услышал. Наверное потому, что за эти 10 лет так ни разу и не возникла проблема «библиотечные функции слишком медленные».


                1. MacIn
                  07.06.2019 23:27
                  +2

                  а изобрести заново на собеседовании нереально

                  Это, честно говоря, не очень смешной троллинг.
                  Извините, если написали это всерьез. Это напоминает мне шутливый ответ Скотта Адамса (карикатуриста, автора Дилберта) на вопрос «Скажите, как вам приходят такие классные идеи?» — «Что можно сказать — я просто сижу и придумываю. Если вам не приходят в голову идеи, то вам крышка». Здесь то же самое — если человек всерьез считает нереальным на собеседовании создание такого простого алгоритма — то ему крышка.


          1. klvov
            06.06.2019 23:19

            Хм, подумал минут 20, ниасилил и полез в вики, где написано, что проще всего Tortoise and Hare algorithm. Но и после вики неочевидно, почему алгоритм будет корректен, если запускать его с множителем *2. А что будет, если запустить его с другим множителем, *3, *4, или там 2^n? Тут уже какая-то математика начинается.


            1. mayorovp
              07.06.2019 10:01

              Да там любой множитель подойдет если он больше 1, даже с иррациональным можно извратиться :-).


              Весь смысл — в том, что если цикл есть, то после того как Черепаха дойдет до цикла — Заяц уже никак не сможет миновать её. Увеличение множителя ускорит завершающую фазу алгоритма (обход цикла), но замедлит начальную (пока Черепаха до цикла не дошла, любые передвижения Зайца — лишь напрасная трата времени).


              1. klvov
                07.06.2019 15:24

                Хм, да, спасибо. Теперь увидел, как это работает: допустим черепаха дошла до цикла, а цикл можно представить в виде кольца, или часового циферблата. И можно представить, что черепаха сидит на 0 часов, а заяц — на час дня. Расстояние от черепахи до зайца по часовой стрелке — 1 деление. На следующем шаге черепаха переползает на 1 час, а заяц прыгает на 3 часа, и расстояние от черепахи до зайца увеличивается на 1 деление. Но это значит, что расстояние от зайца до черепахи (по часовой стрелке) уменьшается на 1 деление, и поэтому рано или поздно он ее догонит.

                Но прям сразу это было неочевидно, и я думал, возможна или невозможна ситуация, когда они будут ходить по циклу и никогда не пересекутся.


                1. TheGodfather
                  08.06.2019 08:44
                  +1

                  Чтобы не было «никогда не пересекутся» и выбираются взаимно простые числа. Не обязательно 1 и 2, можно хоть 3 и 7 :)


                  1. khim
                    08.06.2019 13:39

                    Жуть какая. Но нет. Можно и 2 и 4 взять или даже 1000 и 2000 — это ж без разницы. Просто кода будет больше при той же эффективности.


                    1. TheGodfather
                      08.06.2019 14:00
                      +1

                      И правда, если заяц с черепахой начинают с одного элемента, то взаимной простоты не требуется.
                      Я, видимо, имел в виду, что в общем случае, если черепаха и заяц стартуют с разных элементов списка (по какой-то странной причине), то вот тут взаимная простота необходима, иначе они легко могут никогда не пересечься. Простейший пример — список из четырех элементов, черепаха прыгает через один (шаг 2), заяц прыгает через три (шаг 4). Заяц будет прыгать на месте, черепаха между двумя элементами. И если заяц начинал не в четном элементе, то они никогда не пересекутся.


                      1. khim
                        08.06.2019 17:06
                        +2

                        Простейший пример — список из четырех элементов, черепаха прыгает через один (шаг 2), заяц прыгает через три (шаг 4). Заяц будет прыгать на месте, черепаха между двумя элементами. И если заяц начинал не в четном элементе, то они никогда не пересекутся.
                        А! Если заяц именно прыгает — тогда да… Но, вообще говоря, ему всё равно нужно каждый элемент проверять (иначе он «умрёт» на списке, где нет цикла, напоровшись на Null), можно и смотреть есть тут черепаха… это недолго по сравнению к обращениям в память.


          1. wladyspb
            07.06.2019 15:26
            -3

            Создаём счётчик, обходим список(хоть по одному элементу в память за раз, некритично — но это по идее даст нам место в памяти для хранения счётчика), на каждой итерации инкрементим счётчик, если в определённый момент счётчик превысил кол-во элементов в списке — значит есть цикл.


            1. Kyoki
              07.06.2019 15:42
              +2

              Только кто бы количество элементов подсчитал бы…


              1. wladyspb
                07.06.2019 15:52
                -6

                Опять усложнение условий задачи) Эх, полное ТЗ бы увидеть, а не очередные комментарии по мере выкатывания версий… Сори, наболевшее.

                Посмотрел оригинальный алгоритм с зайцем и черепахой — изящное решение)


                1. Kyoki
                  07.06.2019 15:55
                  +2

                  Так вон выше полное ТЗ. Все, что дано, написано. Естественно, никто размер/хеши/статистики/… не считал, оракула тоже нет.


    1. samhuawey
      06.06.2019 17:55

      Добавление поля к каждому элементу списка для решения задачи, подразумевающей read-only доступ к данным это оверкилл. Я бы завёл отсортированный список пройденных указателей (если нельзя пользоваться стандартными коллекциями) или сет (если можно). Если список двусвязный — ещё проще. Скакнул назад, если элемент не тот, значит петля.


      1. evkochurov
        06.06.2019 19:06
        +2

        Оверкилл, говорите? Ваше решение будет медленнее и не лучше по расходу памяти, чем у DrPass — ему нужно получить разрешение иметь всего один бит в каждом элементе списка под свои нужды (позволят ли это условия задачи — другой вопрос), а вам — целый указатель в отдельной структуре, которую надо еще поддерживать в отсортированном виде и в которой совершать поиск на каждом шаге обхода списка.


    1. evkochurov
      06.06.2019 18:40

      1. Кому-то сложная, кому-то нет. Решать ее можно по-разному и ход мысли в процессе решения позволит что-то узнать о способностях кандидата. Но я согласен с автором — решение этой задачи мало что покажет об уровне владения языком, если это не С/С++.
      2. Тут вы и по времени, и по дополнительной памяти имеете линейную сложность, а в статье время линейное, а доп.память — константа. Так что новую статью, наверное, нет смысла делать.

      То, что вы придумали — это еще хороший алгоритм. Кандидат запросто может предложить линейную память и квадратичное время: хранить список указателей на пройденные вершины и на каждом шаге проверять текущую вершину на вхождение в список.


      1. samhuawey
        07.06.2019 10:46

        Если список вершин отсортированный время логарифмично. А вставка новой вершины в отсортированный список не займёт много времени.


        1. evkochurov
          07.06.2019 14:14

          Вы не учитываете, что это надо делать на каждом шаге, т.е. время не logN, а N*logN.


        1. evkochurov
          08.06.2019 16:55

          И еще: даже в отсортированном списке поиск по-прежнему линейный. Потому что если вы на любом шаге поиска можете прыгнуть сразу в желаемое место, то это уже не список, а какая-то другая структура данных. Например, дерево или массив. Но там вставка элемента в середину — отнюдь не такая тривиальная операция, как в списке.


          1. MacIn
            08.06.2019 21:38

            Есть еще комбинированные структуры данных, скажем, массив указателей на списки. Тогда поиск производится по массиву дихотомией, далее по списку — линейно. Вставка — О(1), плюс балансировка иногда.


            1. playermet
              09.06.2019 10:16

              Балансировка будет перекрывать дешевизну вставки. По сути, описанная структура в зависимости от настройки глубины списков имеет два краевых случая — обычный массив (глубина = 1), и обычный связный список (глубина = общее число элементов). Приближая асимптотику в сторону одного мы одновременно будем отдалять асимптотику от другого, это как закон сохранения энергии.


              1. MacIn
                09.06.2019 18:50

                Нет, не должна перекрывать. Балансировка — это не балансировка дерева, я не совсем верно выразился. Просто банально вы делите список пополам, когда он достигает длины N (а длина хранится в заголовке). Это разовая операция; да, вам придется пройти пол-списка, но это все равно лучше, чем проходить весь список при каждом поиске.

                Приближая асимптотику в сторону одного мы одновременно будем отдалять асимптотику от другого,

                Это понятно для худших случаев. Но в среднем у нас поиск будет лучше, чем для списка, а вставка — лучше, чем для массива.

                Мы можем использовать массив с указателями на массивы разных длин, а не списков — тут можно еще поиграться. Список массивов — не суть. Кроме того, заданные длины списков/подмассивов могут быть разными. Скажем, для динамического массива самое болезненное — вставка в начало, значит, мы можем настроить длины списков так, чтобы сначала они были длиннее. Скажем, первый блок — половина общей длины, потом по принципу дихотомии.
                Да, VList — пример такой структуры:

                www.wisdomjobs.com/e-university/data-structures-tutorial-290/vlist-7159.html

                infoscience.epfl.ch/record/52465/files/IC_TECH_REPORT_200244.pdf
                Раздел 2.


    1. MechanicZelenyy
      06.06.2019 22:05

      Вы добавляете гигантский (по меркам 1967 года) оверхед на список, это все равно что предложить считать Фибоначчи с помощью рекурсии без кэширования и прочих улучшений.


      1. khim
        07.06.2019 14:31

        Ого. Считать Фибоначи «в лоб» — это линейный (на самом деле нет) алгоритм в экспоненту превратить. А тут — всего лишь увеличение памяти (нехилое, впрочем).


  1. izobr
    06.06.2019 18:03
    +2

    Я бы ещё здесь добавил к связным спискам алгоритмы сортировки. Много кто их спрашивает, но за 10+ лет опыта мне не понадобилось ни разу писать свою сортировку.


    1. retran
      06.06.2019 19:23
      +2

      Изучение алгоритмов сортировки крайне полезно для того чтобы научиться строить и анализировать свои алгоритмы. Вот только здесь та же ситуация, что описана в статье. Многие уже забыли зачем на самом деле спрашивают про сортировки.


      1. VolCh
        06.06.2019 19:53
        +1

        Изучение и знание — разные вещи.


        1. retran
          06.06.2019 20:01
          +3

          Если вы понимаете как строятся divide&conquer-алгоритмы и рекурсию, то какой-нибудь quicksort вы выведете на бумажке за несколько минут.

          Если вы вызубрили quicksort, но не понимаете как он устроен и почему — толку от таких знаний нет.


          1. lair
            06.06.2019 21:17
            +1

            Если вы понимаете как строятся divide&conquer-алгоритмы и рекурсию, то какой-нибудь quicksort вы выведете на бумажке за несколько минут.

            Я бы сказал, "какой-нибудь алгоритм сортировки". Потому что мне до сих пор merge sort дается намного легче.


            1. khim
              07.06.2019 14:33
              -4

              В каком месте Marge sort — это divide&conquer???


              1. retran
                07.06.2019 14:41
                +1

                Во всех. В википедии в первом же абзаце четко классифицировано.


              1. lair
                07.06.2019 14:44
                +1

                Я так понял из стенфордского курса по дизайну и анализу алгоритмов. А почему, собственно, нет?


                1. khim
                  07.06.2019 15:14
                  -4

                  Потому что обычно алгоритмы divide&conquer они, как бы, эта… ммм… о!

                  Важная парадигма разработки алгоритмов, заключающаяся в рекурсивном разбиении решаемой задачи на две или более подзадачи того же типа, но меньшего размера, и комбинировании их решений для получения ответа к исходной задаче.

                  Ничего этого в merge sort нету — ну по крайней мере у меня в голове, в «merge sort на 4 лентах» нету. Есть маленькие «капельки» отсортированных данных, которые, после каждого прохода, удваиваются в объёмах, растут… а в конце получается одна большая «суперкапля» — и все данные отсортированы.

                  Но да, в принциме, если смотреть на него как на алгоритм типа «разделяй и властвуй» тоже можно… и даже Wikipedia такой вариант как канонический приводит… буду знать теперь — хотя мне всё равно кажется, что моё понимание более правильное: в реальном STL используется как раз описанный мною подход… только что проверит.


                  1. lair
                    07.06.2019 15:17
                    +2

                    Ничего этого в merge sort нету — ну по крайней мере у меня в голове, в «merge sort на 4 лентах» нету.

                    Есть у меня подозрение, что у вас в голове совсем не тот merge sort, который у меня. Потому что тот, который у меня, это "подели входные данные пополам, каждую половину отсортируй, результаты слей поэлементно". И по вашему определению это D&C.


                    1. khim
                      07.06.2019 15:34
                      -3

                      Есть у меня подозрение, что у вас в голове совсем не тот merge sort, который у меня.
                      Похоже на то. У меня в голове, как я уже сказал, алгоритм «с четырьмя лентами» и фиксированным объёмом оперативной памяти. Чего-то «делить» тут не получится: памяти-то нет!

                      Потому что тот, который у меня, это «подели входные данные пополам, каждую половину отсортируй, результаты слей поэлементно». И по вашему определению это D&C.
                      Да, такой алгоритм как раз Wikipedia и описывает. Но это не тот алгоритм, который придумал Кнут (хотя у него их там много разных, может и такой есть) и не тот алгоритм, который в реальных библиотеках используется.


                      1. lair
                        07.06.2019 15:37

                        А я вроде и не говорил, что мне легко дается то, что придумал Кнут. Есть алгоритм, который мне под этим названием рассказали в курсе, я его и помню. И если понадобится придумывать сортировку, он будет первым, который придет в голову.


                  1. mayorovp
                    09.06.2019 15:04

                    Рекурсивное разбиение задачи на подзадачи вовсе не означает, что алгоритм в итоге получается тоже рекурсивный.


              1. wataru
                07.06.2019 14:46
                +1

                А что он тогда по вашему?


                1. khim
                  07.06.2019 15:06
                  -2

                  Ну merge — он merge и есть. Там не про деление, там про синтез. Но перед авторитетом википедии я, пожалуй, склонюсь: если это — тоже называется «divide&conquer»… ну Ok, пусть будет так.


                  1. wataru
                    07.06.2019 15:16
                    +1

                    Ну, как бы, что бы merge'ить что-то, надо это что-то иметь. Получить его как раз разделением и можно. Слияние — это conquer часть.


                    1. khim
                      07.06.2019 15:30
                      -1

                      У нас же есть отдельные элементы? Значит есть N уже отсортированных отрезков (отрезок из одного элемента отсортирован всегда, по определению). Зачем тут что-то делить? Всё уже поделено до нас!


                      1. wataru
                        07.06.2019 15:35

                        Это получается поредельный случай деления — сразу на N частей =)


                        На самом деле, тут просто совпало, что можно так по частям сливать от 1 элемента и в итоге получить сложность за n log n.


                        Потому что можно, например, сливать всегда первые 2 отсортированых списка, что будет n^2.


                        Но если же сливать 2 самых маленьких всегда, то получается именно схема разделить на 2 части и слить, только развернутая.


                        1. khim
                          07.06.2019 15:51

                          Ну это всё правда, но не нужно забывать, что «Tape is Dead, Disk is Tape, Flash is Disk, RAM Locality is King».

                          Я как-то сразу про ленты вспоминаю, если речь идёт о merge sort. Ибо «RAM Locality is King» — все остальные алгоритмы плохо дружат с реальной памятью (особенно Heap Sort). Если же мы начинаем «сортировать на месте», то тут, понятно, уже нужно, чтобы данные влазили в кеш (иначе чего мы мучаемся), а там уже другие алгоритмы рулят…


          1. VolCh
            06.06.2019 21:31
            +2

            Я к тому, что 20+ лет изучал в вузе, причём не чтобы просто сдать зачёт, но напишу или расскажу разве что пузырёк. Ассемблер 8080, наверное, лучше помню.


            1. 0xd34df00d
              06.06.2019 22:06

              Ну это зависит от стиля. Я при рассказе о пузырьке буду нервничать сильно больше. Там условия останова какие-то чуть менее очевидные, все дела.


              1. retran
                06.06.2019 22:36

                Вот соглашусь. Квиксорт я могу воспроизвести не задумываясь (потому что общая идея описывается одним предложением), а пузырек надо вспоминать с бумажкой.


                1. wataru
                  07.06.2019 12:25

                  Вы про квиксорт, который сортирует на месте в массиве? С разбиением по ведущему элементу? Там не так тривиально это разбиение делается — легко накосячить.


                  1. retran
                    07.06.2019 12:37
                    +1

                    Нет, конечно не на месте в массиве. Для него немного подумаю с бумажкой и рисунками.


          1. vassabi
            06.06.2019 22:49

            вопрос только — насколько они будут эффективны.
            Я вот могу и пузырек и квиксорт и слияние и поразрядную. Но в продакшене я скорее всего буду использовать что-то штатно-библиотечное, чтобы потом коллеги не размышляли что это такое и почему.
            Пару раз только пришлось писать свои варианты. И то, в одном случае — потому что учет специфики данных позволял ускорить работу сортировки на два порядка (и даже больше), а в другом — нужна была специфическая устойчивость сортировки.


      1. maxzh83
        06.06.2019 22:02

        Многие уже забыли зачем на самом деле спрашивают про сортировки.

        Хуже, что большинство просто зубрит. И в какой-то момент это стало нормой и тот, кто не вызубрил уже выглядит как разработчик второго сорта. Можно, конечно, попытаться придумать в процессе собеседования что-то, но в условиях нервяка выглядеть это будет менее вразумительно, чем заученный ответ.
        Самое обидное, что потом кандидат на месте работы ни разу не пользуется плодами своей зубрежки, а использует сортировку из коробки на SQL или Java (и это еще хорошо).
        Короче, впечатление от вопросов про сортировку примерно такое же как от вопросов Гугла (почему люки круглые, сколько будет стоить помыть все окна и т.д.). Там тоже про умение мыслить и все такое, но сейчас от них отказались.


      1. samhuawey
        07.06.2019 10:51

        Необязательно спрашивать про саму сортировку, а вот про thread-safe алгоритмы и возможность распаралеливания было бы интересно послушать, заодно и смежные вопросы затрагиваются, можно будет понять как кандидат владеет инструментарием. Опять таки можно попросить отквалифицировать разные алгоритмы, в чём плюсы и минусы, какие хороши в теории, а какие — на практике. Даже если банально клиент передаёт в функцию сравнения копии объектов вместо ссылок, уже можно судить об уровне мастерства. А если забывает пометить в контракте объекты как const — об уровне пофигизма. В общем, задача простая, но позволяет многое узнать о кандидате.


        1. GarfieldX
          07.06.2019 17:11

          Самое забавное, когда на собесе спрашивают про всякие умные вещи, а потом видишь боевой код, то остается только удивляться из разряда «и эти люди запрещают мне ковыряться в носу». Причем писать дальше придется в таком же стиле.


          1. samhuawey
            07.06.2019 17:51
            -1

            Что вы хотите от кровавого энтерпрайза? Сам наблюдал как команда с матюками
            за неделю до релиза переписывала полугодовой код восточноазиатских программистов, которых наняли для разнообразия (по английски — tolerance).


            1. wataru
              07.06.2019 20:05

              Diversity же! Рядом еще есть магическое слово inclusion.


  1. Zuy
    06.06.2019 22:02
    +2

    За 15 лет работы в embedded списки нужны были только один раз. Деревья и графы вообще никогда. Писал драйверы под Linux и Windows, модули под Android, электронику для автомобилей и сейчас занимаюсь DC зарядом. Что вы там все в вебах такое пишете, что вас на интервью об этом спрашивают? Вот смотрю я на сайт Хабра, и что тут какие-то алгоритмы надо знать, чтобы его сделать?

    Мне кажется умение написать алгоритмы на память нужно спрашивать на позиции, где есть хоть какая-то вероятность, что их придется реализовывать с нуля. Если алгоритмы только используются, то должно быть достаточно, чтобы кандидат знал их особенности и как выбрать правильный. Детали реализации можно и в книге/гугле глянуть.

    Я уверен, что любой свежий выпускник CS специальности, с нормальным баллом, заткнет за пояс по алгоритмам большинство специалистов с богатым опытом разработки. Для кандидатов на разные позиции и с разным опытом вопросы должны быть разные.

    На своих собеседованиях я стал давать задичи с описанием логики решения, мне больше интересует, чтобы кандидат показал как он пользуется языком, чтобы реализовать логику. Если человек умеет ли человек написать quick sort из головы, скорее всего он просто впустую потратил время, чтобы его зазубрить прямо перед собеседованием.

    PS: Список развернуть смогу :-)


    1. AlexSky
      06.06.2019 23:03
      +1

      Поддерживаю. Тоже эмбедер, списки и деревья приходилось использовать чуть больше, но все же редко. И да, после института я бы смотрелся на собеседовании в вопросах алгоритмов гораздо лучше, чем сейчас. Только на свой код того времени я без слез смотреть не могу.


    1. retran
      07.06.2019 01:50

      Я никогда не зубрил сортировки, но могу написать квиксорт из головы. ЧЯДНТ?


      1. Zuy
        07.06.2019 02:00

        Это точно мне вопрос? Вы наверно лучше меня знаете, а я так понятия не имею, что вы делаете так или не так.


        Раньше перед каждым собеседованием просматривал и освежал в памяти эти сортировки. В итоге никто никогда не просил их писать и на работе никогда не требовалось. И сейчас я сходу и не вспомню всю суть квиксорта.


    1. istttore
      07.06.2019 07:07

      Полностью согласен, сейчас практически на все вопросы есть ответы и изобретать велосипед в большинстве случаев не приходится. Исключением является заказчик, который хочет не так как у всех и то это может быть реализовано как у всех, но выглядеть по-другому. И тоже считаю что должно быть понимание самого языка, как ним оперировать, так сказать алгоритмы действий и если это у претендента есть, то все остальное можно познать из любых других источников.


    1. khim
      07.06.2019 16:59

      Если алгоритмы только используются, то должно быть достаточно, чтобы кандидат знал их особенности и как выбрать правильный.
      А как вот это вот работает? Вы зазубриваете все особенности всех алгоритмов? Там перепутаете же рано или поздно.

      Даже если вы человек долждя и можете запоминать миллионы фактов и никогда их не путать — то как с вами работать? Вы ж будете их предъявлять, когда вас о чём-то спросят — а объяснить не сумеете. И? Что дальше? Всю вашу работу перепроверять? Так проще самому всё сделать.

      Для кандидатов на разные позиции и с разным опытом вопросы должны быть разные.
      Разумеется.

      Я уверен, что любой свежий выпускник CS специальности, с нормальным баллом, заткнет за пояс по алгоритмам большинство специалистов с богатым опытом разработки.
      Конечно. Потому им — задаются другие вопросы и оцениваются другие навыки.

      «Развернуть список» — это лёгкая разминочная задачка, показывающая что человек, руководящий разработкой, ешё в состоянии три указателя у себя в голове не перепутать и один цикл написать.

      Не знаю чего к ней так придрались.

      PS: Список развернуть смогу :-)
      А скопировать список с дополнительными связями? 100% практическая задача, между прочим. JIT-компилятор: превращаем байткод в последовательность инструкций, где каждая команда ссылается на следующую… но некоторые могут ссылаться куда-то ещё (ветвления, да). Вот как эту структуру скопировать? Без дополнительной памяти, пжлста.


      1. Zuy
        07.06.2019 18:00

        Вы даже не знаете в чем моя работа заключается, а уже вам проще ее самому сделать. Если что, то мы всегда ищем «exceptional talents» :-).
        А работать вообще очень просто. Есть задача, собрались, обсудили детали, разбили на тикеты. Назначили иполнителей. Если нужно использовать какие-то алгоритмы, отдельно обсудили, что именно важно. Далее идет имплементация, ревью и валидация. Тут и важно, чтобы человек знал особенности, и если ему нужна сортировка то выбрал ту, которая лучше подходит в условиях конкретной задачи.

        Придрались не к самой задачке. Вопрос с тоит в плоскости, что важнее на собеседовании, то как человек логику решения изобретает или как он реализует ее. Эта задача не совсем показательна, там логика тривиальная. А вот часто спрашивают на собеседованиях, как найти, что список в цикле и разорвать его. Даже в статье написано, что решение было опубликованно в научной работе очень давно. Понятно же, что все, кто изображает умственные муки и потом рожает это решение прямо на собеседовании показывают только актерское мастерство. Я сразу людям говорю, что делается это через два указателя и прошу написать имплементацию. Все это именно, чтобы проверить, что человек знает, как указателями оперировать.

        Т.к. в вашей задаче входных условий мало, то я решаю ее исходя из того что есть. Отсутствующие условия трактую в свою пользу.
        Я решил, что данные у нас лежат компактно в выделенной для них области памяти. Достаточно определить их границы, и перепрограммировать контроллер виртуальных страниц, чтобы он отобразил эти же данные в другую область памяти. Если планируется скопированные данные менять, то пометим страницы, как Copy On Write.
        Все, задача решена и заметьте сложность O(1). Затрат дополнительной памяти ноль. Более того, мое решение так же работает при копировании между процессами.


        1. khim
          07.06.2019 19:15
          +1

          Вы даже не знаете в чем моя работа заключается, а уже вам проще ее самому сделать.
          А зачем мне знать в чём заключается ваша работа? Я ж не беру вас на работу, чтобы вы решали задачи, которые вам понравятся. Мне нужно решить какие-то мои задачи, про которые, очевидно, я знаю лучше вас…

          Если нужно использовать какие-то алгоритмы, отдельно обсудили, что именно важно.
          Что значит «если нужно использовать какие-то алгоритмы»? Какую вообще программу можно написать без использования алгоритма? Упомянутые тут вот две строчки — это уже алгоритм (прочём плохой). Если вы на каждые две строчки совещание собираете… то я даже представить себе боюсь что вы такое разрабатываете, что можете себе это позволить…

          Тут и важно, чтобы человек знал особенности, и если ему нужна сортировка то выбрал ту, которая лучше подходит в условиях конкретной задачи.
          В этот момент — уже поздно. Хотя бы потому что важные решения явно уже были приняты до того. Например можно было использовать tree set и иметь данные всегда отсортированными. А может быть priority queue, если отсортированность данных не нужно, но элементы нужно «вынимать» и обрабатывать по одному. А может и вообще — нам ничего не интересно, потому что элементов будет 3-5 штук и нам вообще неважно когда их сортировать.

          Когда вы дошли до валидации — уже поздно что-то обсуждать.

          Понятно же, что все, кто изображает умственные муки и потом рожает это решение прямо на собеседовании показывают только актерское мастерство.
          Если дать какие-то подсказки — то не обязательно.

          Я сразу людям говорю, что делается это через два указателя и прошу написать имплементацию. Все это именно, чтобы проверить, что человек знает, как указателями оперировать.
          Далеко не все готовы реализовывать алгоритм, о котором они никакого понятия не имеют. Вот после подобного озарения — дело другое.

          Т.к. в вашей задаче входных условий мало, то я решаю ее исходя из того что есть. Отсутствующие условия трактую в свою пользу.
          Принято. Я буду исходить из того, что вы ответили так же, как и на собеседовании.

          Я решил, что данные у нас лежат компактно в выделенной для них области памяти. Достаточно определить их границы, и перепрограммировать контроллер виртуальных страниц, чтобы он отобразил эти же данные в другую область памяти. Если планируется скопированные данные менять, то пометим страницы, как Copy On Write.
          Все, задача решена и заметьте сложность O(1). Затрат дополнительной памяти ноль. Более того, мое решение так же работает при копировании между процессами.
          Гениально! Вот действительно очень клёво. Я порадовался. А теперь посмотрим на всем известные критерии.

          Толковый? Несомненно: набор знаний налицо. Доводит дело до конца? Категорически нет. Применил все свои знания ради того, чтобы уклониться от решения задачи. Типичный пример человека, который «просиживает ученую степень в больших компаниях, где их никто не слушает из-за их полной непрактичности». Вывод: не брать. Ни на какую должность и ни при каких условиях.

          Вот видите: одна простенькая задача даёт более, чем достаточно данных для того, чтобы оценить человека — хотя, возможно, совсем не в той области, о которой хотели говорить изначально.

          P.S. И да, я знаю историю про Нильса Бора. Иногда людям действительно хочется постебаться и они готовы поставить свою судьбу на кон… но как по мне — лучше пропустить одного Бора, чем набрать кучу идиотов. Бор и без вас как-нибудь пробъётся, а вам с набранными идиотами придётся работать…


          1. Zuy
            07.06.2019 20:06

            Я думаю мы все тут отлично понимаем, что значит «использовать какие-то алгоритмы». И не нужно за меня придумывать, что мы на две строчки собираем совещание. Я написал выше, что по результатам обсуждения задача разбиывается на тикеты и назначаются исполнители. По-моему можно представить уровень задач, когда это нужно.

            Никогда не поздно что-то обсуждать. Не важно это ревью или валидация, если выявляется какой-то фактор, который был не учтен, логика должна быть скорректирована. Я не делаю веб или десктоп приложений, у нас safety critical решения. Мы сертифицируемся и проходим код ревью на безопастность для людей. Не может быть такого, что что-то поздно поменять. Количество необходимых изменений в случае проблемы достигается грамотным проектированием решения.

            Далеко не все готовы реализовывать алгоритм, о котором они никакого понятия не имеют. Вот после подобного озарения — дело другое

            Я же про это и пишу, мне нужны люди которые способны написать имплементацию получив описание алгоритма. Не нужно его придумывать или помнить все наизусть. Не разу не слышал про возможное решение, подойди и спроси, только не надо велосипедить.

            Принято. Я буду исходить из того, что вы ответили так же, как и на собеседовании.

            Вы даже не представляете, что я говорил на собеседованиях. Важно понимать, что нужно людям. А нужно им тоже самое, что и мне, когда я нанимаю. Нужен специалист, способный решать проблемы и делать «delivery» (извените не знаю, как по русски это правильно). Выбор алгоритмов по пути, конечно важно, но далеко не первично.


            1. khim
              07.06.2019 20:56

              Я написал выше, что по результатам обсуждения задача разбиывается на тикеты и назначаются исполнители. По-моему можно представить уровень задач, когда это нужно.
              Нет, нельзя. Потому я, в разных компаниях, видел как ситуацию, когда целые компоненты, которые нужно месяца два-три писать, создавались без «разбиения на тикеты», так и ситуацию, когда, буквально, все циклы больще, чем в три строки — описывались Архитектором и «макаки» просто кодили их по блок-схеме.

              Самое смешное, что при этом я видел как дерьмовый код, проходивший 15 review, так и «жуткий код» (обычно мой), который успешно отрабатывал долгие годы — без сбоев и обнаружения в нём ошибок.

              Я не делаю веб или десктоп приложений, у нас safety critical решения.
              Ну тут — можно поверить, что требования будут другими. И, кстати, как раз в этом варианте людям без знания алгоритмов, но аккуратным и исполнительным, можно применение найти… то есть это ближе к шкале, где каждая строчка проверяется трижды…

              Нужен специалист, способный решать проблемы и делать «delivery» (извените не знаю, как по русски это правильно). Выбор алгоритмов по пути, конечно важно, но далеко не первично.
              Возможно. Не участвовал в написании safety critical решений.


              1. 0xd34df00d
                09.06.2019 22:09

                И, кстати, как раз в этом варианте людям без знания алгоритмов, но аккуратным и исполнительным, можно применение найти… то есть это ближе к шкале, где каждая строчка проверяется трижды…

                А этого я не понимаю, кстати. Safety critical решения просят формальной верификации, а не кодревью (ревьювить надо, но не код, а спеку). А для написания кода на соответствующих языках надо представлять, что такое CoC, например (и нет, это не code of conduct).


        1. ezh5
          08.06.2019 14:41

          А вот часто спрашивают на собеседованиях, как найти, что список в цикле и разорвать его. Даже в статье написано, что решение было опубликованно в научной работе очень давно. Понятно же, что все, кто изображает умственные муки и потом рожает это решение прямо на собеседовании показывают только актерское мастерство. Я сразу людям говорю, что делается это через два указателя и прошу написать имплементацию. Все это именно, чтобы проверить, что человек знает, как указателями оперировать.


          Мне кажется, что не стоит ограничивать творчество кандидата. Решение с 2-мя указателями не единственно возможное. Можно перевернуть(reverse) список. При наличии цикла голова не поменяется.

          PS: Когда я впервые услышал о нахождении цикла в списке, засомневался в практическом применении. Не может же такого быть, чтобы ошибка вкралась в операции со списками. Однако буквально через год мне довелось чинить баг связанный ровно с этим :)


          1. khim
            08.06.2019 17:12

            Можно перевернуть(reverse) список. При наличии цикла голова не поменяется.
            Очень красивое решение. Практически бесполезное (даже не могу придумать случай, когда оно было бы быстрее). Но красивое.


            1. wataru
              08.06.2019 23:29

              Вот только оно не работает, если перед циклом есть какой-то незацикленный отрезок. Еще встает вопрос, а как алгоритм разворота должен остановиться, ведь если цикл есть, то до конца не дойти никак.


              1. khim
                09.06.2019 00:34

                Подумайте ещё раз. Мы не просто идём по списку, а разворачиваем его. Тем самым конец у него появляется по определению: это, собственно, бывшее начало.

                Как я сказал: безумно красиво, но абсолютно непрактично.


                1. mayorovp
                  09.06.2019 15:10

                  (комментарий был удален)


              1. mayorovp
                09.06.2019 15:15

                Работает оно в этом случае, причем не повреждая структуру списка (можно развернуть все еще раз и получить исходный список обратно).


                1. wataru
                  09.06.2019 15:17

                  Да, я затупил немного. Оно действительно работает.


  1. mkovalevskyi
    06.06.2019 23:30

    Для вялотекущих банковских «легаси» проектов, гда надо в течении дня взять 1к записей в одном файлике, и положить их в другой — вообще ничего не надо, выше уровня hello world. И этих проектов — многие тысчи с еще более многими тысчами там девелоперов.
    А вот, по слухам, когда надо обработать гигабайты тех же самых записей за доли секунды, и занимается этим специально спроектированная лично для вашего проекта железка, и миллисекунды задержек это прямые потери в финансах сопоставимые с бюджетом исторической родины, то вопросы сортировок и прочих списков, внезапно, становятся достаточно актуальными…


    1. SpiderEkb
      07.06.2019 09:27

      Ну не совсем так. В банковских системах основная проблема в том, что часто приходится оперировать большими объемами данных (ну скажем, пройтись по нескольким десяткам миллионов записей в одной таблице, а для большинства записей подтянуть еще десяток из другой таблицы). Потом по полученным данным еще из третьей таблицы что-то выбрать, сопоставить то что есть с тем что должно быть и внести необходимые изменения. И все это должно сработать за некоторое разумное время (т.е не пол дня, а полчаса, например). И работает все это наряду с еще сотней задач. Т.е. оно не должно сильно грузить систему.
      Т.е. все упирается в производительность и эффективность при работе с большими объемами данных, распределенных по нескольким местам. И далеко не всегда удается решить задачу в лоб, одним скулевым запросом. Была такая ситуация — проверка наличия строки в таблице. Но строки там хранятся группами в виде набора слов. Лобовое решение через listagg работает, но время примерно 2.5сек. А по ТЗ надо укладываться в 150-200мс. Вот и приходится мудрить с высокоселективными предвыборками, частотным словарем и т.д. и т.п.


      1. samhuawey
        07.06.2019 14:52

        Плюсую. Если к примеру у банка брокерская деятельность на бирже, там сотни и тысячи сделок в секунду и неумение предсказать вовремя риск может привести к потерям сотен тысяч долларов.

        Даже если торговой деятельности нет, банально сделать обязательные месячные отчёты по клиентам может занять полдня и повесить всю инфраструктуру. И какой-нибудь непроиндексированный столбец или залоченная строка в базе остановит полбанка.


        1. SpiderEkb
          07.06.2019 15:25
          +1

          Даже без брокерской деятельности нагрузка очень велика. Просто на обычных операциях.
          А еще в банке баланс сводится каждый день. Так называемый EOD (End-Of-Day). А если АБС (Автоматизированная Банковская Система) работает в режиме реального времени, то там совсем весело — перед переходом в EOD создается т.н. «юнит ночного ввода» где продолжают идти все операции. А по окончании EOD производится «накат» — перенос всех изменений из ночного юнита в дневной (который уже перешел на следующий день). И попутно формируются различные отчеты и т.п.
          А еще проверки операций для комплаенса, проверки пользователей на всякие риски и много-много чего.
          В результате на сервере одновременно крутится огромное количество задач с конкурентным доступом к данным.
          Любой сбой приводит к финансовым потерям и репутационным убыткам. В результате каждая новая задача проходит многоэтапное тестирование
          1. Компонентное — на соответсвие ТЗ и отсутствие грубых ошибок, приводящих к падению задачи.
          2. Бизнес — на соответствие заявки на разработку (т.е. это тест ТЗ + его реализации)
          3. Интеграционное — на непротиворечивость взаимодействия со всеми остальными компонентами системы и отсутствия конфликтов в работе
          4. Для регулярно запускаемых задач (те же отчеты, к примеру) еще обязательно нагрузочное тестирование — сколько ресурсов потребляет задача и насколько она оптимальна.

          По факту казалось бы ничего сложного в разработке нет — обычная работа с БД. А на практике постоянная голована боль о том, чтобы каждую операцию пытаться сделать максимально эффективной. Не злоупотреблять «тяжелыми» операциями, по возможнсти вынося их из цикла. Там где можно сократить количество обращений к БД — кешировать все что можно. Задачи с большим количеством вычислений распараллеливать на мастера, выдающего задания и фиксирующего результаты и исполнителей (5-10 параллельных задач), обрабатывающих выданные блоки информации. Тут сразу встает вопрос эффективного межпроцессного взаимодействия (обмена данными) и контроля мастера за исполнителями… И т.д. и т.п.

          Так что скучать не приходится :-)


          1. mkovalevskyi
            07.06.2019 19:36

            Я же не просто так там слово «вялотекущих» написал. На моем текущем месте работы, имеет место быть около тысячи разных внутренних маленьких проектов (причем проект — это не обязательно одно приложение). И совсем не всем им нужны гигабайты данных, конкурентность и т д и т п.


  1. ShadowTheAge
    06.06.2019 23:36

    Есть одна область в которой односвязные списки критически необходимы — неблокирующая многопоточность

    связный список это единственная структура данных динамического размера, операции с которой требуют изменение лишь одного указателя (т.е. и до и после изменения указателя структура в корректном состоянии), а в cpu есть атомарные инструкции по работе с ними


    1. Osnovjansky
      07.06.2019 16:32

      В одноядерной системе — да. В многоядерной — «сосед» может начать вставку в то же место.
      Нам нужно изменить два указателя — в элементе который вставляем и в предыдущем. Так что коллизии получатся возможными


      1. khim
        07.06.2019 16:49

        Вообще lock-free алгоритмы — это очень-очень чёрная магия. Даже на x86 запись может пройти не в том порядке, в котором программа это делает. Можете посмотреть вот эту статью.

        Так что на практике их стоит, елико возможно, избегать — и применять в тех случаях, когда ну вот совсем-совсем «край». Просто очень высока вероятность ошибки. Алгоритм в 100 строк может «доводиться до ума» месяц.


      1. ShadowTheAge
        07.06.2019 16:49
        +1

        В одноядерной системе нет понятия «неблокирующее многопоточное программирование»
        Коллизии легко избегаются потому что есть специальная атомарная инструкция en.wikipedia.org/wiki/Compare-and-swap (я именно это имел в виду под «в cpu есть атомарные инструкции по работе с ними»)

        Порядок действий если надо вставить элемент между a и b (a->b):
        — Создаем новый элемент c (никто о нем не знает, так что синхронизироваться не нужно)
        — Выставляем указатель c -> b
        — если a все еще a->b то меняем указатель a->c (через compare-and-swap), иначе кто-то влез перед нами и надо что-то передумать или просто повторить


        1. Osnovjansky
          07.06.2019 17:24

          Да, с такой инструкцией, действительно всё красиво


        1. mayorovp
          09.06.2019 15:22

          А вот при удалении элемента уже всё не так просто...


  1. 411
    07.06.2019 00:24
    +5

    Нет, ну берёшь
    a -> b -> c ->
    и разворачиваешь
    <- ? <- q <- ?


    1. DrGluck07
      07.06.2019 15:54
      +5

      Известный алгоритм, называется Australian reverse


  1. Starl1ght
    07.06.2019 07:07

    За пять лет работы мне ровно 1 раз пришлось написать свой связный список, и то, переворачивать его было не надо. Все эти странные задачи на поиск цикла и повороты — не имеют отношения к реальной жизни, лучше спрашивали бы что-то по полезным фичам языка или архитектуре, а не что-то такое странное.


  1. DrAgon1008
    07.06.2019 11:50

    Впервые встретил эту задачу на собеседовании несколько лет назад. Знал только базовую теорию о связных списках. Решил за несколько минут (правда пришлось поволноваться). И, мне кажется, это под силу почти каждому. Другой вопрос, что да, это на практике почти никогда не нужно (особенно в большинстве контор, где этот вопрос задают).


  1. force
    07.06.2019 14:01

    Вообще, спрашивать про цикл в списке и ожидать тот самый мегаалгоритм — совершенно безумная идея. Ибо правильный алгоритм не скажет, где именно находится цикл (а в реальности это надо, например, чтобы выплюнуть сообщение об ошибке), и не очень эффективен по скорости. Т.е. знать его для образования полезно, но в реальности использовать смысла нет.


    1. DrAgon1008
      07.06.2019 14:08

      Кстати, решить задачу именно проверки факта наличия цикла можно гораздо проще (решал эту задачу на leetcode): например, идем по списку и переставляем указатель next каждого элемента на самого себя (или на корень списка) и попутно проверяем, а не переставлен ли он уже. Если переставлен, значит мы пришли в элемент, который мы уже проходили, другим путем, и цикл есть. Практической пользы опять же, никакой :)


    1. wataru
      07.06.2019 14:32

      Как только вы нашли какой-то элемент в цикле, то достаточно еще 2 раза пройти по списку, чтобы найти весь цикл. Сначала пройдитесь вперед, пока не вернетесь к известному элементу, узнав таким образом длину цикла. Затем пустите 2 указателя с разницей в длину цикла — они встретятся на первом элементе цикла.


    1. khim
      07.06.2019 15:28

      Ибо правильный алгоритм не скажет, где именно находится цикл (а в реальности это надо, например, чтобы выплюнуть сообщение об ошибке), и не очень эффективен по скорости.
      Почему не скажет? Скажет. Вторым проходом.

      и не очень эффективен по скорости.
      Бенчмарки есть? Я могу себе представить ситуацию, когда какой-нибудь другой алгоритм даст бо?льшую скорость — но это её ещё организовывать достаточно долго придётся.


      1. force
        07.06.2019 17:49

        > Бенчмарки есть? Я могу себе представить ситуацию, когда какой-нибудь другой алгоритм даст бо?льшую скорость — но это её ещё организовывать достаточно долго придётся.
        Условно — список их 100500 элементов и цикл в хвосте. В результате заяц будет наматывать круги, пока черепаха не дойдёт до него.
        Чисто технически, помечать пройдённые элементы будет проще и быстрее, но это требует доп.память, что в реальности, а не в абстрактном алгоритме для данной задачи не проблема.


        1. samhuawey
          07.06.2019 17:54

          Чисто технически вариант с сетом из пройденных адресов может работать быстрее за счёт того, что весь сет попадёт в один из кэшей.


          1. khim
            07.06.2019 20:18

            А вот теперь — думаете пять минут и объясняете почему вы тут чушь написали. Ну и заодно может уж объяснить — когда вы всё-таки будете правы и почему этого придётся добиваться исключительно долгой подгонкой бенчмарка под ответ.


        1. khim
          07.06.2019 20:17

          Условно — список их 100500 элементов и цикл в хвосте. В результате заяц будет наматывать круги, пока черепаха не дойдёт до него.
          Вам что — жалко зайца? Заметьте, что не так он и много тех кругов намотает: не больше 100500 «лишних» элемнтов.

          Чисто технически, помечать пройдённые элементы будет проще и быстрее, но это требует доп.память, что в реальности, а не в абстрактном алгоритме для данной задачи не проблема.
          Проблема-проблема. Я ведь не зря говорил про бенчмарки. Вот мои:
          Вариант с пометками
          #include <iostream>
          
          #include <time.h>
          
          struct List {
            List* next;
            bool mark;
          };
          
          bool is_cycle1(List *p) {
            while (p != nullptr) {
              if (p->mark) {
                return true;
              }
              p->mark = true;
              p = p->next;
            }
            return false;
          }
          
          bool is_cycle2(List *p) {
            while (p != nullptr) {
              if (!p->mark) {
                return true;
              }
              p->mark = false;
              p = p->next;
            }
            return false;
          }
          
          constexpr std::size_t array_size = 10050000;
          
          List array[array_size];
          
          int main() {
            for (auto& element : array) {
              element.next = &element + 1;
            }
            std::end(array)[-1].next =  std::end(array) - 1;
            struct timespec begin_time;
            clock_gettime(CLOCK_MONOTONIC, &begin_time);
            std::size_t count;
            for (int i = 0; i < 100; i++) {
              count += is_cycle1(array);
              count += is_cycle2(array);
            }
            struct timespec end_time;
            clock_gettime(CLOCK_MONOTONIC, &end_time);
            std::cout << "Found: " << count << " times." << std::endl;
            std::cout << (end_time.tv_sec * 1000000000ULL + end_time.tv_nsec -
                          begin_time.tv_sec * 1000000000ULL - begin_time.tv_nsec)
                          * 0.000000001 << std::endl;
          }


          1. force
            08.06.2019 09:46

            Ок. значит я был неправ.


  1. smer44
    07.06.2019 15:25
    -1

    Например, вопрос «Определите, есть ли в связном списке цикл». Предполагается, что кандидат должен придумать решение типа «черепаха и заяц», опубликованное в обильно цитируемой научной статье 1967 года.
    что за бред?
    Смысл связного списка в том чтобы просто так его полностью не обходить каждый раз, и то что в списке нет недолжного цикла в первую очередь определяется его использованием в программе.

    Второе, чтобы не болтаться туда сюда несколько раз, цикл проходим один раз с эффективным хешированием узлов, например по мере создания присваиваем узлу номера 0,1,2,3 и т.п. и составляем битовую лукап-таблицу из известных номеров узлов с флагами 1<< номер, смотрим туда в местах когда вы хотите контролировать что цикл не будет создан.


    1. khim
      07.06.2019 15:46

      Второе, чтобы не болтаться туда сюда несколько раз, цикл проходим один раз с эффективным хешированием узлов, например по мере создания присваиваем узлу номера 0,1,2,3 и т.п. и составляем битовую лукап-таблицу из известных номеров узлов с флагами 1<< номер, смотрим туда в местах когда вы хотите контролировать что цикл не будет создан.
      А почему вы так уверены, что это точно будет быстрее, чем проверить — нет ли в списке циклов?


  1. nobodyhave
    07.06.2019 17:03
    +1

    Зачем спрашивать связные списки на собеседовании? Да затем, чтобы кандидат их никогда потом не использовал без надобности.
    Видел одну статью, от которой у меня волосы дыбом встали. Там один погромист открыл для себя что в Java существует не только ArrayList, который он до этого использовал всегда, в независимости от решаемой задачи, но и другие структуры данных. В отличии List, Map и Set он вроде разобрался, хотя разницу между HashMap и TreeMap по-моему так и не осилил. Самое же прекрасное было во фразе, что теперь, когда ему в коде нужен список, он иногда, чтобы не повторяться (sic!), использует LinkedList. Т.е. человек просто так, по велению левой пятки, выбирает структуру данных, которую использует.

    Соответственно, на собеседовании я обычно задавал 2 вопроса. Знает ли кандидат отличие ArrayList (по сути resizable array) от LinkedList (нормальный связный список). Если говорил, что знает и мог как-то это отличие описать, то просил пошагово объяснить, как будет происходить get(5) для списка из 10 элементов в одно и во втором случае по его мнению.
    К сожалению, людей которые могли это сказать можно было пересчитать по пальцам.

    Справедливости ради, этот вопрос не являлся решающим, скорее для понимания общего уровня кандидата.


    1. samhuawey
      07.06.2019 17:47

      Зато наверное прекрасно ориентируется в Spring и прочих REST API.


      1. nobodyhave
        07.06.2019 18:02

        К сожалению обычно тоже нет :( Я собственно Андроид разработчик, поэтому в основном говорили за Андроид. Про Java как раз я спрашивал что из Collections framework кандидат знает, разницу между ArrayList и LinkedList и разницу между HashMap и TreeMap. С мапами кстати та же печаль была. А один кандидат меня еще долго убеждал, что HashMap можно отсортировать через Collections.sort().


        1. samhuawey
          07.06.2019 18:19

          Вопрос не в том, можно или нет, вопрос — зачем?


  1. MacIn
    07.06.2019 18:27
    +1

    опубликованное в обильно цитируемой научной статье 1967 года. Вы просите кандидата повторить научное исследование за 30 минут!

    Не «научное исследование», а научное исследование 1967 года в 2019. В 2019 это не нечто новое, а уже давно — общее место. И это нормально — знание становится сложнее. Целая куча всего, что тогда было научными исследованиями в наши дни кажется (даже не зная решения) тривиальными (ладно, ладно. Решаемыми) задачками. Тогда это было исследованием лишь потому что это было впервые.


    1. playermet
      08.06.2019 01:02

      Для человека который не читал про этот алгоритм ранее ничего неизменилось. Нам, например, ни в техникуме, ни в институте его не давали.


      1. MacIn
        08.06.2019 02:19
        +2

        Я писал выше: «в наши дни кажется (даже не зная решения) тривиальными ».
        Я писал выше: «Тогда это было исследованием лишь потому что это было впервые.» «Это» здесь — не о конкретном единичном алгоритме.
        Добавить — нечего.

        Нам, например, ни в техникуме, ни в институте его не давали.

        Нам тоже, это как-то не помешало с ходу придумать решение, которое потом оказалось общепринятым.


  1. saipr
    07.06.2019 20:16

    Ещё одна мораль: из истории можно многому научиться.

    Здесь не поспоришь. Вопрос в том, учатся ли?