Ошибку Rockstar может совершить каждый (и я тоже) / forpes.ru

Главная
Ошибку Rockstar может совершить каждый (и я тоже)

Ошибку Rockstar может совершить каждый (и я тоже) +58

12.06.2021 11:30

host_m 53 24800 Источник

Несколько месяцев назад в новостях всплыла потрясающая статья [переводы на Хабре: один и второй] о Grand Theft Auto Online.

Советую прочитать статью целиком, но если вкратце, GTA Online имела внезапно квадратичную производительность при парсинге большого JSON-блоба (из-за многократных вызовов strlen); после устранения этой ошибки время загрузки уменьшилось почти на 70%.

Это вызвало оживлённые дискуссии: в этом виноват C? Или, возможно, "web shit"? Или капитализм и его стимулы?

Однако все были солидарны в одном: они бы ни за что не написали подобной глупости.

(Вы уже чувствуете, что надвигается?)

Одним из моих побочных проектов является высокопроизводительная программа для просмотра 3D-моделей под названием Erizo.

Благодаря продуманному коду она открывает 97-мегабайтный двоичный файл STL на Macbook Pro 2013 года всего за 165 миллисекунд. Это потрясающая скорость.

Из соображений совместимости я написал небольшой парсер и для ASCII STL.

ASCII STL — это формат обычного текста с плохой спецификацией, который выглядит вот так:

solid cube_corner
          facet normal 0.0 -1.0 0.0
            outer loop
              vertex 0.0 0.0 0.0
              vertex 1.0 0.0 0.0
              vertex 0.0 0.0 1.0
            endloop
          endfacet
          facet normal 0.0 0.0 -1.0
            outer loop
              vertex 0.0 0.0 0.0
              vertex 0.0 1.0 0.0
              vertex 1.0 0.0 0.0
            endloop
          endfacet
          ...
endsolid

Я написал чрезвычайно надёжный парсер, добавив в комментарий такое описание:

/*  Самый либеральный парсер ASCII STL: игнорирует всё, кроме
 *  слова 'vertex', а затем одно за другим считывает три значения float. */

Загрузка ASCII STL всегда казалась немного медленной, но я предполагал, что причина этого в неэффективном текстовом формате.

(Тучи сгущаются.)

За несколько дней произошло несколько событий:

Впервые за несколько лет я вернулся к старому коду Erizo, чтобы устранить ошибку фокусировки на macOS
Опубликовали статью про GTA Online
Из последовавшей дискуссии я узнал, что парсинг может быть квадратичным из-за многократных вызовов sscanf
Я заметил, что загрузка ASCII STL была очень медленной.

Вот логи загрузки 1,5-мегабайтного ASCII STL метками времени (в секундах):

[erizo] (0.000000) main.c:10      | Startup!
[erizo] (0.162895) window.c:91    | Created window
[erizo] (0.162900) window.c:95    | Made context current
[erizo] (0.168715) window.c:103   | Initialized GLEW
[erizo] (0.178329) window.c:91    | Created window
[erizo] (0.178333) window.c:95    | Made context current
[erizo] (1.818734) loader.c:109   | Parsed ASCII STL
[erizo] (1.819471) loader.c:227   | Workers have deduplicated vertices
[erizo] (1.819480) loader.c:237   | Got 5146 vertices (7982 triangles)
[erizo] (1.819530) loader.c:240   | Waiting for buffer...
[erizo] (1.819624) loader.c:326   | Allocated buffer
[erizo] (1.819691) loader.c:253   | Sent buffers to worker threads
[erizo] (1.819883) loader.c:258   | Joined worker threads
[erizo] (1.819887) loader.c:279   | Loader thread done
[erizo] (1.821291) instance.c:32  | Showed window

С момента запуска до отображения окна прошло больше 1,8 секунды!

Посмотрев на парсер ASCII свежим взглядом, я увидел, что причина очевидна:

    /*  The most liberal ASCII STL parser:  Ignore everything except
     *  the word 'vertex', then read three floats after each one. */
    const char VERTEX_STR[] = "vertex ";
    while (1) {
        data = strstr(data, VERTEX_STR);
        if (!data) {
            break;
        }

        /* Skip to the first character after 'vertex' */
        data += strlen(VERTEX_STR);

        for (unsigned i=0; i < 3; ++i) {
            SKIP_WHILE(isspace);
            float f;
            const int r = sscanf(data, "%f", &f);
            ABORT_IF(r == 0 || r == EOF, "Failed to parse float");
            if (buf_size == buf_count) {
                buf_size *= 2;
                buffer = (float*)realloc(buffer, buf_size * sizeof(float));
            }
            buffer[buf_count++] = f;

            SKIP_WHILE(!isspace);
        }
    }

Можно заметить, что в коде есть sscanf, считывающая одно значение float из начала потока данных и каждый раз проверяющая длину всей строки.

Да, я совершил ту же ошибку, что и программисты, работавшие над GTA Online: написал внезапно квадратичный парсер!

Замена вызова sscanf на вызов strtof снизила время загрузки почти в 10 раз: с 1,8 секунды до 199 миллисекунд.

[erizo] (0.000000) main.c:10      | Startup!
[erizo] (0.178082) window.c:91    | Created window
[erizo] (0.178086) window.c:95    | Made context current
[erizo] (0.184226) window.c:103   | Initialized GLEW
[erizo] (0.194469) window.c:91    | Created window
[erizo] (0.194472) window.c:95    | Made context current
[erizo] (0.196126) loader.c:109   | Parsed ASCII STL
[erizo] (0.196866) loader.c:227   | Workers have deduplicated vertices
[erizo] (0.196871) loader.c:237   | Got 5146 vertices (7982 triangles)
[erizo] (0.196921) loader.c:240   | Waiting for buffer...
[erizo] (0.197013) loader.c:326   | Allocated buffer
[erizo] (0.197082) loader.c:253   | Sent buffers to worker threads
[erizo] (0.197303) loader.c:258   | Joined worker threads
[erizo] (0.197306) loader.c:279   | Loader thread done
[erizo] (0.199328) instance.c:32  | Showed window

Это стало идеальным напоминанием о том, что даже если программируешь много лет, ловушки находятся всегда. В документации sscanf не указана её временная сложность, поэтому это особо хитрый пистолет для выстрела себе в ногу, и мне кажется, что не один я блуждал во тьме невежества.

Возможно, вы сами не столкнётесь с подобным напоминанием, но всякий раз, когда вы будете читать потрясающую историю о плохом коде, помните — это может случиться и с вами!

(Очевидно, мораль истории такова: не используйте sscanf для многократного парсинга одиночных токенов из начала строки; уверен, у вас всё будет нормально, если вы просто избежите этого.)

На правах рекламы

VDSina предлагает мощные и недорогие VPS с посуточной оплатой. Интернет-канал для каждого сервера — 500 Мегабит, защита от DDoS-атак включена в тариф, возможность установить Windows, Linux или вообще ОС со своего образа, а ещё очень удобная панель управления серверами собственной разработки. Обязательно попробуйте!

Комментарии (53)

Andy_Big
12.06.2021 16:20
#23143190
+1
Программист вдруг обнаружил, что сотни тысяч вызовов sscanf() в цикле — это не очень быстро? Или о чем статья?
1. Mingun
  12.06.2021 16:45
  #23143246
  +1
  Вызов любой функции сотни тысяч раз в цикле не очень быстро (все конечно зависит от того, что такое "быстро"). Статья о том, что глядя на этот код вовсе не подозреваешь, что здесь что-то не так. В самом деле, нафига вам знать длину строки, чтобы определить, где конец float? Думаю, чтение документации на cppreference могло бы предостеречь, но
  
  а) не факт, что на момент написания кода она была
  
  б) не факт, что автор не пользовался другой документацией, где этого могло и не быть. А искать другую незачем, если у вас уже есть одна
  1. Andy_Big
    12.06.2021 16:59
    #23143282
    +1
    Вызов любой функции сотни тысяч раз в цикле не очень быстро
    
    Но функция анализа и разбора строки — это же вроде бы очевидно, что прям совсем не быстро :) Это же не функция min().
    
    Статья о том, что глядя на этот код вовсе не подозреваешь, что здесь что-то не так.
    
    Весьма спорно. Для меня, например, очевидно, что разбор текстового файла в сотни тысяч строк с вызовом для каждой строки по три раза sscanf() — это пипец как не быстро.
    Кроме того: strlen(VERTEX_STR); — серьезно? Каждый раз вызов strlen() для одной и той же константной строки? У меня серьезные сомнения в том, что квалификация этого программиста позволяет ему писать статьи-наставления :)
    
    halfcupgreentea
    12.06.2021 18:37
    #23143480
    Каждый раз вызов strlen() для одной и той же константной строки
    А компилятор не умеет такое оптимизировать? Или он не знает, что strlen чистая функция?
    
    vkni
    12.06.2021 21:32
    #23143834
    +7
    Да, согласно godbolt'у в свежих версиях самых распространённых компиляторов при полной оптимизации просто пишет число 7 в регистр. А вот все остальные вызовы остаются на своих местах.
    
    Но это всё равно хрупкость — не будем же мы после любой серьёзной правки каждый раз проверять за компилятором, оптимизировал ли он это место или нет.
    
    slonopotamus
    13.06.2021 12:16
    #23144732
    не будем же мы после любой серьёзной правки каждый раз проверять за компилятором, оптимизировал ли он это место или нет.
    После каждой правки не будем, но за 7 лет как-то можно было найти время разобраться с проблемой, на которую массово жаловались игроки.
    
    foxin
    13.06.2021 19:49
    #23145532
    Рискую нарваться на минусы, но: Нет, нельзя было
    
    Поясняю:
    
    "работает — не трогай". в данном случае — работало
    
    в данном случае, баг с перфом, причем это "единичный" кейс — проявляется только при запуске игры, дальше играть не мешает
    
    уже этого достаточно, чтобы задача на эту штуку (если бы она была раньше) шла бы не выше среднего уровня северити, а то и минор. потому что работает, потому что не постоянно мешает, потому что есть куча других задач, где "игрок не может купить что-то" или "при нажатии на кнопку ничего не происходит, а должно бы", которые точно блокируют часть геймплея.
    
    Но, допустим, что задача была заведена 3 года назад, валялась минором, пришел новый программист, и чтобы ввести его в курс дел — решили на пару недель его отправить на фикс миноров: и с кодом немного познакомится, и с процессами в компании. И вот берет он эту задачу, тратит Х часов, находит и исправляет проблему, проходит ревью, и вот наступил момент — надо решить, в какой из следующих релизов пойдет задача. В ближайший через 1.5 месяца? Нее, там уже код фриз, только крит баги можно вливать. Во второй следующий? Нет-нет, там скоуп уже сформирован, выделены QA и perf-QA, бОльший скоуп они взять не смогут. В третий следующий? Погоди-ка, ты поменял функцию parse_json, так? Но она же еще используется при загрузке метаданных, и при подгрузке списка файлов обновления, и еще в 4 местах. Это надо все проверить, регресс тесты, перф тесты… В тот релиз скорее всего не получится, там будет огромный апдейт, добавляются 5 новых островов, будет не до того. Вот, в 6й следующий релиз будет самое оно, через год и 8 месяцев, там пока не сильно много фичей запланировано.
    (спустя два года)
    Задача перенеслась еще на 4 версии вперед, но однажды её точно зарелизят...
    
    netch80
    16.06.2021 08:56
    #23153326
    В третий следующий? Погоди-ка, ты поменял функцию parse_json, так? Но она же еще используется при загрузке метаданных, и при подгрузке списка файлов обновления, и еще в 4 местах. Это надо все проверить, регресс тесты, перф тесты… В тот релиз скорее всего не получится, там будет огромный апдейт, добавляются 5 новых островов, будет не до того.
    Отличный пример, почему feature-based релизы толстых проектов проигрывают time-based релизам :) В time-based, какое из подмножества 100500 правок собралось в те 105, которые попали в конкретную версию, уже не так важно — прогресс идёт своим чередом.
    
    А обновления игры это отличный случай как раз для time-based.
    
    ParAmbula
    14.06.2021 10:26
    #23146596
    Иногда бывает очень познавательно скомпилировать программу разными компиляторами и посмотреть на полученный машинный код. Ведь не просто так получилось, что у нас есть несколько компиляторов, а не один.
    
    Tomok
    12.06.2021 19:29
    #23143568
    del
    
    mymedia
    13.06.2021 11:06
    #23144624
    +3
    cерьезно? Каждый раз вызов strlen() для одной и той же константной строки?
    
    А что такого? Компилятор даже при отключенных оптимизациях заменяет подобный вызов на константу. В данном случае 7.
    
    Andy_Big
    13.06.2021 11:21
    #23144664
    Смотря какой компилятор.
  1. InterceptorTSK
    12.06.2021 18:21
    #23143462
    -1
    вы может и удивитесь, но даже применение объектов причём якобы быстрых [например структур] — это на самом деле не быстро и нафиг не нужно
    максимальная быстрота достигается когда вообще убран всякий оверхед
    например у меня есть статическая бд со строками коих там я даже не знаю сколько, десятки миллионов — порядок такой
    так вот на шарпе [внезапно!] написан коннектор до этой бд, оттуда дёргаются указатели [внезапно!] а не какие то нахрен не нужные строчки, и даже не массивы, потому что это тоже оверхед
    всё потому что эти строчки далее в кол-ве 100-300 шт. комбинируются уже в итоговые строчки, которые как раз таки и нужны на выходе
    понятное дело что если тягать всё это на указателях и смещениях без объектов и по сути рулить указателями и собирать через это всё дело итоговые наборы байт — то работать оно будет астрономически быстро
    а оно так и работает))) 300 миллионов обращений в мою базу и сборка 10 миллионов строк происходит за секунду на одном ядре
    я и память этой базы расшарил если что, несколько коннекторов пользуются всем этим делом враз
    причём сам коннектор в общем то тривиален, а вот сборка самих баз для коннектора — это ужас и кошмар, т.е. например 50 таблиц работающие исключительно на смещениях друг от друга это полнейшая жесть, в реализации оного вы погрязните навсегда
    такие дела и это реальность
    ну а вообще — это всего лишь подготовительный этап для создания ещё более забавных бд, где строк вообще нет) я там буду юзать абстракции, которые являются словоформами из зализняка, однако же это всё в итоге как то в строки превращать нужно и очень быстро, потому и озадачились в общем то тривиальной проблемкой, т.е. как из базы где условный десяток миллионов подстрок собрать строку и эта строка состоит ну например из 100 тыщ этих подстрок из базы
    п.с.: не продаётся ни за какие деньги, даже за очень очень страшные деньги, НЕА
  1. vkni
    12.06.2021 20:20
    #23143674
    +1
    Статья о том, что глядя на этот код вовсе не подозреваешь, что здесь что-то не так.
    
    Ну у меня сразу работает ассоциация слова «парсер» с parser/lexer generators, parser combinators. Слова «ASCII» и «97 Mb» — сразу намёк на быстрые генераторы, в частности Ragel, а если и тут скорости не хватает, надо читать статьи про самописные парсеры.
    
    А функции на C работают с локалями => есть хорошие шансы просесть по скорости + получить скрытую проблему когда локаль, скажем, русская с "," вместо ".".
    
    — Я склонен полагать, что просто это место не было когда-то узким. Ну а сейчас, с оптимизацией других мест, этот парсер стал достаточно критичным по скорости. Вообще программа адски быстрая, судя по статье, а формат лишь один из многих поддерживаемых.
    
    netch80
    13.06.2021 17:53
    #23145348
    А функции на C работают с локалями => есть хорошие шансы просесть по скорости + получить скрытую проблему когда локаль, скажем, русская с "," вместо ".".
    Если локализация явно не активирована чем-то вроде setlocale(LC_ALL, "") — то таких проблем не будет.
    
    Но, да, есть проблема принципиальная: нельзя уточнить локаль для конкретной операции. (ios_base::imbue конечно поможет, но тут другой оверхед.)
  1. littorio
    12.06.2021 21:30
    #23143824
    +1
    Вызов любой функции сотни тысяч раз в цикле не очень быстро (все конечно зависит от того, что такое "быстро").
    Но здесь sscanf, который как минимум формат должен распарсить. Это всё-таки универсальная функция для разбора строк с указанным любым форматом, возможностью получения нескольких значений разом, и т.п. Она как минимум должна формат-строку (неизменную!) каждый раз парсить, внутри наверняка оверхед для матчинга формата на вход и т.п.
    
    Какой-нибудь специализированный strtof здесь явно удобнее. Просто странно — если программа пишется на расслабоне, с формат-строками, то откуда претензии к скорости? А если заморочились с оптимизацией, руками прописан поиск ключевых слов, все эти SKIP_WHILE(isspace), и т.п. — то и чтение float'а должно быть оптимизированным. И strlen(VERTEX_STR) я бы в константу вынес, от греха.
1. rozalba
  12.06.2021 17:12
  #23143308
  +1
  Статья о том, что даже опытный разработчик — все еще человек и может что-то упустить из виду, и что зачастую бутылочные горлышки или некоторые баги очевидными становятся только когда ты их уже нашел, а не когда изначально писал этот код.
  1. Andy_Big
    12.06.2021 17:43
    #23143380
    Ну тогда ждем следующих статей о том, что небо голубое, а огонь обжигает :)
    
    foxin
    13.06.2021 19:56
    #23145550
    Ну слушайте, если бы вам было 20 лет — вы бы эти статьи читали как детектив.
    Было бы 30 — "ну да, надо бы проверить свой код, а заодно на ревью обращать внимание на такое".
    Но вам за 40, и такие статьи для вас как "небо голубое".
    Оставьте возможность двадцатилетним — учиться, а тридцатилетним — не забывать, что они еще с очень многими вещами не сталкивались =)
  1. XenRE
    12.06.2021 20:17
    #23143660
    -1
    Что-то упистить из виду или ошибиться может каждый, однако положить болт на очевидные, 100% воспроизводимые проблемы своего приложения, и даже не попытаться выяснить и устранить причины этих проблем может только тот, кому пофиг на результаты своего труда.
    
    foxin
    13.06.2021 19:59
    #23145554
    Вы так говорите, как будто никогда не работали в режими аврала.
    И вы точно не работали в геймдеве. Если такое случится — вы точно не будете больше никогда оставлять такие комментарии.
    
    XenRE
    14.06.2021 12:35
    #23146910
    Проблема известна минимум два года, пруф:
    www.reddit.com/r/gtaonline/comments/9vgo0g/how_the_fuck_are_20_minute_load_times_acceptable
    За это время не удосужились выделить несколько часов на исправление? А самим разработчикам интересно каждый раз втыкать по 10 минут на лоадинг скрин?
1. BingoBongo
  13.06.2021 02:08
  #23144272
  -2
  ждем статью расследование: как я заменил std::vector на std::list для ускорения программы в 1000 раз!
  1. foxin
    13.06.2021 20:00
    #23145562
    И это будет хорошо, потому что 99% кейсов у программистов на плюсах — коллекции до пары тысяч элементов, и разницы vector vs list — незаметно, а возможность ошибиться и научиться новому — у них появится только после своей ошибки либо после такой статьи.
    
    BingoBongo
    14.06.2021 00:55
    #23146072
    возможность ошибиться и научиться новому — у них появится только после своей ошибки либо после такой статьи
    мда, я смотрю тяжело быть программистом на плюсах

maaGames
12.06.2021 16:35
#23143230
Может и «data += strlen(VERTEX_STR);» заменить стоит?
1. qrdl
  12.06.2021 20:38
  #23143704
  По уму, раз уж VERTEX_STR задекларирован как массив, намного лучше использовать sizeof(VERTEX_STR)-1 в этом месте. А иначе вообще нет никакого смысла декларировать его как массив, только лишние расходы на инициализацию.

AllexIn
12.06.2021 16:44
#23143242
Есть хорошее правило: не знает как работает — не используешь.
Его далеко не всегда можно соблюдать, но в случае работы со строками в С — уж точно обязательно к исполнению.
Как минимум у любого программиста работающего со строками должен быть звоночек после осознания что strlen проходит по всей строке для выдачи результата.
1. Maximuzzz
  12.06.2021 18:12
  #23143444
  +1
  Проблема в том, что обычно «знают как» и соответственно используют. Вообще, кажущееся «я знаю как» - это очень сложная конструкция требующая как минимум ещё одного человека, который скажет, что не так. Самостоятельно понять это практически не возможно.
  1. PrinceKorwin
    12.06.2021 18:36
    #23143478
    Здесь не нужен ещё один человек. Достаточно приучить себя смотреть в исходники используемых функций.
    На самом деле. Разработчик это больше про чтение чужих исходных кодов, чем их написание. На мой взгляд.
    
    Maximuzzz
    12.06.2021 20:48
    #23143712
    +1
    Я про то, что не помогает. Ну вот вы, допустим, приучили себя читать исходники функций. Вы отдельный каталог ведёте где отмечаете функции которые можно использовать и какие нет? И даже если буквально все функции вы отсматриваете, то по каким критериям вы их ранжируете, подходит ли энная функция для проекта или нет? Или каждый раз перечитывать код, чтобы понять в конкретном месте подходит или нет?А вы уверены, что прочитав исходный код вы оценку правильную дали? А точно ваше личное восприятие исходного кода функции позволяет корректно оценить последствия её использования? А читать исходный код, например, консольных команд надо?
1. Lendges
  12.06.2021 19:04
  #23143522
  +1
  Есть хорошее правило: не знает как работает — не используешь.
  Тогда возникает классический вопрос глубины. Насколько глубоко надо знать, как оно работает?
  Плюс не учитывается вопрос современной сложности (сам не в восторге, но что имеем) разработки, когда десятки-сотни разных инструментов, каждый подходящий под свой случай и разбираться в каждом из них это просто кратное увеличение разработки на ровном месте.
  1. AllexIn
    12.06.2021 19:52
    #23143616
    Ну вот вы сейчас и сформулировали причину, почему многие компании предпочитают брать специализированных разработчиков, а не фуллстэк.
    
    TrashboxBobylev
    13.06.2021 11:06
    #23144626
    Разве не наоборот экономят?
1. mpakep
  13.06.2021 10:41
  #23144588
  +3
  Есть хорошее правило: не знает как работает — не используешь.
  
  Есть опасность вообще не начать работу. Ведь если не начать использовать то никогда не узнаешь.
  1. AllexIn
    13.06.2021 10:57
    #23144606
    Ничто не мешает осваивать теорию до начала практики. Не нужно писать strlen, чтобы узнать что этот метод проходит по всей строке для выяснения её длины. Даже больше, её использование никак не поможет это знание обрести.
    
    Goodkat
    13.06.2021 12:43
    #23144784
    Не нужно писать strlen, чтобы узнать что этот метод проходит по всей строке для выяснения её длины.
    Ну это же так только для нуль-терминированных сишных строк, которые суть массивы, и передаются по указателю на начало массива. Есть и другие реализации строк, которые хранят длину строки, там вызор strlen - это чтение поля объекта. Как я думал до этого момента.

alexkmbkdr1
12.06.2021 17:57
#23143420
Кстати, недавно смотрел исходники функции itoa для стандартной библиотеки языка C под андроид — android.googlesource.com/kernel/lk/+/qcom-dima-8x74-fixes/lib/libc/itoa.c

И меня смутил такой момент: из функции itoa вызывается функция strrev, внутри которой вызывается strlen, хотя внутри вызывающией функции itoa длина строки известна. Получается не такая уж оптимальная библиотека?

vkni
12.06.2021 20:03
#23143630
Вообще странно — упор на скорость, 100 метровые файлы, а парсер не на конечных автоматах.

Давно же есть генераторы лексеров/парсеров. Какой-нибудь Ragel в одном из режимов сделает такую лапшу из goto, которая раза в 2 будет быстрее чего угодно. Но в любом случае, никакой flex не сделает там ничего квадратичного и дикого.
1. MentalBlood
  12.06.2021 20:29
  #23143686
  Парсер ручной работы, так сказать
  1. vkni
    12.06.2021 20:53
    #23143722
    Где-то пробегала статья, о том, что вручную, с помощью intrinsics, у мастеров получаются очень быстрые парсеры, затыкающие генераторы за пояс. В частности, для разбора JSON. Но тут явно не тот случай. То есть, кмк, переход на flex сильно бы ускорил разбор.
    
    С другой стороны, как я понял, текущая скорость вполне устраивает, поэтому цель достигнута без привлечения доп. инструментария. Единственное НО — это перед всасыванием этого ASCII нужно сбросить локаль в «C», иначе пойдут ошибки в русской локали, например.
1. avdx
  13.06.2021 00:04
  #23144078
  100 метровые файлы у него бинарные. А ASCII файл, про который речь в статье, судя по тому, что в нем 7982 треугольников, занимает всего несколько десятков килобайт.
  1. vkni
    13.06.2021 01:16
    #23144222
    Спасибо. Значит неправильно понял. Кстати, я глянул на этот кусок — его радикально переписали.

dipsy
13.06.2021 13:40
#23144882
+2
В свое время деды придумали одну смешную давно забытую теперь штуку, как её... профулер, профэлер... профайлер, может быть?... Говорят, при помощи неё можно было не заниматься шаманством из серии "а вот у этой функции есть такие подводные камни, хорошо что удалось заметить, какой я клёвый сеньёр-помидор!", а найти конкретное узкое место и его уже предметно оптимизировать.
1. netch80
  13.06.2021 18:10
  #23145364
  В свое время деды придумали одну смешную давно забытую теперь штуку, как её… профулер, профэлер… профайлер, может быть?.. Говорят, при помощи неё можно было не заниматься шаманством из серии
  Ага, "профайлер" оно зовётся. Только вот проблемки какие -
  
  1) Те профайлеры, которые снимают текущие исполняемые адреса и трейсы со стороны, очень подвержены случайностям (включая корреляцию из-за шедулинга в системе, которая может давать систематическую погрешность), а те, что перехватывают каждый вход/выход функции, тормозят исполнение в разы.
  
  2) Аналогично предыдущему, inline-функция будет или неинлайнена (с жуткими потерями производительности), или размажется тонким слоем по программе, потерявшись среди увеличения всех остальных. Далеко не каждый компилятор сгенерирует такую отладочную информацию, чтобы правильно описать источник; оптимизация может так переделать код, что следов той исходной позиции не останется; далеко не каждый генератор отчёта профайлера соберёт эту отладку.
  
  3) Многие профайлеры показывают, например, 80% времени в karuka(), а пришло туда управление по пути foo() -> buka() -> do_buka() -> karuka() или bar() -> zuka() -> zuka_real() -> karuka_wrapper() -> karuka(), вы будете вычислять долго и нудно. Ибо сохранить значение регистра PC (aka IP aka IAR...) — одно, а сохранить полный трейс — другое.
  
  4) Профайлер может врать, временами жестоко. Вот актуальный пример: у меня есть питоновский нагруженный демон с логгингом через log4cplus. Так вот — профайлинг демона целиком показывает, что логгинг занимает ~10%. А профайлинг только логгинга без всего остального показывает абсолютные затраты раз в 100 меньше.
  
  5) Как обобщение предыдущего: профилировать бутерброд из нескольких языков (например, C внизу, C# наверху, а в нём интерпретатор скриптов на Prolog, которым делают хуки) — крайне сложно, если вообще возможно (как увязать выполнение кода на C с конкретным местом в скрипте?)
  
  И это я не вспоминаю, что что-то происходит только в продуктине, а ещё надо попытаться повторить это в пробирке...
  
  Ну и наконец 6) просто постановить, что что-то надо проверить на оптимальность именно профилированием, и провести это через начальство — может быть неподъёмной задачей.
  
  В общем, ваш сарказм понятен, но, мягко говоря, преждевременен.
  1. andrio_new
    14.06.2021 10:27
    #23146600
    Ну такое. Если у вас нет профайлера то оптимизация програм больше чем 10к строк(условно) будет почти невозможной задачей.
    Из опыта — оптимизировал программу которая делает интернет запросы — самое узкое место расшыфровка https cертификата в библиотеке которая в другой библиотеке — как мне эту проблему без профайлера искать?
    
    netch80
    14.06.2021 11:35
    #23146750
    Так я и не говорю, что профайлер бесполезен. Это средство, которое надо использовать. И в значительной части случаев он таки помогает.
    
    Но вот утверждать, что профайлер устраняет всё шаманство — явный перебор. Он может хорошо сократить набор тех мест, где таки надо шаманить :)

Angmarets
13.06.2021 19:16
#23145478
Ошибку Rockstar может совершить каждый

Ошибка рокстар не в том, что её разраб плохо распарсил json. Их ошибка — в игнорировании фидбэка от кастомеров. Понадобилось несколько лет багрепортов и левый человека с отладчиком чтобы исправить проблему, которая должна была быть починена в течении двух недель после первого репорта. Сколько еще лет должно пройти чтоб они починили например баг с рандомным сбросом прогресса в criminal mastermind challange — непонятно.
1. vkni
  13.06.2021 19:33
  #23145492
  Ну это просто минимизация расходов.

melvladimir
14.06.2021 10:26
#23146592
А ведь ошибка Rockstar совсем не в этом… Почему у них никто не задался вопросом: «а почему на 4-х ядрёной машине в какой-то момент пыхтит только 1 ядро?» Ну, как пыхтит, скорее вейпит на крыльце.
Сразу написать идеальный код большого объема нельзя. Даже крупную блок-схему сразу в «финалку» не получится. Плохо, когда есть возможность существенного улучшения продукта за незначительные усилия, но перекрывается «и так сойдёт» («и так приносит прибыль» и т.д. и т.п.). И пример Rockstar очень показательный, когда жадность зашкаливает. Та же проблема с читерами. Да там есть простое решение, но это ж деньги! Аж 0,1%!
1. vkni
  14.06.2021 17:28
  #23147850
  Это мы просто в капиталистическом мире живём — его особенности. Вообще капитализм — это распределённый «жадный» алгоритм управления обществом (если смотреть с точки программиста)
  1. Holduog38
    15.06.2021 12:45
    #23150358
    Комми минус поставил тупо

Holduog38
15.06.2021 09:53
#23149588
Не каждый, поскольку не каждый из них работает в Rockstar