Внимание, подводный камень / forpes.ru

Главная
Внимание, подводный камень

Внимание, подводный камень -18

24.07.2020 07:28

andrewbeletskiy 67 2100 Источник

Я только что нашёл очень незаметный баг в своём коде библиотеки валидации quartet, и хочу поделиться им.

Задача

Дан список строк: VALID_STRINGS.
Cоздать функцию валидации test(x) которая должна вернуть true, если x — это одна из строк в этом массиве.
Область применения: x — любое значение Javascript
Ограничения: Не использовать ES6. (Цель — старый браузер)

Решение №1: Решение в лоб

Самым простым решением, которое может быть — это пройтись по всем строкам в этом массиве и сравнить.

const VALID_STRINGS = [/* VALID STRINGS */]
function test1(x) {
  for (let i = 0; i < VALID_STRINGS.length; i++) {
    if (VALID_STRINGS[i] === x) return  true
  }
  return false
}

Это решение правильное, но медленное, потому что оно заставляет при каждом вызове функции пробегать по массиву в поисках совпадения. Таким образом сложность алгоритма по времени будет O(длина массива VALID_STRINGS)

Заметим, что это решение можно было бы переписать используя методы массивов(indexOf, includes, some, reduce ...). Цикл выбран для того, чтобы продемонстрировать линейную сложность алгоритма.

Решение №2: Словарь

Именно это решение содержало баг, который я обнаружил.

Массив не очень подходящая структура данных для подобной проверки. Куда лучше использовать словарь для хранения валидных строк. Ведь доступ к элементу словаря по ключу выполняется за константное время.

const VALID_STRINGS = [/* VALID STRINGS */]
const VALID_STRINGS_DICT = {}
for (let i = 0; i < VALID_STRINGS.length; i++) {
  const validString = VALID_STRINGS[i]
  VALID_STRINGS_DICT[validString ] = true
}
function test2(x) {
  return VALID_STRINGS_DICT[x] === true
}

Отличное решение за константное время!

Берегись! Подводный камень!

Это хоть и быстрое решение, но не правильное. Оно не гарантирует того, что х — будет элементом массива VALID_STRINGS. И чтобы это продемонстрировать приведу контрпример:

// Предположим
const VALID_STRINGS = ['somestring', 'anotherstring']
// Тогда после заполнения словаря, он будет иметь следующий вид
const VALID_STRINGS_DICT = { somestring: true, anotherstring: true }

const underwaterRock = ['somestring']

test2(underwaterRock) // вернёт true

Хоть underwaterRock и не является строкой — но наша функция вернула true. А всё потому, что внутри тела функции test2(x) происходит использование x в качестве ключа.

VALID_STRINGS_DICT[x]

В этот момент — x приводится к строковому значению. И в этом и есть проблема — массив приводится к строке путем перечисления своих значений через запятую. Но когда это массив из одного строкового значения — он приводится в точности к своему первому элементу.

['somestring'].toString() === 'somestring'

Решение №3: С дополнительной проверкой

Добавим проверку типа прежде чем использовать x в качестве ключа

const VALID_STRINGS = [/* VALID STRINGS */]
const VALID_STRINGS_DICT = {}
for (let i = 0; i < VALID_STRINGS.length; i++) {
  const validString = VALID_STRINGS[i]
  VALID_STRINGS_DICT[string] = true
}
function test2(x) {
  return typeof x === 'string' && VALID_STRINGS_DICT[x] === true
}

Дополнительная операция, но результат правильный.

Решение №4: Set

Если мы опустим ограничение на неиспользование ES6. То сможем полностью избежать подобных проблем.

const VALID_STRINGS = [/* VALID STRINGS */]
const validStringsSet = new Set(VALID_STRINGS)

function test4(x) { return validStringsSet.has(x) }

Вывод

Спасибо за внимание, и будьте аккуратны, обращайте внимание на весь спектр входных значений ваших задач.

FAQ:

Почему не Typescript: потому что данная задача решается внутри библиотеки валидации данных, предназначенной для валидации данных, которые приходят из API. А в этой ситуации typescript ничего не гарантирует.
Сама библиотека валидации написана на Typescript. Но функции, валидации по умолчанию получают на вход значение типа unknown или any. Отсюда и появляется необходимость предполагать, что входное значение функции может быть любым значением javascript.
"Проблема не здесь, а там, где кидается массив там, где ожидается строка!"
Именно для этого и нужна валидация — для раннего нахождения ошибки)
Почему не используется includes в медленном алгоритме? Потому что мне не нужен медленный алгоритм, а то что он медленей более явно видно при использовании цикла, чем метода.
Почему ограничение на использование ES6? В библиотеке валидации я хотел бы избежать использования фишек, которые не имплементированы в старые браузеры, особенно если без них можно обойтись. Решение №3 полностью решает поставленную задачу, и не имеет проблем с совместимостью. Решение №4 требует использования полифилов, и не будет работать так же производительно. Хотя читается оно в разы и разы легче. Пруф производительности

Комментарии (67)

JustDont
24.07.2020 10:40
#21882592
+6
Шел 2020 год. Тайпскрипт всё так же был не нужен определенным кругам любителей кактуса.
1. andrewbeletskiy Автор
  24.07.2020 11:23
  #21882760
  Тайпскрипт не гарантирует, что API вернёт необходимую строку)
  1. dark_ruby
    24.07.2020 11:26
    #21882782
    -1
    я просто оставлю это здесь
    
    andrewbeletskiy Автор
    24.07.2020 11:35
    #21882840
    Вы правильно уловили суть того, где этот код применяется. На самом деле это проблема возникла в моей библиотеке валидации данных
  1. Eriy
    24.07.2020 12:21
    #21883032
    Тайпскрипт гарантирует ошибку при транспиллинге, если вы гдето указали что переменная является массивом а хотите использовать как строку. Тайпскрипт не гарантирует это если вы данные полученные из внешних источников не проверили и указали им не правильный тип.
    
    andrewbeletskiy Автор
    24.07.2020 12:37
    #21883114
    Typescript не кинет ошибку, если бекенд пришлёт невалидные данные.
    
    JustDont
    24.07.2020 14:39
    #21883666
    +1
    Что именно мешает вам валидировать данные бэка?
    
    andrewbeletskiy Автор
    24.07.2020 14:45
    #21883692
    Вы абсолютно правы! Именно это я и делаю. Опишу контекст последовательно:
    
    Backend может возвращать неверные данные
    Значит нужно валидировать эти даные
    Для валидации нужно использовать библиотеку для валидации данных
    В библиотеке валидации данных решается задача валидации набора строк.
    
    Эту задачу я тут и описал.
    
    Eriy
    24.07.2020 15:09
    #21883812
    Но здесь вы не валидировали тип входящего параметра (что должен быть строкой), а значит эта функция не предназначена уже для обработки данных которы пришли со вне и не были перед этим скастованы к соответсвующему типу/структуре.
    А если эта функция чисто для внутренего использования то Тайпскрипт отловит несоответсвия. Но опять же только если ктото просто насильно не указал что входящая переменная типа строка приэтом в реальности не скастовав это — ну или вобще не отключил стрикт моде в Тайпскрипте.
    
    andrewbeletskiy Автор
    24.07.2020 16:16
    #21884070
    Решение #3 валидирует тип как и должно — гарантирует что это строка из массива

arrakisfremen
24.07.2020 10:40
#21882596
+4
Ты не исправил ошибку. Потому что ошибка не здесь. А там, где получается массив тогда, когда ожидается строковое значение.
1. andrewbeletskiy Автор
  24.07.2020 11:22
  #21882754
  Эта задача как раз задача валидации и раннего нахождения подобной ошибки)

6095959
24.07.2020 10:43
#21882610
+1
VALID_STRINGS.includes(string) работает медленнее?
1. andrewbeletskiy Автор
  24.07.2020 11:23
  #21882764
  -2
  Можно и так, но я против пробега по массиву — и цикл в данном случае более ясно отображает линейную сложность алгоритма

steck
24.07.2020 10:55
#21882666
+3
Ээээ. Идея понятна, что надо проверять входные аргументы. Но зачем при этом завязываться на поведение JS? Как вообще может не возникнуть идеи сделать new Set(VALID_STRINGS)?
1. andrewbeletskiy Автор
  24.07.2020 11:26
  #21882786
  -4
  Хочу избежать использования полифилов для старых браузеров.

defaultvoice
24.07.2020 10:55
#21882670
А Array.includes чем не угодил?
1. andrewbeletskiy Автор
  24.07.2020 11:24
  #21882766
  -1
  Можно и так, но я против пробега по массиву — и цикл в данном случае более ясно отображает линейную сложность алгоритма

Antiproton
24.07.2020 11:27
#21882796
+4
Джаваскриптеры: мы не пишем на типизированных языках, потому что типы это сложно для понимания.

Тоже джаваскриптеры: держат типы всех объектов и параметров в голове, борются с неявными приведениями типов, пишут гору комментариев о типах, тонну тестов, чтобы проверить, что кривые типы не прилетят в функцию

Да, так гораздо проще и надежнее.
1. andrewbeletskiy Автор
  24.07.2020 11:28
  #21882804
  Мне нравится как вы сразу атакуете даже не зная контекста задачи. Проблема возникла внутри библиотеки для валидации данных с API. Где typescript просто не властен ничего сделать)
  1. Antiproton
    24.07.2020 11:38
    #21882852
    Как минимум, TS просто не даст вам запихнуть в функцию, принимающую строку, что-то кроме строки.
    
    И опять же, в JS есть уже готовый Set, хоть и убогий.
    
    Да и странный у вас API какой-то, раз вам оттуда прилетают уже готовые объекты JS, еще и разных типов.
    
    andrewbeletskiy Автор
    24.07.2020 11:50
    #21882896
    const { data: text } = await axios.get('https://some.api.com/valid-string') if (!test2(text)) { throw new Error('Invalid text') }
    
    Typescript не может гарантировать, что бекенд пришлёт необходимый тип.
    
    Antiproton
    24.07.2020 12:03
    #21882950
    А, ну земля TypeError'ом
    
    Akuma
    24.07.2020 12:05
    #21882958
    На самом деле чем долбаться с проверкой типов на клиенте, лучше сделать чтобы серверная часть выдавала либо ошибку, либо сразу правильный json. И не будет у вас проблем.
    
    andrewbeletskiy Автор
    24.07.2020 12:08
    #21882976
    Абсолютно согласен. Но когда нет контроля за API третьих лиц — только так и можно.
    
    Akuma
    24.07.2020 12:12
    #21882986
    Тогда вам просто нужно сделать
    
    const { data: text } = assertValid(await axios.get('https://some.api.com/valid-string'));
    
    И в assertValid проверять нужные типы.
    
    Я конечно не знаю что у вас там за проект, но мне кажется это очень редко где действительно нужно. Как правило с бекенда все приходит правильно и клиентская часть работает.
    В случае если придет что-то не то, у вас просто все отвалится. Причем есть у вас валидация или нет — все равно все отвалится.
    Получается, что includes() решает вашу проблему и не нужно больше ничего.
    
    andrewbeletskiy Автор
    24.07.2020 12:14
    #21882994
    Это не код проекта, это код библиотеки валидации(то что вы назвали функцией assertValid)
    
    Alexandroppolus
    24.07.2020 14:49
    #21883716
    В чём убогость Set?
    
    andrewbeletskiy Автор
    24.07.2020 14:57
    #21883752
    Так как я разрабатываю библиотеку валидации, я стараюсь сделать её как можно более широкой в использовании. И как можно более производительной.
    
    Если Set поддерживается браузером — то это хорошо, и его вполне можно и нужно использовать. Скорость проверки O(1)
    
    Но если не так, то Set заменяется полифилом. Производительность которого может быть гораздо ниже. (Я видел полифил, где это происходит за O(n), что мне точно не подходит)
    
    Другой вопрос — что для валидации строк — мне не обязательно нужен Set — и я вполне могу обойтись решением №3. Которое гарантированно быстро и корректно работает.
    
    andrewbeletskiy Автор
    24.07.2020 23:37
    #21885236
    К слову сказать по замерам на jsperf Решение №3 решение с объектом быстрее. https://jsperf.com/set-includes-object/1

amarao
24.07.2020 11:39
#21882856
+1
А почему бы не указать в качестве типа принимаегого значения строку? В этом случае при компиляции код, в который прилетает список вместо строки просто не скомпилируется.

Ах, да, в javascript нельзя указать тип принимаемого значения. Ну, мышки плакали, кололись, но продолжали кодить на JS.
1. andrewbeletskiy Автор
  24.07.2020 11:42
  #21882874
  Я ответил на ваш вопрос, в разделе FAQ
  1. amarao
    24.07.2020 11:47
    #21882890
    Я не понял вашего ответа. Возьмите язык программирования, который имеет строгую типизацию. Используйте библиотеку сериализации, которая поддерживает строгую сериализацию. Чем вам, например, не нравится serde? Более строгой десериализации я вообще не видел.
    
    https://serde.rs/json.html
    
    andrewbeletskiy Автор
    24.07.2020 12:50
    #21883152
    
    Взять другой язык — не решит проблему некорректности программы API с третьей стороны.
    
    Этот код и есть частью библиотеки валидации.
    
    amarao
    24.07.2020 14:51
    #21883724
    Валидация сторонних данных не требует написания дополнительного кода. Библиотека сериализации использует описание типов данных языка программирования для формирования схемы ожидаемых данных, если они оказываются не ожидаемыми, возвращается Err(), которую нельзя не обработать (не сойдутся типы).
    
    andrewbeletskiy Автор
    24.07.2020 16:18
    #21884078
    Это код из подобной библиотеки, задача как раз внутри такой библиотеки и возникает, в других проектах — это не нужно
    
    amarao
    24.07.2020 17:27
    #21884302
    +1
    Внутри такой библиотеки… Ну, давайте посмотрим, как они справляются с такой напастью...
    
    fn deserialize_str<V>(self, visitor: V) -> Result<V::Value, Error> where V: Visitor<'de>, { self.deserialize_string(visitor) }
    
    и вот
    
    fn deserialize_string<V>(self, visitor: V) -> Result<V::Value, Self::Error> where V: Visitor<'de>, { match self.content { Content::String(v) => visitor.visit_string(v), Content::Str(v) => visitor.visit_borrowed_str(v), Content::ByteBuf(v) => visitor.visit_byte_buf(v), Content::Bytes(v) => visitor.visit_borrowed_bytes(v), _ => Err(self.invalid_type(&visitor)), } }
    
    Неужели строгая типизация это так сложно? Ведь компилятор за вас думает. Остаётся только подбирать такую комбинацию кнопок, чтобы компилятор не ругался, и код правильный. Без ошибок типизации.
    
    andrewbeletskiy Автор
    24.07.2020 19:28
    #21884682
    Это не сложно) когда это строгая типизация была сложной?
    
    Другой вопрос что на фронте редко когда проект написан на подобном языке
    
    amarao
    25.07.2020 13:27
    #21886330
    (обычно сложности начинаются с higher order kindness, и типопараметрами для трейтов).
    
    Вот у меня и есть экзестенциальный вопрос: если на языках со строгой типизацией легче писать код без WTF, то почему все пишут на языках с WTF?
    
    andrewbeletskiy Автор
    25.07.2020 22:20
    #21887408
    Я писал интерпретатор на Haskell, так что для меня эти слова не новы, по крайней мере не страшны. Кайнды и классы типов(возможно нечто схожее с типопараметрами, но это не точно) идеи знакомые. Rust не пробовал.
    
    Во первых JavaScript плохо продуманный язык изначально. Но он не лишён плюсов.
    
    Он однозначно полезен для своих задач. Если бы у него не было бы плюсов, его бы давно заменили.
    
    Тем более, когда он пишется с помощью тайпскрипта.
    
    Конечно это не настолько строгие типы, и wtf возможен.
    
    Другой вопрос что для бизнеса выгодно выбирать наиболее распространенную технологию.

justhabrauser
24.07.2020 11:45
#21882888
+1
Итого статьи:
1. javascript — язык с динамической типизацией
2. это — подводный камень ©, потому что
3. может происходит неявное преобразование типов
4. поэтому типы данных желательно проверять
Всё верно?
PS. от меня всё еще ускользает смысл статьи — что такого неочевидного ("подводный камень"), то есть не описанного в документации по JS, было обнаружено?
1. andrewbeletskiy Автор
  24.07.2020 11:56
  #21882908
  Использование Javascript — одна из предпосылок статьи, так как он является дефакто стандартом веб разработки.
  Но дело не в его динамичности, а в способах гарантии валидности данных приходящих по сети. Какой бы язык я не выбрал для своей разработки, он не даст мне гарантий корректности чужой программы(Бекенда).
  Решение этой задачи необходимо внутри кода библиотеки валидации.
  1. Antiproton
    24.07.2020 12:02
    #21882944
    +1
    Ну так правильно. Но почему вы валидацию типов делаете уже в функциях, которые совершенно не связаны с валидацией этих самых типов?
    
    andrewbeletskiy Автор
    24.07.2020 12:43
    #21883128
    Вы правы.
    
    Дело как раз в том, что эта функция и есть та которая предназначалась для того, чтобы проверить тип. Такой как:
    
    type Role = 'Administrator' | 'User'

Eriy
24.07.2020 12:15
#21883000
Зря Вы так переусложнили:
— Вы уверены что поиск ключа объекта (ну и всей цепочки его прототипов) более быстро срабатывает как поиск на полное совпадение в статическом массиве? Тем более после разогрева.
— Array.includes всетаки более предпочтительно так как Вы явно подсказываете что там массив, и что Вы с ним хотите делать. Таким образом давая шанс движку сделать свои микрооптимизации. А также легче читается. А если вдруг ктото незнает что какая сложность у Array.includes то можно коммент добавить :)
1. andrewbeletskiy Автор
  24.07.2020 12:32
  #21883090
  Вы правы, в каждом конкретном случае это решение может быть медленее(если массив достаточно мал)
  
  Я не краду у оптимизатора возможность оптимизировать. Я меняю ту операцию, которую он должен оптимизировать с "проверка на наличие элемента в неизменном массиве" на "взятие по ключу в неизменном объекте"
  
  Думаю, что includes может быть оптимизирован до O(log N) или даже O(1), если он учтёт, что массив не меняется. Но предполагаю, что моё решение с изначальным O(log N) будет оптимизировано ещё больше.
  1. Eriy
    24.07.2020 14:50
    #21883720
    Когда вы запрашиваете значение с объекта по ключу, тем более динамического, это тот же самый поиск по массиву ключей. Причем здесь еще и по массиву ключей всех элементов цепочки прототипов. Что как подозреваю при любых n будит медленнее. Смысл тот что занимаясь микрооптимизацией нужно учитывать как работает каждая из операций. Кроме того внесли дополнительный неявный баг при значении как 'toString' и прочих которые не существуют в массиве но в имровизировани мап обекте они найдутся.
    
    andrewbeletskiy Автор
    24.07.2020 16:18
    #21884082
    Докажите что это не быстрее на примере)

RuGrof
24.07.2020 14:54
#21883740
+1
Если вдруг кто-то наткнётся на эту статью и решит использовать объект как Set, не прочитав другие статьи на эту тему, то не забывает использовать
```
Object.create(null)
```
чтоб удалить все дефолтные свойства объекта. А то там ещё немного камней оставили.
```
test = {};
!!test["constructor"] //=> true
```
1. andrewbeletskiy Автор
  24.07.2020 23:38
  #21885240
  Именно ваш пример с полем 'constructor' решается тем, что я сравниваю на строгое равенство с true.
  
  Спасибо за конструктивный комментарий — очень хороший совет. Решение №3 предполагает, что прототип объекта не будет загрязнен. Что в общем случае не верно.

APXEOLOG
24.07.2020 15:38
#21883920
Задача
Дан список строк: VALID_STRINGS.
Cоздать функцию валидации test(x) которая должна вернуть true, если x — это одна из строк в этом массиве.
Область применения: x — любое значение Javascript
Ограничения: Не использовать ES6. (Цель — старый браузер)

Самым простым решением, которое может быть — это пройтись по всем строкам в этом массиве и сравнить.
Это решение правильное, но медленное, потому что оно заставляет при каждом вызове функции пробегать по массиву в поисках совпадения
Простите, а чтобы положить все строки из списока в словарь, Вам не нужно по нему пробегать? В вашей задаче явно указано, что на вход приходит список, а не словарь. Также нигде в условии задачи не указано, что вам нужно оптимизировать многократную проверку на одном и том же массиве.

Как по мне — ваше решение указанной в статье задачи является переусложненным
1. andrewbeletskiy Автор
  24.07.2020 22:07
  #21885066
  -1
  Статья скорее про баг, чем про решение задачи.
  
  Я встретил баг, который я сразу не предвидел, что называется "подводный камень"
  
  И решил о нем рассказать, дело даже не в задаче, оригинальная задача требует именно наибольшего перформанса.
  
  Моя ошибка была в том, что я предположил, что если я создаю объект с ключами строками равными true, то только эти строки будучи используемы как ключи дадут ожидаемый результат.
  
  Что оказалось не правдой.
  
  Поэтому я статью и написал

AriesUa
24.07.2020 16:19
#21884084
Разрушу вашу иллюзию, что поиск атрибута в объекте будет быстрее чем поиск елемента в массиве.

Создайте объект с 50 атрибутами
const obj = {a: true, b: true, c: true, ...};

Далее создайте массив с ключами
const arr = ['a', 'b', 'c', ...];

Теперь запустите в консоли
console.time('obj'); console.log(obj['c'] === true); console.timeEnd('obj');

а потом и для массива
console.time('arr'); console.log(arr.includes('c')); console.timeEnd('arr');

И вуаля! Скорость почти одинакова!

На вопрос почему так. Полагаю что дело в HashMap таблицах под капотом в движке. Но это не точно :)

PS заранее извиняюсь, что нет решения для старых браузеров. Просто хотел обратить внимание, что объект как ключ возможно не улучшит перформанс.
1. andrewbeletskiy Автор
  24.07.2020 21:47
  #21885022
  Интересный пример, а попробуйте замерить тот ключ который отсутствует
  1. AriesUa
    24.07.2020 22:35
    #21885126
    Только что замерил. Практически одно и тоже время, как проверка по ключу, так и поиск в массиве.
    
    Я когда-то тоже так делал, как автор статьи. Заводил индексный объект, как я его тогда называл. Думал, что перфоманс будет улучшен. И вот в один день я проводил лекцию для джунов, где делился всякими фишками по JS. Ну и типа что бы показать, что можно улучшить, сделал такой тестовый пример. И когда замерил — ой! Реально был удивлен. Так что профита такой подход особо не приносит, и я от него отказался в последствии.
    
    Хотя, надо на досуге покопать. Может можно как-то заставить это работать быстрее.
    
    andrewbeletskiy Автор
    24.07.2020 23:33
    #21885232
    У меня есть подозрения что вы немного преждевременно делаете выводы.
    
    Гляньте на эти замеры. У меня вообще вышло что Решение №3 самое быстрое.
    
    JustDont
    25.07.2020 11:51
    #21886074
    
    Такие результаты вполне однозначно говорят о том, что проверки объекта соптимизировало до констант, только и всего.
    
    Не пытайтесь делать далеко идущие выводы о скорости js, запуская какие-то синтетические тесты, не похожие по данным и принципам выполнения на вашу реальность.
    
    andrewbeletskiy Автор
    25.07.2020 12:06
    #21886112
    Одно дело, когда оценка временной сложности сомнительна, и есть какие то поводы полагать обратного. Но не так в нашем случае.
    
    С одной стороны, замеры скорее подтверждают, что массив это О(n), а объект О(1) или О(logN).
    
    С другой стороны, существенных доказательств обратного я не увидел.
    
    Но предположим, что массив будет оптимизирован до константы или логарифма, это всё равно не сделает его более подходящим для этой операции, ведь объект гораздо более будет ускорен, ведь у него изначально сложность константа (или логарифм).
    
    JustDont
    25.07.2020 12:09
    #21886122
    С одной стороны, замеры скорее подтверждают, что массив это О(n), а объект О(1) или О(logN)
    
    Почему вы упорно продолжаете игнорировать Set, который как раз и должен быть O(1)?
    
    С другой стороны, существенных доказательств обратного я не увидел.
    
    Если для вас не является существенным, что согласно этим тестам объект почему-то на порядок производительнее сета — ну, удачи продолжать в том же духе. В конце концов такие заявления не фальсифицируемы, говорить «не вижу существенных доказательств, почему Юпитер в третьем доме не может ускорить мой код» — не возбраняется.
    
    andrewbeletskiy Автор
    25.07.2020 12:15
    #21886136
    Очень просто:
    
    Если Set в браузере имплементирован, Set выдаст результат асимптотически не быстрее чем решение с объектом.
    
    Если Set в браузере нет, то Set(полифил) выдаст результат в наилучшем случае, со скоростью объекта.
    
    Те замеры, на мой взгляд дают мне право выбрать решение с объектом, которое не хуже справляется с моей задачей в современных браузерах, и справляется лучше на старых.
    
    (А так как я пишу библиотеку для меня важно, чтобы поддержка библиотеки и её производительности была на многих браузерах)
    
    JustDont
    25.07.2020 12:21
    #21886162
    Если он в браузере имплементирован, он не выдаст результат асимптотически быстрее чем решение с объектом.
    
    Господи боже мой. Вам показывают картинку, на которой некий показывающий погоду на Марсе «бенчмарк» выдаёт якобы десятикратный перевес объекта над сетом, а вы в ответ пишете «он (сет) не выдаст результат асимптотически быстрее, чем решение с объектом». Автор, вы вообще читаете, что вы пишете?
    
    Вам пишут, что «тесты» на которые вы ссылаетесь — фуфло, потому что выдают фуфловые результаты, вы в ответ излагаете какое-то фентези на тему «почему я не взял сет», которое к обсуждаемому вопросу отношения не имеет.
    
    Не нужно вообще ссылаться на какие-то замеры производительности, если с первого взгляда понятно, что эти замеры замеряют непонятно что.
    
    andrewbeletskiy Автор
    25.07.2020 12:39
    #21886204
    Вы же понимаете, что просто сказать, что тесты — фуфло, не предоставив доказательств — не аргумент. И вы ещё осуждаете меня за то, что я не верю вам на слово, на мой взгляд преждевременно и несколько напыщенно.
    
    Те доказательства, которые вы привели — замер на малых числах при не наихудших условиях, который показывает сравнимую производительность в таких условиях(с чем я полностью согласен), но отнюдь не ассимптотику времени выполнения на этих структурах данных.
    
    Бросаю вызов: скиньте хоть какое то исследование или тест, которые покажут, что неизменный объект с константным количеством прототипов в цепочке выдает не константное время взятия по ключу. И что в этих же условиях Set выдаст константную ассимптотику.
    
    Вы утверждаете, что я глуп в своих суждениях, но не представляете аргументов, помимо вашего собственного мнения — не надо так)
    
    JustDont
    25.07.2020 12:41
    #21886212
    Мне вообще сугубо не интересно, может ли Set быть быстрее объекта в некоторой академической ситуации. Я, еще раз, уже третий пост говорю о гораздо более простой вещи: не надо ссылаться на бенчмарк, который показывает погоду на Марсе.
    
    andrewbeletskiy Автор
    25.07.2020 17:41
    #21886816
    Мой выбор опирается не на бенчмарки, хотя они его и поддерживают.
    
    Мой выбор опирается на то, что внутри объекта, равно как и внутри Set'a используется хештаблица. Которая даёт константный доступ к ключу.
    
    А внутри массива — структура данных массив. С линейным алгоритмом проверки на наличие(не сомневаюсь, что оптимизатор может оптимизировать и до логарифма и до константы).
1. Alexandroppolus
  24.07.2020 23:27
  #21885224
  На 50 значениях разницу не заметить. Попробуйте на 100000, например. Асимптотике нужен простор, чтобы себя показать. И да, искать что-нибудь, что находится хотя бы в середине массива, или, как посоветовал автор, то чего нет. Третье по счету значение всегда будет мгновенно находиться :)
  1. andrewbeletskiy Автор
    24.07.2020 23:34
    #21885234
    Абсолютно согласен
  1. AriesUa
    25.07.2020 12:17
    #21886142
    Посыпаю голову пеплом. Был не прав. На малых выборка, до 1000 время почти одинаковое. Но выше 100 тысяч результат уже заметно отличается.

Внимание, подводный камень -18

Задача

Решение №1: Решение в лоб

Решение №2: Словарь

Берегись! Подводный камень!

Решение №3: С дополнительной проверкой

Решение №4: Set

Вывод

FAQ:

Комментарии (67)

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор

andrewbeletskiy Автор