В основу статьи легли мои собственные выработанные нелегким путем знания о принципах работы и правильном использовании целых чисел в C/C++. Помимо самих правил, я решил привести список распространенных заблуждений и сделать небольшое сравнение системы целочисленных типов в нескольких передовых языках. Все изложение строилось вокруг баланса между краткостью и полноценностью, чтобы не усложнять восприятие и при этом отчетливо передать важные детали.
Всякий раз, когда я читаю или пишу код на C/C++, мне приходится вспоминать и применять эти правила в тех или иных ситуациях, например при выборе подходящего типа для локальной переменной/элемента массива/поля структуры, при преобразовании типов, а также в любых арифметических операциях или сравнениях. Обратите внимание, что типы чисел с плавающей запятой мы затрагивать не будем, так как это большей частью относится к анализу и обработке ошибок аппроксимации, вызванных округлением. В противоположность этому, математика целых чисел лежит в основе как программирования, так и компьютерной науки в целом, и в теории вычисления здесь всегда точны (не считая проблем реализации вроде переполнения).
Типы данных
Базовые целочисленные типы
Целочисленные типы устанавливаются с помощью допустимой последовательности ключевых слов, взятых из набора
{char, short, int, long, signed, unsigned}
.Несмотря на то, что битовая ширина каждого базового целочисленного типа определяется реализацией (т.е. зависит от компилятора и платформы), стандартом закреплены следующие их свойства:
char
: минимум 8 бит в ширину;short
: минимум 16 бит и при этом не меньшеchar
;int
: минимум 16 бит и при этом не меньшеshort
;long
: минимум 32 бит и при этом не меньшеint
;long long
: минимум 64 бит и при этом не меньшеlong
.
Наличие знака
- Стандартный
сhar
может иметь знак или быть беззнаковым, что зависит от реализации. - Стандартные
short
,int
,long
иlong long
идут со знаком. Беззнаковыми их можно сделать, добавив ключевое словоunsigned
. - Числа со знаком можно кодировать в двоичном формате в виде дополнительного кода, обратного или как величину со знаком. Это определяется реализацией. Заметьте, что обратный код и величина со знаком имеют различные шаблоны битов для отрицательного нуля и положительного, в то время как дополнительный код имеет уникальный нуль.
- Символьные литералы (в одинарных кавычках) имеют тип (
signed
)int
в C, но (signed
илиunsigned
)char
в C++.
Дополнительные правила
sizeof(char)
всегда равен 1, независимо от битовой шириныchar
.- Битовая ширина не обязательно должна отличаться. Например, допустимо использовать
char
,short
иint
, каждый шириной в 32 бита. - Битовая ширина должна быть кратна 2. Например,
int
может иметь ширину 36 бит. - Есть разные способы написания целочисленного типа. К примеру, в каждой следующей строке перечислен набор синонимов:
int
,signed
,signed int
,int signed
;short
,short int
,short signed
,short signed int
;unsigned long long
,long unsigned int long
,int long long unsigned
.
Типы из стандартных библиотек
size_t
(определен в stddef.h) является беззнаковым и содержит не менее 16 бит. При этом не гарантируется, что его ширина будет как минимум равнаint
.ptrdiff_t
(определен в stddef.h) является целочисленным типом со знаком. Вычитание двух указателей будет давать этот тип. При этом не стоит ожидать, что вычитание двух указателей дастint
.- В stdint.h определена конкретная ширина типов:
uint8_t
,int8_t
,16
,32
и64
. Будьте внимательны к операциям, подразумевающим продвижение типов. Например,uint8_t + uint8_t
дастint
(со знаком и шириной не менее 16 бит), а неuint8_t
, как можно было предположить.
Преобразования
Представим, что значение исходного целочисленного типа нужно преобразовать в значение целевого целочисленного типа. Такая ситуация может возникнуть при явном приведении, неявном приведении в процессе присваивания или при продвижении типов.
Как происходит преобразование?
Главный принцип в том, что, если целевой тип может содержать значение исходного типа, то это значение семантически сохраняется.
Говоря конкретнее:
- Когда исходный тип расширяется до целевого типа с аналогичной знаковой характеристикой (например,
signed char -> int
илиunsigned short -> unsigned long
), каждое исходное значение после преобразования сохраняется. - Даже если исходный и целевой типы имеют разные диапазоны, все значения в их пересекающейся части будут сохранены. Например,
int
, содержащий значение в диапазоне[0, 255]
, будет без потерь преобразован вunsigned char
.
В более точной форме эти правила звучат так:
- При преобразовании в беззнаковый тип новое значение равняется старому значению по модулю 2целевая ширина в битах. Объяснение:
- Если исходный тип беззнаковый и шире целевого, тогда старшие биты отбрасываются.
- Если исходный тип имеет знак, тогда в процессе преобразования берется исходное значение, и из него/к нему вычитается/прибавляется 2целевая ширина в битах до тех пор, пока новое значение не впишется в диапазон целевого типа. Более того, если число со знаком представлено в дополнительном коде, то в процессе преобразования старшие биты отбрасываются, как и в случае с беззнаковыми числами.
- В случае преобразования в тип со знаком случаи могут быть такими:
- Если исходное значение вписывается в диапазон целевого типа, тогда процесс преобразования (например, расширение знака) производит целевое значение, семантически равное исходному.
- Если же оно не вписывается, тогда поведение будет определяться реализацией и может вызвать исключение (к примеру, прерывание из-за переполнения).
Арифметика
Продвижение/преобразование
- Унарный арифметический оператор применяется только к одному операнду. Примеры:
-
,~
. - Бинарный оператор применяется к двум операндам. Примеры:
+
,*
,&
.<<
. - Если операнд имеет тип
bool
,char
илиshort
(какsigned
, так иunsigned
), тогда он продвигается доint
(signed
), еслиint
может содержать все значения исходного типа. В противном случае он продвигается доunsigned int
. Процесс продвижения происходит без потерь. Примеры:
- В реализации присутствуют 16-битный
short
и 24-битныйint
. Если переменныеx
иy
имеют типunsigned short
, то операцияx & y
продвигает оба операнда доsigned int
. - В реализации присутствуют 32-битный
char
и 32-битныйint
. Если переменныеx
иy
имеют типunsigned char
, то операцияx – y
продвигает оба операнда доunsigned int
.
- В реализации присутствуют 16-битный
- В случае двоичных операторов оба операнда перед арифметической операцией неявно преобразуются в одинаковый общий тип. Ранги преобразования возрастают в следующем порядке:
int
,long
,long long
. Рангом общего типа считается старший ранг среди типов двух операндов. Если оба операнда являютсяsigned/unsigned
, то их общий тип будет иметь ту же характеристику. Если же операнд с беззнаковым типом имеет старший или равный ранг по отношению ко второму операнду, то их общий тип будет беззнаковым. В случае, когда тип операнда со знаком может представлять все значения другого типа операнда, общий тип будет иметь знак. В противном случае общий тип получается беззнаковым. Примеры:
(long) + (long) > (long)
;(unsigned int) * (int) > (unsigned int)
;(unsigned long) / (int) > (unsigned long)
;- если
int
является 32-битным, а long 64-битным:(unsigned int) % (long) > (long)
; - если
int
иlong
оба являются 32-битными:(unsigned int) % (long) > (unsigned long)
.
Неопределенное поведение
Знаковое переполнение:
- При выполнении арифметических операций над целочисленным типом переполнение считается неопределенным поведением (UB). Такое поведение может вызывать верные, несогласованные и/или неверные действия как сразу, так и в дальнейшем.
- При выполнении арифметики над беззнаковым целым (после продвижений и преобразований) любое переполнение гарантированно вызовет оборот значения. Например,
UINT_MAX + 1 == 0
. - Выполнение арифметики над беззнаковыми целыми фиксированного размера может привести к едва уловимым ошибкам. Например:
- Пусть
uint16_t = unsigned short
, иint
равен 32-битам. Тогдаuint16_t x=0xFFFF
,y=0xFFFF
,z=x*y
;x
иy
будут продвинуты доint
, иx * y
приведет к переполнениюint
, вызвав неопределенное поведение. - Пусть
uint32_t = unsigned char
, иint
равен 33-битам. Тогдаuint32_t x=0xFFFFFFFF
,y=0xFFFFFFFF
,z=x+y
;x
иy
будут продвинуты доint
, иx + y
приведет к переполнениюint
, то есть неопределенному поведению. - Чтобы обеспечить безопасную арифметику с беззнаковыми целыми, нужно либо прибавить
0U
, либо умножить на1U
в качестве пустой операции. Например:0U + x + y
или1U * x * y
. Это гарантирует, что операнды будут продвинуты как минимум до рангаint
и при этом останутся без знаков.
- Пусть
Деление/остаток:
- Деление на нуль и остаток с делителем нуля также относятся к неопределенному поведению.
- Беззнаковое деление/остаток не имеют других особых случаев.
- Деление со знаком может вызывать переполнение, например
INT_MIN / -1
. - Остаток со знаком при отрицательных операндах может вызывать сложности, так как некоторые части являются однообразными, в то время как другие определяются реализацией.
Битовые сдвиги:
- Неопределенным поведением считается битовый сдвиг (< < и >>) на размер, который либо отрицателен, либо равен или больше битовой ширины.
- Левый сдвиг беззнакового операнда (после продвижения/преобразования) считается определенным правильно и отклонений в поведении не вызывает.
- Левый сдвиг операнда со знаком, содержащего неотрицательное значение, вследствие которого 1 бит переходит в знаковый бит, является неопределенным поведением.
- Левый сдвиг отрицательного значения относится к неопределенному поведению.
- Правый сдвиг неотрицательного значения (в типе операнда без знака или со знаком) считается определенным правильно и отклонений в поведении не вызывает.
- Правый сдвиг отрицательного значения определяется реализацией.
Счетчик цикла
Выбор типа
Предположим, что у нас есть массив, в котором нужно обработать каждый элемент последовательно. Длина массива хранится в переменной
len
типа T0
. Как нужно объявить переменную счетчика цикла i
типа T1
?- Самым простым решением будет использовать тот же тип, что и у переменной длины. Например:
uint8_t len = (...);
for (uint8_t i = 0; i < len; i++) { ... }
- Говоря обобщенно, переменная счетчика типа
T1
будет работать верно, если диапазонT1
будет являться (не строго) надмножетсвом диапазонаT0
. Например, еслиlen
имеет типuint16_t
, тогда отсчет с использованиемsigned long
(не менее 32 бит) сработает. - Говоря же более конкретно, счетчик цикла должен просто покрывать всю фактическую длину. Например, если
len
типаint
гарантированно будет иметь значение в диапазоне[3,50]
(обусловленное логикой приложения), тогда допустимо отсчитывать цикл, используяchar
без знака или со знаком (в котором однозначно можно представить диапазон[0,127]
). - Нежелательно использовать переменную длины и переменную счетчика с разной знаковостью. В этом случае сравнение вызовет неявное сложное преобразование, сопровождаемое характерными для платформы проблемами. К примеру, не стоит писать такой код:
size_t len = (...); // Unsigned
for (int i = 0; i < len; i++) { ... }
Отсчет вниз
Для циклов, ведущих отсчет вниз, более естественным будет использовать счетчик со знаком, потому что тогда можно написать:
for (int i = len - 1; i >= 0; i--) {
process(array[i]);
}
При этом для беззнакового счетчика код будет таким:
for (unsigned int i = len; i > 0; i--) {
process(array[i - 1]);
}
Примечание: сравнение
i >= 0
имеет смысл только, когда i
является числом со знаком, но всегда будет давать true
, если оно будет беззнаковым. Поэтому, когда это выражение встречается в беззнаковом контексте, значит, автор кода скорее всего допустил ошибку в логике. Заблуждения
Все пункты приведенного ниже списка являются мифами. Не опирайтесь на эти ложные убеждения, если хотите писать корректный и портируемый код.
char
всегда равен 8 битам.int
всегда равен 32 битам.sizeof(T)
представляет число из 8-битных байтов (октетов), необходимых для хранения переменной типаT
. (Это утверждение ложно, потому что если, скажем,char
равняется 32 битам, тогдаsizeof(T)
измеряется в 32-битных словах).- Можно использовать
int
в любой части программы и игнорировать более точные типы вродеsize_t
,uint32_t
и т.д. - Знаковое переполнение гарантированно вызовет оборот значения. (например,
INT_MAX + 1 == INT_MIN
). - Символьные литералы равны их значениям в коде ASCII, например
‘A’ == 65
. (Согласно EBCDIC это утверждение ложно). - Преобразование указателя в
int
и обратно в указатель происходит без потерь. - Преобразование
{указателя на один целочисленный тип}
в{указатель на другой целочисленный тип}
безопасно. Например,int *p (…); long *q = (long*)p;
. (см. каламбур типизации и строгий алиасинг). - Когда все операнд(ы) арифметического оператора (унарного или бинарного) имеют беззнаковые типы, арифметическая операция выполняется в беззнаковом режиме, никогда не вызывая неопределенного поведения, и в результате получается беззнаковый тип. Например: предположим, что
uint8_t x; uint8_t y; uint32_t z;
, тогда операцияx + y
должна дать тип вродеuint8_t
, беззнаковыйint
, или другой разумный вариант, а+z
по-прежнему будетuint32_t
. (Это не так, потому что при продвижении типов предпочтение отдается типам со знаком).
Моя критика
- Если вкратце, то знание и постоянное использование всех этих правил сильно нагружает мышление. Допущение же ошибки в их применении приводит к риску написания неверного или непортируемого кода. При этом такие ошибки могут как всплыть сразу, так и таиться в течение дней или даже долгих лет.
- Сложности начинаются с битовой ширины базовых целочисленных типов, которая зависит от реализации. Например,
int
может иметь 16, 32, 64 бита или другое их количество. Всегда нужно выбирать тип с достаточным диапазоном. Но иногда использование слишком обширного типа (например, необычного 128-битногоint
) может вызвать сложности или даже внести уязвимости. Усугубляется это тем, что такие типы из стандартных библиотек, какsize_t
, не имеют связи с другими типами вроде беззнаковогоint
илиuint32_t
; стандарт позволяет им быть шире или уже. - Правила преобразования совершенно безумны. Что еще хуже, практически везде допускаются неявные преобразования, существенно затрудняющие аудит человеком. Беззнаковые типы достаточно просты, но знаковые имеют очень много допустимых реализаций (например, обратный код, создание исключений). Типы с меньшим рангом, чем
int
, продвигаются автоматически, вызывая труднопонимаемое поведение с диапазонами и переполнение. Когда операнды отличаются знаковостью и рангами, они преобразуются в общий тип способом, который зависит от определяемой реализацией битовой ширины. Например, выполнение арифметики над двумя операндами, как минимум один из которых имеет беззнаковый тип, приведет к преобразованию их обоих либо в знаковый, либо в беззнаковый тип в зависимости от реализации. - Арифметические операции изобилуют неопределенным поведением: знаковое переполнение в
add/sub/mul/div
, деление на нуль, битовые сдвиги. Несложно создать такие условия неопределенного поведения по случайности, но сложно вызвать их намеренно или обнаружить при выполнении, равно как выявить их причины. Необходима повышенная внимательность и усилия для проектирования и реализации арифметического кода, исключающего переполнение/UB. Стоит учитывать, что впоследствии становится сложно отследить и исправить код, при написании которого не соблюдались принципы защиты от переполнения/UB. - Присутствие
signed
иunsigned
версии каждого целочисленного типа удваивает количество доступных вариантов. Это создает дополнительную умственную нагрузку, которая не особо оправдывается, так как типы со знаком способны выполнять практически все те же функции, что и беззнаковые. - Ни в одном другом передовом языке программирования нет такого числа правил и подводных камней касательно целочисленных типов, как в С и C++. Например:
- В Java целые числа ведут себя одинаково в любой среде. В этом языке определено конкретно 5 целочисленных типов (в отличие от C/C++, где их не менее 10). Они имеют фиксированную битовую ширину, практически все из них имеют знаки (кроме
char
), числа со знаком должны находиться в дополнительном коде, неявные преобразования допускают только их варианты без потерь, а вся арифметика и преобразования определяются точно и не вызывают неоднозначного поведения. Целочисленные типы в Java поддерживают быстрое вычисление и эффективное упаковывание массивов в сравнении с языками вроде Python, где есть толькоbigint
переменного размера. - Java в значительной степени опирается на 32-битный тип
int
, особенно для перебора массивов. Это означает, что этот язык не может эффективно работать на малопроизводительных 16-битных ЦПУ (часто используемых во встраиваемых микроконтроллерах), а также не может непосредственно работать с большими массивами в 64-битных системах. К сравнению, C/C++ позволяет писать код, эффективно работающий на 16, 32 и/или 64-битных ЦПУ, но при этом требует от программиста особой осторожности. - В Python есть всего один целочисленный тип, а именно
signed bigint
. В сравнении с C/C++ это сводит на нет все рассуждения на тему битовой ширины, знаковости и преобразований, так как во всем коде правит один тип. Тем не менее за это приходится платить низкой скоростью выполнения и несогласованным потреблением памяти. - В JavaScript вообще нет целочисленного типа. Вместо этого в нем все выражается через математику
float64
(double
в C/C++). Из-за этого битовая ширина и числовой диапазон оказываются фиксированными, числа всегда имеют знаки, преобразования отсутствуют, а переполнение считается нормальным. - Язык ассемблера для любой конкретной машинной архитектуры (x86, MIPS и т.д.) определяет набор целочисленных типов фиксированной ширины, арифметические операции и преобразования – с редкими случаями неопределенного поведения или вообще без них.
- В Java целые числа ведут себя одинаково в любой среде. В этом языке определено конкретно 5 целочисленных типов (в отличие от C/C++, где их не менее 10). Они имеют фиксированную битовую ширину, практически все из них имеют знаки (кроме
Дополнительная информация (англ.)
- Wikipedia: C data types
- cppreference.com: C++ — Fundamental types
- cppreference.com: C — Implicit conversions — Integer conversions
- cppreference.com: C — Implicit conversions — Usual arithmetic conversions
- C in a Nutshell: Chapter 4. Type Conversions
- Stack Overflow: Implicit type promotion rules
- Stack Overflow: 32 bit unsigned multiply on 64 bit causing undefined behavior?
- Stack Overflow: What’s the best C++ way to multiply unsigned integers modularly safely?
- Stack Overflow: Is masking before unsigned left shift in C/C++ too paranoid?
dvserg
Если Вы не пишете аппаратно-зависимый софт, то этого всего Вы скорее всего не встретите. Стандартные библиотеки написаны максимально безопасным способом, чтобы при обычном использовании не возникало описанных проблем.
А если Вы делаете что-то на уровне битового представления типов, то обычно это делаете под конкретную платформу, либо реализуете это с применением приемов адаптации под другие платформы.
KanuTaH
Ну в целом да, всякие 32-битные char'ы и 33-битные int'ы в повседневной жизни встретить довольно сложно, но про всякие подводные камни типа «перемножение двух беззнаковых типов размером меньше чем int способно привести к signed overflow из-за integer promotion» знать все-таки нужно, такое вполне может встретиться в реальной жизни.
dlinyj
Все эти неприятности возникают при переносе кода, особенно с какого-нить старого 16-ти битного арма на 64-х битный.
khim
А что за 16-битный ARM? Может 26-битный? Но там вроде никаких особых страстей всё равно не было.
apro
Ну некоторые моменты никак библиотекой не спрячешь. Например, в результате вызова std::abs можно получить отрицательное число на любой платформе. А уж сколько было уязвимостей из-за целочисленное переполнения и сколько еще будет.
Tujh
Serge3leo
Хм, что может быть Вам интересно, как раз для std::abs(INT8_MIN) и std::abs(INT16_MIN) не просто так выявить их отрицательную сущность, ни в на печати, ни в сравнениях. Ввиду изложенного в статье «std::cout << std::abs(INT8_MIN)» напечатает «128»! А вот «std::cout << std::abs(INT64_MIN)» напечатает отрицательное число.
Tujh
Ну то есть речь идёт всё же ровно об одном пограничном случае м xxx_MIN. ОК.
Serge3leo
Проблема не столько в пограничном случае, хотя кто-то может быть искренне уверен в assert(std::abs(zz) >= 0), а это зависит.
Сколько ещё в нескольких тонкостях. Скажем, Вы понимаете, что и почему напечатает: ` std::cout << std::abs(INT8_MIN) << std::abs(INT16_MIN) << std::abs(INT32_MIN) << std::abs(INT64_MIN) '?
stephanthe
Я, к своему стыду, абсолютно не понимаю. Можно ткнуть носом, что почитать для понимания?
Serge3leo
C++20: 26.8.2 Absolute values
C17: 7.22.6 Integer arithmetic functions
C17: 7.20.2.1 Limits of exact-width integer types
C++20: 6.8.4 Integer conversion rank
C++20: 7.3.6 Integral promotionsп
Первое значение «std::cout << std::abs(INT8_MIN)» — строго полностью определённое поведение, последнее значение «std::cout << std::abs(INT64_MIN)», на подавляющем числе систем, строго неопределённое поведение.
Tujh
Но, опять же, эксплуатация ровно одного пограничного случая.
Serge3leo
Хм, да, понимаете? А это ничего, что INT8_MIN и INT16_MIN — имеют тип int? А std::abs() перегружен по трём типам аргумента int/long/long long? В C++/C, увы, трудно быть хоть в чём-то полностью уверенным.
А так, да, С++20 ссылается на C17, а в C17 для abs(), labs() и llabs(), прописано, что если результат не может быть представлен, то поведение неопределённое (с отдельным напоминанием за наименьшее целое, в случае, дополнительной арифметики). Ну, а в других функциях могут быть свои заморочки.
Tujh
Serge3leo
Насчёт любой, это ж вряд ли, ещё существуют калькуляторы без дополнительного кода.
khim
А C-то на них существует? Насколько я знаю C поддерживается только на горсточке очень новых калькуляторов и там везде 32-битные процессоры. ARM, MC68000, SH-3…
Serge3leo
В каком-нибудь военном/ядерном/авиационном/космическом вычислителе можно нарваться на арифметику с поглощением (а ля x86/x64 SIMD/OpenCL) или на модульную арифметику для быстрых вариантов целых типов.
Или, как вариант, какая-нибудь военная/ядерная/авиационная/космическая libc выдаст иной вариант неопределённого поведения, отличный от типичного std::abs(INT64_MIN) == llabs(INT64_MIN) == INT64_MIN
khim
А, вы сюжет для фантастического романа обсуждаете, не реальный мир.
Я, в принципе, не против фантастики, но предпочитаю её обсуждать в отдельных темах.
Serge3leo
В стандарте написано — неопределённое поведение, а неопределённое поведение это не только отрицательное значение std:abs(). Если бы всё было бы так однозначно, в стандарте бы так и написали: llabs(INT64_MIN) == INT64_MIN. С арифметикой — аналогично.
Я вполне себе могу представить компилятор, который операции с int16_t не векторизует, т.к. стандарт требует для них дополнительной арифметики, а int_fast16_t векторизует.
khim
Причём тут
std:abs
, извините? Представление чисел важно не только дляstd:abs
, но и для банальногоa = b;
. Тут нет неопределённого поведения при любом целочисленномa
и любом целочисленномb
.Serge3leo
Ну, началось же с: «Ну некоторые моменты никак библиотекой не спрячешь. Например, в результате вызова std::abs можно получить отрицательное число на любой платформе.» от apro
Так же, разрешите напомнить, что в стандарте C17, на который ссылается C++20, указано «The abs, labs, and llabs functions compute the absolute value of an integer j. If the result cannot be represented, the behavior is undefined.»
Для некоторых, редких, вариантов реализаций int/long/long long, такая ситуация неопределённого поведения невозможна, так же как для некоторых, редких, компиляторов/библиотек это неопределённое поведение может быть нетипичным.
Кроме того, какие фокусы, бывает, выкидывают современные оптимизирующие компиляторы для программ с неопределённым поведением, наверное, не мне Вам рассказывать.
Tujh
Serge3leo
Это почему это нельзя?! Для кого IEEE-754 (ISO/IEC/IEEE 60559) пишут? В данном случае можно, т.к. 1.5, 2.0 и 3.0 имеют точное представление. Конечно, по хорошему надо поставить static_assert на __STDC_IEC_559__/__GCC_IEC_559 и несколько ещё вариантов.
Эх, было время, я длинное целое умножение/деление на плавающем сопроцессоре делал.
Знать как нельзя, это действительно большое достижение, многие даже и не знают, но некоторым бывает интересен ответ на вопрос почему.
Tujh
Опять рассматриваем частный случай? ОК, даже если так, перефразирую вопрос, почему следующая функция не корректна
Serge3leo
Конечно, для C/C++ немного странная функция, аргументы float, но зависит от программы.
И нет, и это не частный, случай. В предыдущем тезисе Вы, по-моему, так и не выделили три различные проблемы, а свалили всё в одну кучу.
А здесь, так это вообще множество общих случаев.
Просто к ошибкам округления, как и ко всему остальному, стоит подходить с пониманием. Есть алгоритмы, когда их можно считать случайными. Есть алгоритмы в которых их следует учитывать для правильного выбора констант разложений и т.п. (0.125 — точно, 0.1 — неточно, /10 — точно). Есть алгоритмы, где они «самоуничтожаются» (скажем, Кнут т. 2, s = a + b; e = b — (s — a);). А есть алгоритмы где их вообще не возникает.
Tujh
Понятно, теоретик. Так и запишем.
Serge3leo
Хм, художника всякий обидеть норовит?! Я бы это назвал, практик, вычислитель, вычислительная математика она ж такая. У меня есть все виды перечисленных выше программ, которые работают много много лет.
И да, в юнит-тестах, регрессионных тестах, а так же в тестах самотестирования на объекте, double сравниваются на равенство. Что б поймать за руку какого-нибудь молодого, да раннего, инженера по сборке, если он накосячит. Или сторонний модуль, если он что-то в настройках FPU изменит.
Tujh
github.com/google/googletest/blob/master/docs/advanced.md#floating-point-comparison
они ссылаются сюда
randomascii.wordpress.com/2012/02/25/comparing-floating-point-numbers-2012-edition
Уверен, что вы читали эту статью или подобную, но ответ:
как раз и написал математиком-теоретиком, а не программистом-практиком, или прагматиком, если хотите.
Serge3leo
Я не хочу никого обидеть, но это мурзилки для тех, кто прогуливал уроки в школе. Которые, к тому же, желают вместо понимания IEEE-754, С17, С++20, неких магических ритуалов.
Грубо говоря,
Совершенно не требует «улучшайзинга». ;) Если в контексте уместно, то вместо «i < sqrt(n)» столь же корректно написать «i != sqrt(n)» ;) Если n < 252, конечно, но компьютеры с памятью больше 255, есть только у китайцев. ;) И таких примеров вагон и маленькая тележка.
warlock13
Сравнивать на равенство нужно, например, чтобы определить, надо ли сериализить значение или оно дефолтное.
Tujh
вещественные числа сравнивать на равенство нельзя, в общем случае.
Serge3leo
Хм, а ещё станцевать танец отпугивания злых духов и трижды перекреститься. (Да, std::abs() ещё ж забыли...) И получить, в результате, некорректный код.
Заметьте: «или оно дефолтное»!
Нет, ну если процессорного времени вагон и маленькая тележка? Почему нет? Но Роскосмос, НАСА, как и Илон Маск, лично, не одобрят.