Санпросвет о плавающей точке, статья первая: компьютеры и числа / forpes.ru

Главная
Санпросвет о плавающей точке, статья первая: компьютеры и числа

Санпросвет о плавающей точке, статья первая: компьютеры и числа +60

18.09.2025 08:05

haqreu 0 4900 Источник

Недавно мне понадобилось сэмулировать работу с плавающей точкой только при помощи целочисленной арифметики, поскольку флоаты были недоступны. Полез я было в интернет за готовой библиотекой, и чуть не утонул. Мало того, что я не нашёл того, что искал, это бог с ним. Я обнаружил, что в интернете кто-то неправ. :)

Оказалось, что форумы кишат людьми, которые не до конца понимают, как компьютеры манипулируют числами. Например, мемасик с КПДВ я стянул с реддита (перечеркнул его я). Кто-то настолько был напуган страшными ошибками округления чисел с плавающей точкой, что даже смешную картинку смастерил. Только вот проблема в том, что 0.5 + 0.5 в точности равно 1.0.

Таким образом, я решил засучить рукава, и изобрести велосипед. То есть, написать самую неоптимизированную C++ библиотеку для эмуляции IEEE754 32-битных чисел с плавающей точкой при помощи исключительно 32-битной целочисленной арифметики. Библиотека уложится в несколько сотен строк кода, и в ней не будет никакого битхакинга. Задача написать понятный код, а не быстрый. А заодно хорошенько его документировать серией статей.

Итак, этим полукреслом мастер Гамбс начинает новую партию мебели, или статья первая: поговорим о числах и компьютерах.

Зачем изобретать велосипед

Год назад я поставил себе задачу написать за выходные простой, но вполне полноценный компилятор только что придуманного мной си-подобного языка. Написать-то дело несложное (соответствующая серия статей), а вот описать труднее. Для хорошего описания нужны красочные примеры. У меня аллергия на иллюстрации из разряда вычисления чисел Фибоначчи. Ну сколько же можно?! Поскольку мой язык крайне примитивен, то и примеры мне нужны простые, но всё же как можно более эффектные. Всякие рейтрейсинги и демосцена прекрасно подходят. Вот результат работы одного из примеров, написанных на моём языке:

Проблема с ним была в том, что для рейтрейсинга мне нужны были числа с плавающей точкой, а в моём языке никаких других типов, кроме булевских и 32-битных целочисленных просто нет.

В принципе, в интернете много библиотек, из которых можно было бы выдрать необходимые куски, например Berkeley Softfloat. Но проблема в том, что они все рассчитаны на скорость исполнения, и практически все выходят за рамки 32-битных вычислений, а у меня только 32-битные числа :(

Таким образом, я решил написать совсем маленькую С++ библиотеку, которая манипулирует исключительно int32_t, и при этом нацелена на читаемость кода, а не на скорость исполнения. Основная цель - санпросвет. Мне больно видеть, каким количеством мифов и суеверий оброс простейший float32.

Вот часть мифов, с которыми я борюсь:

«Все десятичные дроби неточно представляются в плавающей запятой»: как 0.5, так и 1.0 могут быть точно представлены в двоичном формате IEEE754. Таким образом, сумма равна точно 1.0.

Действительно, большинство десятичных дробей, таких как 0.1, не предствляются точно с плавающей точкой:

Но при этом:
«Никогда не следует сравнивать плавающие точки с помощью ==»: слишком строго. Как мы только что видели, сравнение чисел с плавающей запятой с помощью == в некоторых случаях вполне допустимо. Настоящее правило: избегайте ==, если значения прошли через сложные вычисления, в которых округление может отличаться.

Не полагайтесь на то, что алгебраические законы (ассоциативность, дистрибутивность) действуют точно. Как следствие, избегайте использования == для чисел с плавающей запятой, когда результаты получены в результате нетривиальных вычислений.

Но при этом:
«Плавающая запятая является случайной/ненадежной»: арифметика с плавающей запятой является детерминированной и следует строгим правилам IEEE754. Результаты могут быть неожиданными, но не произвольными.

Стандарт IEEE требует, что все реализации должны давать точные, бит-в-бит результаты для КАЖДОЙ операции, для которой результат может быть представлен, и ближайшее значение для остальных.

Итак, поехали.

Прежде всего, существует три наиболее распространенных семейства чисел, с которыми мы имеем дело: целые, рациональные и вещественные. Компьютеры могут прекрасно манипулировать целыми числами, с некоторым трудом — рациональными, а вещественными — только в мечтах. Большинство вещественных чисел даже невозможно вычислить с помощью какого-либо алгоритма, а те немногие, которые всё же можно вычислить, при хранении в конечной памяти сводятся к приближенным значениям. Давайте разбираться.

Целые числа: естественный язык компьютеров

Компьютеры — это цифровые машины. Внутри аппаратного обеспечения все хранится в двоичном формате: последовательности нулей и единиц, что делает целые числа наиболее естественным выбором.

32-разрядный регистр может содержать ровно $2^{32}$ различных комбинаций нулей и единиц; обычно их интерпретируют как целые числа от до $4\ 294\ 967\ 295$ (без знака) или от $-2\ 147\ 483\ 648$ до $2\ 147\ 483\ 647$ (со знаком). Арифметические операции над целыми числами (сложение, вычитание, умножение, деление) являются точными, если результат укладывается в выбранную разрядность. Поэтому компьютеры превосходны в работе с целыми числами: представление является точным, арифметика надежна, и все значения в диапазоне охвачены.

Рациональные числа: справимся при помощи двух целых

Рациональное число — это отношение двух целых чисел, например $\frac34$ или $-\frac{22}7$ . Компьютеры могут хранить их точно, сохраняя целые числитель и знаменатель. Например, в Python класс fractions.Fraction делает именно это. Арифметические операции выполняются правильно, но знаменатели могут становиться очень большими, что замедляет вычисления. Таким образом, представление рациональных чисел возможно, и при этом точно, но менее эффективно. Компьютеры могут с этим справляться, хотя аппаратное обеспечение для этого не оптимизировано.

Вещественные числа: невозможная мечта

Вещественные числа включают в себя все рациональные и иррациональные числа, такие как $\sqrt{2}$ и $\pi$ . Большинство вещественных чисел невозможно точно описать с помощью конечной последовательности цифр, но эта бесконечность не является самой большой проблемой. Проблема вещественных чисел заключается в их огромном количестве. Забудьте на минуту о компьютерах, давайте поговорим о математике на бумаге.

Вычислимые вещественные числа: крохотное подмножество

Скажем, что вещественное число вычислимо, если существует алгоритм, который при заданном выдает -ю цифру числа. Примеров множество: мы знаем формулы для вычисления цифр $\pi$ , $\sqrt 2$ , и многих других. Остановимся на слове алгоритм. В нашем контексте алгоритм — это текстовое описание (фактически, компьютерная программа), которое говорит нам, как вычислить -ю цифру некоторого числа. Множество текстов (компьютерных программ) счётно: существует только конечное число программ длиной 1 символ, конечное число программ длиной 2 символа и так далее.

Однако множество вещественных чисел $\mathbb R$ является несчётным (диагональный аргумент Кантора). Несчётные множества «больше» счётных, поэтому большинство вещественных чисел даже не может быть описано какой-либо программой — они невычислимы. Хотя существует бесконечное множество вычислимых вещественных чисел, они образуют счетное множество — каплю в океане по сравнению со всеми вещественными числами.

Ограничения по объему памяти: конечная точность

Даже в случае вычислимых чисел их прямое хранение представляет проблему. Вещественное число может иметь бесконечное количество цифр, но компьютер может хранить только конечное количество битов. Поэтому даже вычислимые числа не всегда могут быть представлены точно. Приближения неизбежны.

Подводя итог: большинство вещественных чисел невычислимы — не существует и никогда не будет существовать никакого алгоритма, способного их вычислить. Из вычислимых вещественных чисел компьютеры могут хранить только приближения с конечной точностью. Это означает, что «континуум» вещественных чисел навсегда недостижим для конечных цифровых машин.

На практике численные вычисления построены на иллюзии вещественных чисел: мы делаем вид, что работаем с ними (решаем уравнения, интегрируем, моделируем физику), но все основано на конечной решетке приближений с плавающей запятой. Успех научных вычислений основан на том, что эта иллюзия часто «достаточно хороша» — относительные погрешности остаются небольшими, а алгоритмы стабильны.

Приближения и погрешности

Итак, мы хотим манипулировать вещественными числами на компьютере, но имеем только конечное количество битовых комбинаций. Предположим, что мы хотим представить числа от 0 до 16, и у нас есть 7 битов. Это дает нам бюджет в различных чисел.

Числа с фиксированной запятой

Если — это значение без знака целого числа с 7-битной комбинацией, то варьируется от 0 до 127. Мы можем интерпретировать это как дробное число . Построим график всех 128 таких чисел:

Эти числа равномерно распределены по всему диапазону. Их называют числами с фиксированной запятой, потому что «двоичная запятая» (знаменатель) остается в одном и том же положении для всех значений.

Например, возьмем . Битовый шаблон для — 1111101 (поскольку $125_{10} = 1111101_2$ ). Деление на 8 сдвигает двоичную запятую на три места влево: $\tfrac{125}{8}_{10} = 1111.101_2$ . Двоичная запятая фиксирована для всех чисел, отсюда и название.

Ошибки аппроксимации

Числа с фиксированной запятой обеспечивают наилучшую возможную абсолютную погрешность аппроксимации. Если вещественное число равно , а компьютер хранит $\tilde x$ , то

$\text{абсолютная погрешность} := |x - \tilde{x}|.$

Допустим, мы хотим представить число с помощью наших 7-разрядных чисел с фиксированной запятой. Ближайшим числом, которое у нас есть, является $\frac{10}{8} = 0.125$ . Следовательно, мы допустили ошибку 0.025.

Часто важно, насколько велика ошибка по сравнению с размером числа. Определим понятие относительной ошибки:

$\text{относительная ошибка} := \frac{|x - \tilde{x}|}{|x|}.$

Проиллюстрируем разницу между ними:

Если и $\tilde x = 1000.1$ , то абсолютная погрешность = 0.1, но относительная погрешность = 0,1 / 1000 = 0,0001 (очень мала, хорошо).
Если и $\tilde{x}=0.0101$ , то абсолютная погрешность очень мала (0.0001), но относительная погрешность = 0.0001 / 0.01 = 0.01. Это погрешность в 1%, что не очень хорошо.

При представлении вещественных чисел на компьютере возникают две естественные задачи:

Охватить огромный динамический диапазон: от крошечных чисел, таких как $10^{-30}$ , до огромных чисел, таких как $10^{30}$ .
Обеспечить приемлемую точность во всех случаях: числа должны быть относительно близки к истинным вещественным числам.

Если мы используем фиксированную запятую, числа располагаются равномерно. Это отлично для точности, но плохо для диапазона: вы не можете представить и $10^{-30}$ , и $10^{30}$ , если не используете тысячи битов.

Решением является использование логарифмического распределения представляемых чисел:

Здесь числа равномерно распределены по логарифмической шкале:

Это означает, что между 0,1 и 1 столько же чисел, сколько между 1 и 10. Таким образом, мы достигаем равномерной относительной точности, а не равномерной абсолютной точности. Это соответствует реальным потребностям, где значимые цифры имеют большее значение, чем абсолютное расстояние между ними.

Чем больше доступных битов, тем больший диапазон мы можем охватить. Например, числа IEEE с одинарной точностью могут достигать примерно $10^{38}$ .

Если мы снова возьмем $m \in [0,127]$ , то можем определить числа как $2^{-4 + m/16}$ в диапазоне , как показано на «идеальных» графиках выше.

Спойлер

Внимательные читатели могут заметить, что эти числа не начинаются с нуля — мы рассмотрим эту деталь позже.

Это распределение было бы идеальным, если бы нашей единственной целью было приближение действительных чисел с равномерной относительной погрешностью. К сожалению, оно создает проблемы.

Например, предположим, что мы хотим сложить два таких числа. Имея и , представляющие $2^{-4 + a/16}$ и $2^{-4 + b/16}$ , нам нужно решить уравнение для :

$2^{-4 + a/16} + 2^{-4 + b/16} = 2^{-4 + c/16}.$

Это сложное уравнение, особенно из-за дробных показателей. Даже простое сложение двух чисел убивает всю эффективность вычислений.

Кроме того, чистое логарифмическое кодирование не может точно представлять целые числа, за исключением степеней двойки. Форматы с плавающей запятой исправляют эту ситуацию: они точно сохраняют все целые числа до определенного размера (например, все целые числа до $2^{24}$ помещаются в float32). Это свойство имеет важное значение во многих алгоритмах (индексирование массивов, счетчики циклов, геометрия).

Интересный факт

Существуют «логарифмические системы счисления», которые используются в таких нишевых областях, как DSP (цифровая обработка сигналов) и ускорители глубокого обучения. Они отлично подходят для умножения/деления (превращаются в сложение/вычитание), но плохо подходят для сложения. Аппаратные конструкции обычно сочетают в себе оба подхода.

Числа с плавающей запятой

Идея плавающей запятой заключается в имитации логарифмического распределения при сохранении эффективности арифметических вычислений. Хороший способ понять числа с плавающей запятой — сконструировать их самим шаг за шагом.

В нашем примере у нас есть бюджет из 7 бит для представления числа. Мы будем использовать их для хранения двух целых чисел: (экспонента) и (мантисса). Мы сами решаем, сколько бит зарезервировать для , поэтому давайте предположим, что мы используем бит для экспоненты и бит для мантиссы.

Если мы интерпретируем битов как целое число со знаком, то в соответствии с наиболее распространенной интерпретацией, $e \in [-2^{n_e-1} \dots 2^{n_e-1}-1]$ . Если , то может принимать значений от -4 до 3. Построим график всех 8 значений и дополнительно еще одного значения $2^{2^{n_e-1}}$ (пунктирная линия):

Вот небольшой кусочек кода на питоне, при помощи которого я отрисовал этот график:

n_e = 3
anchors = []
for e in range(-2**(n_e-1), 2**(n_e-1)+1):
    anchors.append(2**e)

Эти опорные точки делят диапазон на интервалы. При значение может принимать значений. Внутри каждого интервала мы равномерно распределяем 16 чисел. Таким образом, мы получаем $8 \times 16 = 128$ чисел, которые точно помещаются в 7 битах.

Вот небольшой фрагмент кода на Python, который генерирует все 128 чисел:

n_m = 7 - n_e
numbers = []
for i in range(len(anchors)-1): # for each interval
    for m in range(2**n_m):     # populate it with 2**n_m numbers
        v = anchors[i] + m/2**n_m * (anchors[i+1]-anchors[i])
        numbers.append(v)

А вот соответствующий график чисел:

Каждый интервал представляет собой линейную интерполяцию между двумя опорными точками. Внутри каждого интервала двоичная запятая фиксирована, но она смещается между интервалами — отсюда и название плавающая запятая.

Остается одна проблема: самая первая опорная точка это $2^{-2^{n_e-1}}$ , поэтому нуль отсутствует. Обычно эту проблему решают хаком: переопределяют первую опорную точку как ноль.

anchors = [ 0 ]
for e in range(-2**(n_e-1)+1, 2**(n_e-1)+1):
    anchors.append(2**e)

Первый интервал теперь является особым — его значения называются денормализованными (этот термин мы рассмотрим позже).

Вот наши 128 чисел с плавающей запятой:

Поскольку опорные точки являются степенями двойки, целые числа могут быть представлены точно. Что касается арифметической эффективности, то это и есть основная тема данного учебника: как манипулировать числами с плавающей запятой, используя только целочисленные операции.

В следующий раз мы поговорим о выводе на экран десятичного значения числа с плавающей запятой. Как ни удивительно, эта проблема далеко не тривиальна. На самом деле, это одна из самых сложных частей поддержки чисел с плавающей запятой в рантайме любого языка.

Оставайтесь на связи!

Комментарии (0)

vadimr
18.09.2025 08:29
#28851008
- «Плавающая запятая является случайной/ненадежной»: арифметика с плавающей запятой является детерминированной и следует строгим правилам IEEE754. Результаты могут быть неожиданными, но не произвольными.
  
  Стандарт IEEE требует, что все реализации должны давать точные, бит-в-бит результаты для КАЖДОЙ операции, для которой результат может быть представлен, и ближайшее значение для остальных.
В теории да, но в практических реализациях это не всегда так.
1. haqreu Автор
  18.09.2025 08:29
  #28851072
  Ну если вы включили флаг --ffast-math, или каким-либо другим образом ушли от стандарта, то да. Я же говорю про стандарт, которому следует по умолчанию большинство как софта, так и железа.
  1. vadimr
    18.09.2025 08:29
    #28851242
    Вот это:
    
    арифметика с плавающей запятой является детерминированной и следует строгим правилам IEEE754
    
    – неверно.
    
    Даже если не касаться того, что есть процессоры, реализующие плавающую арифметику не в соответствии с IEEE754 (например IBM z), но и все остальные следуют IEEE754 только при определённых условиях, и то не факт, поскольку никто не проверял все возможные значения. Поэтому, на мой взгляд, вы тут очень упрощаете реальную ситуацию. Я считал бы предположение о том, что любая конкретная программа на конкретном процессоре работает в точном соответствии с IEEE754 и имеет побитово предсказуемый результат, излишне оптимистичным.
    
    Более того, приходилось сталкиваться с этой проблемой в продакшене.
    
    haqreu Автор
    18.09.2025 08:29
    #28851278
    Ну проверять все возможные значения ни к чему, достаточно корректно реализовать алгоритмы вычислений. Да, есть некоторое количество железа, которое отходит от ieee754. И более того, существуют вообще другие системы плавающей точки (например, позиты), но это не вносит в жизнь ни недетерминированности, ни магии.
    
    vadimr
    18.09.2025 08:29
    #28851330
    Магии никакой нет, но недерминированность есть в том смысле, что программист не знает, запустит ли пользователь, например, его программу на процессоре Intel или AMD, а реализация плавающей арифметики на них различается.
    
    достаточно корректно реализовать алгоритмы вычислений
    
    А что такое, по-вашему, корректная реализация? Никто в процессоре бесконечные ряды Тейлора не суммирует, там в любом случае используются аппроксимации, причём иногда весьма неочевидные.
    
    haqreu Автор
    18.09.2025 08:29
    #28851352
    Ну вообще даже стандарт, насколько я помню, от всяких тригонометрических функций не требует ничего очень строгого. Побитовое воспроизведение должно быть для четырёх арифметических операций, так что про суммирование рядов Тейлора речи не идёт.
    
    Из моего опыта, основной источник недетерминированности результата - это непостоянство порядка вычислений (например, при многопоточных вычислениях).
    
    Я же напрямую в статье сказал, что не нужно надеяться на побитовое сравнение, если были нетривиальные вычисления.
    
    vadimr
    18.09.2025 08:29
    #28851402
    Насколько я помню, даже одна отдельно взятая машинная команда вычисления квадратного корня даёт разные результаты в младшем бите на разных процессорах.
    
    haqreu Автор
    18.09.2025 08:29
    #28851410
    Квадратный корень не является одной из четырёх арифметических операций...
    
    vadimr
    18.09.2025 08:29
    #28851428
    От этого, типа, должно быть легче?
    
    haqreu Автор
    18.09.2025 08:29
    #28851514
    Видимо, кому как. Мне - да. Я часто и много работаю с точными вычислениями на числах, представленных в плавающей точке. Работает как на интеле, так и на амд. А также на большинстве современных графических ускорителях и т.п.
    
    Приведу пример крайне широко используемого кода/статьи от Джонатана Шевчука:
    
    https://www.cs.cmu.edu/~quake/robust.html
    
    haqreu Автор
    18.09.2025 08:29
    #28851394
    Кстати, можете привести пример в несколько строк C++, который даст разные результаты на intel/amd?
    
    vadimr
    18.09.2025 08:29
    #28851500
    У меня под рукой нет, но я пару раз приводил уже это на хабре в комментариях, можно поискать здесь или в интернете, если интересно.
    
    vadimr
    18.09.2025 08:29
    #28852142
    Нашёл всё-таки:
    
    #include <stdio.h> #include <string.h> int main(void) { float in = 256; float out; unsigned int raw; asm ("rsqrtss %1,%0" : "=x"(out) : "x"(in)); memcpy(&raw, &out, 4); printf("out = %x, float = %f\n", raw, out); return 0; }
    
    Intel можно посмотреть, например, здесь: https://onecompiler.com/cpp/43x3t4pmn
    
    out = 3d7ff000, float = 0.062485
    
    AMD можно посмотреть, например, здесь: https://www.codingshuttle.com/compilers/cpp/
    
    out = 3d7ff800, float = 0.062492
    
    haqreu Автор
    18.09.2025 08:29
    #28852258
    Во-первых, разговор шёл об арифметических операциях, которыми квадратный корень не является. А во-вторых, операция rsqrtss, серьёзно?
    
    Computes an approximate reciprocal of the square root
    
    [cut]
    
    The relative error for this approximation is:
    
    |Relative Error| ≤ 1.5 ∗ $2^{−12}$
    
    vadimr
    18.09.2025 08:29
    #28852268
    Во-первых, разговор шёл об арифметических операциях, которыми квадратный корень не является
    
    Когда это он шёл?
    
    У вас написано:
    
    арифметика с плавающей запятой является детерминированной и следует строгим правилам IEEE754
    
    Если вы под "арифметикой с плавающей запятой" подразумеваете только собственно арифметические операции, то это надо бы как-то специально оговорить, потому что обычно этот термин включает все операции процессора над числами с плавающей запятой. Да и примеры в вашей статье ими не ограничиваются, включая возведение в степень.
    
    haqreu Автор
    18.09.2025 08:29
    #28852298
    И вы тут же цитируете фразу со словом арифметика :)
    
    Конечно, корень можно притянуть за уши к арифметическим операциям, но это надо постараться.
    
    vadimr
    18.09.2025 08:29
    #28852308
    Слово "арифметика" в инженерном смысле не означает именно арифметические операции в математике.
    
    haqreu Автор
    18.09.2025 08:29
    #28852362
    Да бог с ней, с арифметикой. Ваш пример, к сожалению, не подходит, поскольку функция rsqrtss не обязана давать точный ответ.
    
    Ещё раз, я не говорю, что не существует железа, которое не соответствует стандарту ieee754, равно как и флаг --ffast-math в GCC никто не убирал (но подозреваю, что вы не найдёте нормального примера, который даст разницу на intel/amd).
    
    Я говорю про то, что в подавляющем большинстве случаев проблемы не в этом, а в неполном понимании того, как компьютеры манипулируют числами.
    
    vadimr
    18.09.2025 08:29
    #28852412
    Ваш пример, к сожалению, не подходит, поскольку функция rsqrtss не обязана давать точный ответ.
    
    Тем не менее, он отвечает на ваш вопрос о программе, которая даёт разные результаты на intel/amd.
    
    но подозреваю, что вы не найдёте нормального примера, который даст разницу на intel/amd
    
    Пример я вам, действительно, сейчас не в состоянии привести, но практически такую программу, написанную на обычном языке высокого уровня, встречал. Это была не моя программа и я не знаю, докопались ли там до конкретной машинной инструкции. В том случае проще было запретить запуск на AMD.
    
    Однако, как вы верно заметили, флаг --ffast-math никто не убирал.
    
    Я говорю про то, что в подавляющем большинстве случаев проблемы не в этом, а в неполном понимании того, как компьютеры манипулируют числами.
    
    Про подавляющее большинство случаев я с вами никоим образом не спорю. Я возразил только против излишней категоричности вашего утверждения.
    
    haqreu Автор
    18.09.2025 08:29
    #28852440
    Тем не менее, он отвечает на ваш вопрос о программе, которая даёт разные результаты на intel/amd.
    
    Есть другая функция, которая по дизайну тоже не обязана давать одинаковые значения, rand() называется.
    
    findoff
    18.09.2025 08:29
    #28852262
    Ну те алгоритм приближенного вычисления обратного квадратного корня дает разные результаты на разных процах, и тут конечно же виновата плавающая точка...
1. vened
  18.09.2025 08:29
  #28851482
  В теории да, но в практических реализациях это не всегда так.
  
  Из опыта, основная проблема в том, что разработчики делают неверное обобщение и полагают, что можно обычным способом сравнивать значения переменных, имеющих тип float. То есть, дело не в сравнении конкретной записи – это сравнение определено как побитовое, и в стандарте оно строгое, детерминированное. Формально, два строгих float сравниваются точно. Но это не обобщается. Дело в том, что float – это не число, а некоторый алгоритм. Поэтому, концептуально, нужно сравнение понимать так, как если бы сравнивались алгоритмы.
  
  Собственно, в статье примерно про это и написано:
  
  Настоящее правило: избегайте ==, если значения прошли через сложные вычисления, в которых округление может отличаться.
  Не полагайтесь на то, что алгебраические законы (ассоциативность, дистрибутивность) действуют точно.
  
  Я бы только подчеркнул, что ни ассоциативность, ни дистрибутивность – не могут действовать "не точно", по определению. Поэтому-то и не нужно полагать, что эти свойства есть во float. Дистрибутивность, скажем, там не работает в совсем простых случаях – вот я недавно приводил пример: https://dxdt.ru/2025/08/31/16204/
  1. lgorSL
    18.09.2025 08:29
    #28854360
    Да и с неработающей ассоциативностью несложно привести пример
    1е20 + (-1е20) + 1.
    
    haqreu Автор
    18.09.2025 08:29
    #28854372
    Я ещё люблю накопление ошибок вычислений показывать таким примером. Сравните вывод двух программ:
    
    from fractions import Fraction x = Fraction('1/10') for _ in range(80): print(x) if x>1/2: x = 2*x-1 else: x = 2*x
    
    x = 1/10 for _ in range(80): print(x) if x>1/2: x = 2*x-1 else: x = 2*x
    
    haqreu Автор
    18.09.2025 08:29
    #28854378
    Кстати, с ассоциативностью у меня в статье есть пример куда проще вашего (в том смысле, что никаких огромных чисел не требует).

forever_live
18.09.2025 08:29
#28854478
Между прочим, большинство целых чисел тоже невозможно невозможно записать в вашем компьютере, даже если вы разрешите использовать int64.
1. KvanTTT
  18.09.2025 08:29
  #28854494
  А некоторые операции с вещественными числами можно выполнять точно, если использовать символьные вычисления. Правда это как правило непрактично.
  1. forever_live
    18.09.2025 08:29
    #28854514
    Ну про некоторые операции с вещественными числами и в статье есть. Которые могут выполняться даже без символьных вычислений.
    
    Я так когда-то подобрал два коэффициента масштабирования, 0.8 и 1.25, для плавного масштабирования графиков.
1. haqreu Автор
  18.09.2025 08:29
  #28854824
  Самое главное, что все целые числа вычислимы. Не обязательно хранить все цифры числа в памяти одновременно, для того, чтобы с ним манипулировать.
  1. forever_live
    18.09.2025 08:29
    #28861716
    Но где-то их хранить всё равно придётся. В какой-то памяти, не обязательно оперативной.
    
    haqreu Автор
    18.09.2025 08:29
    #28861748
    Смотря для чего оно вам нужно. Если просто посмотреть, то выдавать на экран цифру за цифрой. Если для других вычислений, то наверняка можно их сделать для потока цифр, а не для полного набора.

Jessy1821
18.09.2025 08:29
#28857242
Наконец-то нашёл людей кто пишет всё с нуля без ненужных библеотек и делают их сами. Я сам пишу сейчас нейронку-компаньёна на Python, но библеотеки не использую вплоть до лингвистического анализатора и автаматического генератора ответов хотя я новичок в этой сфере))

sci_nov
18.09.2025 08:29
#28858566
А почему вы выбрали знаковый int?
1. haqreu Автор
  18.09.2025 08:29
  #28858574
  Не очень понял, для чего?
  1. sci_nov
    18.09.2025 08:29
    #28858580
    Для моделирования float.
    
    haqreu Автор
    18.09.2025 08:29
    #28858592
    По-прежнему не очень понимаю. Я не упаковываю всё в четыре байта, у меня есть раздельная структура с полями знака, экспонента и мантиссы:
    
    https://github.com/ssloy/tinyfloat/blob/main/tinyfloat.h
    
    sci_nov
    18.09.2025 08:29
    #28858602
    А, в коде всё нормально, а в статье идёт упоминание об int32_t.
    
    haqreu Автор
    18.09.2025 08:29
    #28858618
    А, понял. В моём игрушечном языке только знаковые 32-битные числа, поэтому я извращался, когда рейтрейсер писал. И флоат приходится в int упаковывать, и константы писать, которые влезают в него... Видимо, поэтому я и упомянул про int32_t
    
    int fp32_flip_sign(int fp) { if (fp >= 0) { return (fp - 1073741824) - 1073741824; } else { return (fp + 1073741824) + 1073741824; } }
    
    sci_nov
    18.09.2025 08:29
    #28858630
    Ну, если нет битовой магии, то int можно использовать. Фактически, как индекс.

sci_nov
18.09.2025 08:29
#28858622
Используя float, можно напечатать точное значения любой целой степени двойки насколько позволяет ёмкость выбранного float.
1. haqreu Автор
  18.09.2025 08:29
  #28858634
  А как это поможет? Кроме того, используя корректно реализованный флоат, что не совсем тривиальная задача. А у меня вывод на экран идёт ещё до реализации сложения. И нужен, в частности, для отладки реализации.
  1. sci_nov
    18.09.2025 08:29
    #28858644
    Да это просто интересный факт.

forever_live
18.09.2025 08:29
#28861768
Кстати, ещё замечание. 10^30 -- довольно небольшое число. Не самый удачный пример.

Это отлично для точности, но плохо для диапазона: вы не можете представить и $10^{-30}$ , и $10^{30}$ , если не используете тысячи битов.

Динамический диапазон 10^60 -- это примерно 2^200. Нужно не больше 200 бит. Если взять 1000 бит, то динамический диапазон вырастет ещё в пять раз.
1. haqreu Автор
  18.09.2025 08:29
  #28861788
  Ай, не цепляйтесь к словам. Даже для обычного float вам нужно 277 бит, чтобы вместить все значения. А для double и вовсе 2098 бит...

Санпросвет о плавающей точке, статья первая: компьютеры и числа +60

Зачем изобретать велосипед

Целые числа: естественный язык компьютеров

Рациональные числа: справимся при помощи двух целых

Вещественные числа: невозможная мечта

Вычислимые вещественные числа: крохотное подмножество

Ограничения по объему памяти: конечная точность

Приближения и погрешности

Числа с фиксированной запятой

Ошибки аппроксимации

Числа с плавающей запятой

Комментарии (0)

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор

haqreu Автор